いよいよ、機械学習はPoC(Proof of Concept:概念実証)の段階から、システムへの組み込みを本格的に考える段階へと入りつつあります。それに伴い、コーディングの専門知識が不要な、「プログラミングなし」で機械学習を実現できる製品・サービスが登場しています。

本連載では、これらの製品・サービスについて解説することで、読者の方々をデータ・サイエンティストのファーストステップへとご案内します。

プログラミングレスの機械学習が登場した背景

改めて整理しますが、機械学習とは、あるデータ群をもとに学習を行い、機械が何らかのパターンを見つけ出す方法です。この機械学習の1つの手法がDeep Learningです。近年では、scikit-learnやTensorFlowなどのミドルウェアを利用することで、Pythonなどで書いたプログラムで簡単に機械学習を実装できるようになっています。

このように機械学習が実用段階に進むに従って、機械学習を活用する層は大きく広がっていくことが予想されます。しかし、Pythonなどのプログラミング言語を利用したコーディングを前提にしてしまうと、機械学習の広がりが限定されてしまう恐れがあります。

そこで、プログラミングなしで簡単に機械学習を取り扱える製品やサービスの重要性が増し、多くの製品やサービスがリリースされています。これらのツールを利用することで、簡単に機械学習を取り扱うことが可能です。

本連載で紹介する代表的なツール

プログラミングを必要としない機械学習のサービスやツールの特徴はさまざまで、データを入れればすべて自動で処理するものから、ある程度GUIでコントロール可能なものまであります。これらのサービスやツールは、Microsoft、Amazon、Googleの海外企業や、ABEJA、MatrixFlowなどの国内企業も含め、複数の企業からリリースされています。

今回の連載では、比較的取り扱いやすい代表的な製品として、「RapidMiner」「Elastic Machine Learning」「Splunk MLTK」「H2O Driverless AI」の4つを取り上げます。

RapidMinerとH2O Driverless AIは、機械学習専用のツールです。一方で、Elastic Machine LearningとSplunk MLTKは、データの保存・可視化の機能に、機械学習の機能が追加されているツールです。

なお、これらの4つのツールは、基本的に数値データやテキストデータを処理するもので、画像や動画のデータ処理は対象に入っていません。

(1)RapidMiner

RapidMinerは、GUI上でブロックをつなげることで、簡単に「データの前処理」や「可視化」とともに機械学習が行えるツールです。近年では、Auto Model機能を使って、簡単にモデル生成もできるようになりました。

(2)Elastic Machine Learning

Elastic StackはElastic社が開発するオープンソースのツール群で、データの検索を行う「Elasticsearch」とデータを可視化する「Kibana」で構成されています。そして、Elasticsearchに保存したデータに機械学習機能を提供する有償のツールとして、Elastic Machine Learningが提供されています。Elastic Machine Learningの実装コードはGitHub上に公開されており、どのような動きをしているかを確認できるようになっています。

(3)Splunk MLTK

Splunkは、「ログデータの保存」と「可視化」を行うツールです。ここに、MLTK(Machine Learning Toolkit)という機械学習プラグインを利用することで、Splunk上に保存したログデータに対して機械学習が可能です。

(4)H2O Driverless AI

H2O Driverless AIは、csv形式のデータを入れることで、「データの前処理」「学習」「モデルの可視化」を通じて、機械学習における「分類」と「回帰」を自動的に処理してくれます。さらに、「レシピ」という名前のプラグインを追加することで、自然言語処理や時系列のデータ処理も行えるようになっています。

これらのツールを利用することで、機械学習を「実行」する部分の知識は不要になりました。しかし、入力するデータの処理や、結果の理解・判断には、まだまだ統計や機械学習等の専門的な知識が必要です。

本連載では機械学習のツールにフォーカスしますが、国際学会などでは新たな発見の発表が活発です。本連載を通じて、より深くAI・機械学習の分野に取り組みたいと思われた読者の方々は、こうした新たな情報を得ることで、より深くこれらのツールを活用できるようになるでしょう。

次回以降は、これらのツールを個別に取り上げて詳細に解説していきます。次回は「Rapid Miner」です。

著者プロフィール

荒牧 大樹


ネットワンシステムズ株式会社
ビジネス開発本部 第1応用技術部 シニアエキスパート

2009年にネットワンシステムズ入社。ビデオ会議・IP電話等などのCollaboration事業や、OpenStackなどのプラットフォーム事業を担当。2017年からは、データ分析・機械学習に関連するコンサルティング・製品販売・教育に従事。