Googleは11月14日、「現場で使える機械学習」をテーマとした勉強会を開催した。今回は第2回目としてグルーヴノーツ 代表取締役社長の最首英裕氏が登壇し、パソコンの画面上でブロックを組み合わせていけば誰でも機械学習を活用することのできる「MAGELLAN BLOCKS」の概要や導入事例を紹介。デモを交えながら、"マウスでできる"機械学習の実践方法を教えてくれた。
「MAGELLAN BLOCKS」は、ドラッグ&ドロップによってパソコンの画面上にさまざまなブロックを配置することで、需要予測や異常検知、画像解析などの機械学習を活用することができるサービス。プログラミングやコーディングといったフローがないため、専門的な知識がなくても機械学習を利用できる。
幅広い利用シーンに取り入れることができ、例えば、電力会社の保有する過去の発電量データと、最高気温や最低気温、日照時間、曜日といった天候データを読み込ませれば、それぞれ相関性を学習し、新しい天候データからでも当日の発電量を予測してくれるようになる。同様に、商品の販売数やイベントの来場者数、コールセンターの問い合わせ数といった予測を行うことが可能だ。
勉強会では、代表的なモデルとして「強化学習」「文書検索」「数値回帰」「数値分類」「画像分類」などについて解説してくれた。強化学習は最適座席配置やロボット制御などで利用されるモデル。基本的には数値や画像など、学習するための教師データが必要だが、強化学習ではコンピューターが試行錯誤しながら学習を行っていくモデルのため、教師データは必要ない。また、文書検索はニューラルネットワークを使っていないモデルで、文章を読み込ませると全体の特徴をつかみ、近い文章を見つけてくるという処理を行うモデルだ。
数値回帰は、教師データの特徴から数値を予測するというモデルで、需要予測や売上予測、来場者予測などの際に用いられる。このモデルを使う場合は、「結果に対して重要な影響力を持っているデータを、いかに見せていくかが大事。「顧客企業の中に答えがあると思っています」と最首氏は語る。
数値分類はデータの特徴から種類を予測するモデル。「契約率の高い人に限定して金融商品を案内するDMを送付するという事例では、9割以上の確率で送付前に契約する人がわかるようになりました。それだけでは郵便代の節約にしかなりませんが、効果の高い因子からプロモーション方法を検討するというところに発展しています」と、最首氏。そのほか、機器の異常検知や不正利用検知、流通小売業の需要予測などでも使われるという。
画像分類は、画像の特徴を把握するモデル。同サービスではすでに大量の画像を学習させた状態で提供されているので、ユーザーは教師データとなる画像を指定するだけで特徴を判断することができるという。
最首氏は「花の状態からランクを見極めるといった使われ方もされています。花屋で売られている花には、花の大きさや形などによってAランク、Cランクなど状態に応じたランク付けがされているのですが、その判断は素人には困難でしょう。しかし、一度専門家によって選ばれた教師データの花画像を学習させておけば、専門的な知識のない人でもランクの高い花を選んで仕入れることが可能になります」と意外な事例を紹介してくれた。
そのほか、ブロックの組み合わせ次第で、スマートスピーカー「Google Home」やヒト型ロボット「Pepper」を介して「Google Cloud Speech API」と接続した自然言語処理による会話形式の問い合わせシステムや、動画から音声を認識して話している内容をテキストで表示させる機能、そしてそのテキストをさらに翻訳させるなど、幅広い使い方が可能だ。
誰でも簡単にマウスを使って機械学習モデルを構築できる「MAGELLAN BLOCKS」だが、大事なことは「いかに"適切な教師データ"を用意するかである」と最首氏は語る。
「店舗の来店客を予測する際に、前日のデータと比較させてもあまり意味がありません。天候データなどを変数に設定すると、意外と日照時間が重要だったというケースもあります。花のランクを判断する利用例では、Aランクの花が写っている画像データがなければ、学習することすらできませんからね。ただ、教師データとなる変数の設定方法がわからないという人は少なくありません。今後はさらにMAGELLAN BLOCKSを使いやすいようにするために、教師データのレシピ化なども検討中です」
専門知識がなくても、ドラッグ&ドロップで簡単に機械学習を活用できる「MAGELLAN BLOCKS」。今でも驚くほど簡単に使えそうなサービスだが、さらなる利便性向上を目指しているという。機械学習の活用がビジネスで当たり前となる日は近い。