同氏は、AIがまず利用されるのは、ビッグデータに向けた統計の部分だとして、「Azure Machine Learning Studio」を紹介。これは、データを活用した予測分析ソリューションの構築、テスト、デプロイをソフトをインストールすることなく、Webブラウザで接続するだけで利用できる開発環境。

70種類以上の標準的な統計関数数学を装備し、その関数をドロップし、入力ソースを定義するだけで設定でき、アウトソースを次の関数に引き渡すこともできるという。特徴は、ノンプログラミングで作成できる点で、完成品をWebサービスとして提供でき、他のシステムからAPI経由で呼び出すこともできるという。さらに、テンプレートも用意され、それをベースにカスタマイズして構築することも可能だという。

Azure Machine Learning Studio

「データサイエンティストの中にはプログラムができない人もおり、そいいう人にとっては、使い易いツールになる。また、自身がすでに作成したアルゴリズムをRやPythonで書き直すことで、拡張関数として組み込み、再利用できる。使い易く、拡張性のある環境だ」(榊原氏)

同氏が次に紹介したのは会話するAIで、女子高校生の人格をもったチャットボット「りんな」だ。「りんな」は一昨年提供を開始し、LINEとTwitterで利用できる。すでに570万人がフォローしているという。この技術は、ローソンが「ローソンクルー あきこちゃん」という公式キャラクターにも利用している。

女子高校生の人格をもったチャットボット「りんな」

「ローソンクルー あきこちゃん」

また、マイクロソフトは、男性キャラの「りんお」も、今年の3月、期間限定で公開している。

さらに同氏は、「りんな」の新たな展開として、「りんなライブ」を開始したことを発表。これまで、「りんな」は1:1でトークしていたが、「りんなライブ」は1:多で会話でき、合成音声でしゃべるのが特徴。感情に応じて返答が変わるというパラメータを持っており、今後は歌を歌うなどの機能を追加していくという。「りんなライブ」は、100以上同時接続が可能で、Azure Web App service+ASP.NETのテクノロジーを利用しているという。

「りんなライブ」

「AIは生産性向上に注力しているが、感情によりそうことも必要だ」(榊原氏)

感情を持つAIという点では、SBIリクイディティ・マーケットおよびSBI FX トレードがマイクロソフトと連携し、深層学習を搭載したチャットボットサービスを導入、顧客からのFX取引や為替に関する定型的な質問(FAQ)などに対しての自動回答サービスを提供している。問い合わせ履歴などをAIに学習させることで、将来は個別の口座や取引状況を把握し、顧客の心理までを理解して対応できる品質まで精度を高めていくという。

SBI FX トレードが4月から提供するチャットボットサービス「AIチャット」

音声認識では、デジタル エージェント「Coltana」をOEM提供している製品を紹介。音声認識の組み込んだスピーカーとして、Harman Internationalのスマートスピーカー「Harman Kardon Invoke」を紹介。また、HPも「Cortana」搭載のスピーカーを出すという。

さらに、先月にはマイクロソフトはAmazonとの提携も発表。今年後半に提供される機能により、Windows 10 PC上のCortana経由でAlexaにアクセスできるようになるという。

Amazonとの提携

これについて榊原氏は、「CortanaはBtoBの領域でスケジュール確認や会議室予約などに使われているが、BtoCに強いAmazonさんとの提携で相互の補完関係になり、いい提携になった」と述べた。

また、同氏は同社のAIの特徴を、「音声認識や画像認識、顔認識、言語理解、翻訳などのAIはAPIとして提供しており、現在29種類ある。APIはAmazon、IBM、Googleもやっているが、われわれの強みはカスタマイズができる点だ」と語った。

Cognitive Serices

そして、音声認識では、米国のマクドナルドのドライブスルーの注文に利用されている例を紹介。これは顧客からの声での注文をまずテキストに変換し、それを注文伝票に反映させていくもので、それが会計に回され、レジ打ちの必要もないという。北米の店舗でPoCを行い、今後、展開を図っていく予定だという。

マクドナルドのドライブスルーの例。顧客の音声をテキストに変換し(左側)、それを注文伝票に起こしていく(右側)

顔認識では今年の4月、博報堂、博報堂アイ・スタジオ、日本マイクロソフトの3者が、顔の特徴や感情に合わせて商品やサービスの広告を出し分けるアウトドア・メディア及びターゲティング広告配信システムである「Face Targeting AD (フェイスターゲティング・アド)」を連携して開発したことを発表している。

また、エイベックスはAIで会場内に設置したカメラで来場者の顔を検知し、ライブの盛り上がりや演奏されている楽曲と、「怒り」、「軽蔑」、「嫌悪感」、「恐怖」、「喜び」、「中立」、「悲しみ」、「驚き」の感情との関連性を分析、数値化する実証実験を行うことを発表している。

そのほか、翻訳機能をPowerPointに利用する例を紹介。日本語で書かれたPowerPointのスライドを一瞬でアラビア語やタイ語に変換する例を紹介。現在、テキストの翻訳は60カ国に対応しているという。

日本語で書かれたPowerPointのスライドを一瞬でアラビア語に変換するデモを実演

また、最後にSNSでスペイン語と英語で音声入力したものを日本語でアップしていく様子を紹介。音声認識の翻訳は現在10カ国に対応しているという。

スペイン語と英語で音声入力したものを日本語でアップしていく様子を実演した