MicrosoftのHsiao-Wuen Hon氏

マイクロソフトの研究機関Microsoft Reserch Asia所長であり、同社副社長でもあるDr. Hsiao-Wuen Hon氏が来日、MicrosoftにおけるAI分野での研究・開発の取り組みについて説明した。

同氏の説明によれば、マイクロソフトはAI領域に関するさまざまな研究開発を継続しているが、それを集約するものとしてChatbotをあげる。中国では「XiaoIce」、日本では「りんな」と呼ばれるボットが公開されている。「りんな」については、マイクロソフトの女子高生AIとしてLINEアカウントを取得しているので、友だちになっている方もいるかもしれない。

「りんな」や「XiaoIce」は、マイクロソフトのあらゆる研究開発成果を集約するものとして日々成長を続けている。現在では、画像も会話のバリエーションに加わっている。AI的な存在としては、SiriやGoogle Nowが知られているが、これらはタスクをこなす効率志向のボットだ。でも「りんな」は違う。まずは、ソーシャルなフレンドを目指し、そのあとに、効率についても追及することが想定されている。

Hon氏によれば、AIはマッチングの技術の粋であるという。クエリーに対するマッチングが会話という形になる。そのためにりんなは過去にかわされた膨大な量の人と人との会話を収集、さらには、りんなと人との会話も蓄えている。そして、これらの会話データが他のユーザーとの会話にも役立てられるわけだ。特に、中国でXiaoIceが登場してから1年以上が経過し、会話データもずいぶんたまっているということだ。

「りんな」の進化のこれまで

特徴的な面として、人間は話す内容がそれほど変わらないという点に注目する必要がある。これこそが、ビッグデータが重視されるゆえんだ。たとえば、画像をりんなに見せると、りんなは同じような画像が過去になかったかどうかを調べ、それに対して、人はどう反応したかを見つけてして反応する。つまり、人間が過去につぶやいたコメントを探してくるわけだ。だから、画像を理解するだけではなく、それに見合った反応ができる。文章にしても同じで、それに見合った画像を返したりもする。

顔認識技術も貢献している。たとえば犬の写真を見せたとしよう。すると、りんなはデータベースをマイニングし、それに対する会話をレスポンスする。書籍も約1,000万冊分のデータが入っていて、タイトルや読者層も把握、ファッションなら、衣服の種類や記事のことを知り、背広やシャツといったスタイルも熟知している。

Hon氏は、将来的にりんながエージェント化することも想定しているようだ。最初は人と人との会話から始まっても、途中からショッピングアドバイザーのような役割を果たし、いつのまにかショッピングサイトに誘導するようなことも考えているらしい。りんなの未来は、まだまだ表面さえ削り切れていない。もっともっとエモーショナルなコネクションが可能だと同氏はいう。

Skype翻訳の技術も応用される。これは、スピーチからスピーチへの翻訳だ。これもまた、データが増えれば増えるほどシステムが改善できる。また、How-Old.netのように、人の顔写真から年齢をあてるインテリジェントクラウドサービスは、イメージ分析のAPIを使い、たった10行程度のコードで作れるという。その運用から、人は笑っていると5歳は若く見えるといったこともわかったらしい。そのオブジェクト・ディテクションの技術は、りんなにも活かされ、今後は、彼女は写真も理解するようになるだろう。最新の研究では、ビデオ動画の中に出現するオブジェクトの種類を認識する技術も実用化されようとしている。

人の顔写真から年齢をあてる「How-Old.net」。このサービスは、たった10行程度のコードで作られているという

Windows 10では、Always on Mic というテクノロジーが紹介されている。これは、スリープ状態にあるPCに話しかけるときに、ボタン操作などが不要になるというものだ。ここでは話者認識の技術も使われている。誰が話しかけているかを認識し、PCの持ち主以外がしゃべっても無視する。コルタナがこの技術を取り入れた形でWindows 10に実装されているのはよく知られている。

Hon氏は、AIとマシンラーニングとビッグデータは、95%が重なった領域の研究であるとする。つまり、データがなければAIは存在しえない。1950年代の新聞記事をHon氏は提示し、過去において、人間は強力なキン肉マンを作ることができた。空も飛べるようになった。だが、将来的にはそのキン肉マンが頭脳を持つだろうという。

機械にはいろいろなことができる。だが、それをチョイスするのは人間だ。AIは危険だという論調もあるが、その心配はないとHon氏。人間のクリエイティビティはきわめてすぐれたものであり、マシンはルーチンワークを代わりにやっているにすぎない。今のところ、マシンが新しいアルゴリズムを書くようにはなっていない。どんなものでも悪の手にわたればたいへんなことが起こる。クルマにしても、飛行機にしても、そして、コンピュータにしてもだ。でも、それは機械のせいじゃない。

1950年のTIMEの記事を引用。筋肉超人な機械には慣れたが、人を超える頭脳を機械が持つのは怖い……

誰も見たこともない、考えたこともない発想が世に広まるのに5分はかからない。それがコンピューターネットワークがもたらす新しい世界だ。人間には世界中の情報を集めることなどできないが、コンピューターならそれができる。誰かが解決できたことは、集合知となるのに5分もあればいい。そして、それをりんなは次の会話に活かす。

ヒューマンとマシンが協調すればスーパーマンになれる。それがマイクロソフトの考える未来のAIの姿だ。

ヒューマンとマシンが協調したスーパーマン。それがマイクロソフトの考える未来のAI

(山田祥平 http://twitter.com/syohei/ @syohei)