MicrosoftのAI技術と研究開発 - 女子高生AI「りんな」やWindows 10「Cortana」の背景

日本語対応の期待が集まる「Skype Translator」

続いて音声会話を自動翻訳する「Skype Translator」について説明が行われた。現在は英語・スペイン語・フランス語・ドイツ語・イタリア語・中国語(北京語)のみに対応し、日本語には未対応だが(テキストメッセージの翻訳は日本語を始めとする50種類以上の言語をサポート)、今後多くの場面で期待が持てるアプリケーションだ。Skype Translatorは自動的に音声通話を録音し、その結果を校正する仕組みが最初に行われる。

洪氏は「話した内容をそのまま翻訳エンジンに渡しても正常に動作しない。そのため文章の終わりや始まりの不要な部分を校正する処理を経て、翻訳エンジンにデータを渡している。変換したテキストデータを音声化し、実際の音声会話として発している」と内部構造を説明した。また近い将来、日本語への対応を表明した。

「Skype Translator」の音声翻訳プロセス

この他にも画像の分析や分類を行う「Image Classification」や、AIがIQテストにチャレンジする「Word2Vec for IQ Tests」、ピクセルレベルで動画のリアルタイム認識を行う「Video Analysis」に関する取り組みを説明したが、筆者は「AIvs機械学習vsビックデータ」というテーマに注目したい。洪氏は「これらの領域は95%が重なっている。AIが活動するにはさまざまなデータが必要であり、集めたデータを分析する上で機械学習が必要。さらにそのデータを収集するビッグデータも欠かせない」と、それぞれが密接な関係であることを示した。

さらに人々と共通するプロセスとして、「フィードバックループ」というキーワードを用いている。一般的な回路理論上の変化など、さまざまな分野で用いられているが、洪氏は人々が「仮説をもとに実験して、その結果から学んでいる」ように、「AIも『展開したデータを分析して、理解して証明する』というフィードバックループと同じ。科学者も開発者も皆、同じようにフィードバックループを完結しながら成長を目指している」と語っている。

人々が日常的に行うフィードバックループはAI分野でも同じ、と説明する

続けて1950年代の米ニュース雑誌「TIME」をスライドで取り上げ、「AIは危険だ」という声に反証した。「当時の記事で、コンピューターは超人的な存在として人々と競合するといわれていた。だが、コンピューターはルーチンワーク的な役割であり、アルゴリズムも人々が考えなければならず、科学的な証拠も示されていない」と語り、AIの進化を楽観的に考える理由だとした。

洪氏はAIの「Artificial Intelligence」は「Augmented Intelligence(増幅知能)」であるべきと語りつつ、「人とコンピューターがつながることでスーパーマン(超人)になる我々が目指す未来だ」とAI分野の発展を説明した。スマートフォンやウェアラブルデバイスに代表されるITデバイスを普段から身に付け、インターネットを介したビッグデータ社会が具現化しつつある我々の近未来に、Microsoftがどのようにコミットするのか実に興味深い。