【レポート】

機械学習・人工知能でSkype翻訳やHoloLensを実現 - 日本マイクロソフト、研究開発の最前線ラウンドテーブル

 

日本マイクロソフトは2月22日、最近のホットワードでもある人工知能や機械学習をテーマにした自社の取り組みを発表した。Microsoftの研究開発機関であるMicrosoft ResearchでCVPを務めるPeter Lee氏は「機械学習は活版印刷技術の発明と同じ、破壊的な時代をもたらす」と述べている。

日本マイクロソフトの「人工知能・機械学習の研究開発の最前線に関するラウンドテーブル」から

今、世界が変化の兆しを見せていることにお気付きだろうか(変化の連続とも言えるが)。「機械学習(マシーンラーニング)」や「人工知能(AI)」という単語を、目に耳にしたことがあるはずだ。機械学習は、あるデータをもとに反復学習した結果からパターンを見つけ出し、学習結果に当てはめることで、将来予測などに用いることが可能と言われている。一方の人工知能は、コンピューターに人間と同じ知能を与えることで、周りから得た情報をもとに判断・行動を目指す。

そこから得た成果は我々の社会構造を大きく変え、暮らし方や働き方も必然的に変化する。PCの世界に置き換えると、約30年前はDOS上でコマンドを実行するCUIが中心だったが、約20年前にはGUIが取って代わり、約10年前にはiPhoneが登場してタッチUIがスタンダード化。人とデバイスの関係性を覆した。

この流れを見れば、約10年後の現実世界もおぼろげながらイメージできるだろう。その一端を読み取れるのが、今回、日本マイクロソフトが開催した「人工知能・機械学習の研究開発の最前線に関するラウンドテーブル」である。

Microsoftからは、Peter Lee氏が出席。Microsoftのお膝元である米レドモンドのMicrosoft Research(MSR) Redmodや、おとなり中国のMSR Asiaなど世界の7カ所に拠点を持ち、多岐にわたる分野の研究を司るMSR CVPだ。ほか、東京大学 大学院新領域創成科学研究科 教授の杉山将氏、産業技術総合研究所 人工知能研究センター所長の辻井潤一氏なども加わった。産学官の枠を越えて、機械学習や人工知能における著名人が集まり、実社会や産業界への影響を議論。ここではLee氏の発言から、我々コンシューマーが携わる部分を紹介したい。

Microsoft ResearchのPeter Lee氏

Lee氏が最初に取り上げた製品は「Skype」だった。

MSRの研究成果や機械学習から得たデータで実現する通訳・翻訳機能だが、2014年12月に英語とスペイン語の双方向翻訳に対応し、2015年5月にはイタリア語と中国語(北京語)をサポート。その後はフランス語、ドイツ語をサポートしてきたが、今なおプレビュー版と表現している。Skypeの通訳・翻訳機能が、今後も成長し続けることを示唆しているのだろう。

また、当初のプレビュープログラムでは、関心のある言語に日本語が含まれていたが、この点について「2020年開催のオリンピックに向けて、2015年の春には日本語の同時通訳機能もサポートする予定だ。日本の企業と協力して、翻訳・通訳の品質向上にも努めたい」と回答した。

MSRが研究した機械学習のデータはSkypeの翻訳・通訳機能に反映されている

Skypeの通訳・翻訳機能に関してMicrosoftは、2カ月に1回のペースで新しい言語にチャレンジし、執筆時点では50種類以上の言語翻訳を可能にしている。この点についてLee氏は、「かつてのモデルは国連のスピーチなど丁寧かつ形式的な会話をベースにしていたが、Skypeでは利用できないため最初から作り直した。その結果、一般的な会話や歌も認識できるようになった」とした。Windows 10 Insider Preview ビルド14267のCortana英語版には楽曲検索機能が組み込まれているが、同様の技術を用いているのだろう。まずはLee氏の発言に期待し、春以降の動向に注目したい。

Cortanaが新たに用意した音楽検索ボタン。後ろで流れる楽曲の識別を可能にする機能だが、執筆時点で日本語には未対応(公式ブログより抜粋)

現在の機械学習状況ついてLee氏は、「人々が聞く・喋る・認識するといったアクションが実用化へ向かいつつある」と述べる。MSRは以前から多くの研究プロジェクトを立ち上げてきたが、Windows 10のCortanaがメールの内容を読み取って自動的にリマインダーを作成する機能、「Microsoft HoloLens」から見える仮想的なオブジェクト、指や手で操作する部分などが、MSRが機械学習の研究結果をフィードバックした一例だという。

これらの成果は「Project Oxford」でAPIを公開し、ユーザーは誰でも顔や画像、音声認識を行うことが可能だ。画像から年齢を推察する「How-Old.net」や、先ごろローンチした画像内の犬種を識別する「Fetch!」も、同様の技術を用いている。後者のアプリケーションは人にも使えるため、Lee氏が「奥さんにはやらない方がいいかもしれない」と話すと、出席者から笑いが起こった。

アップロードした画像を元に犬種を自動識別する「Fetch!」。人物画像を用いると、もっとも似た犬種が示される(公式動画より抜粋)

Lee氏は機械学習の現状を、Johannes Gutenbergによる活版印刷技術の発明になぞって、「破壊的な時代がもたらされた」と表現する。ただ、「現在のAIや機械学習は聞く・理解・視覚的に捉える・知覚するといった部分まで来ているが、理性やフィードバックループといった認知は進んでいない。例えば、数年後には大学受験は可能ながらも、一般常識や道徳などを重視する小学3年生のテストに合格するのは10年以上に先になる」という見方も示した。

さて、Lee氏の職歴にカーネギーメロン大学のコンピューターサイエンス部門責任者とあるように、MSRのメンバーはすべて科学者だ。「MSRは(他社研究所と比べると)大型投資による人材収集、Amazonに匹敵するMicrosoft Azureの活用、Bingを介した世界中のWebデータへアクセス」(Lee氏)と、3つのユニークポイントを持つ。Microsoft社員の行動パターンデータも保持し、Webとエンタープライズのデータを活用できるのは強みとなるだろう。「今後も基礎研究や応用研究の結果をクラウドに反映させたい」と語るLee氏からは、AI&機械学習がもたらす近未来が目前に迫っていることを感じられた。

阿久津良和(Cactus)

関連キーワード

人気記事

一覧

新着記事

ボルボ「XC90 エクセレンス」発表 - 後席の居住性を重視した4人乗り高級SUV
[05:16 8/28] ホビー
ボルボ「XC60 クラシック」をラインアップに追加 - 装備を充実させたモデル
[04:58 8/28] ホビー
メルセデス・ベンツ「C 300 クーペ スポーツ」を発売 - 専用エンジンを搭載
[04:44 8/28] ホビー
「メルセデスAMG C 43 4MATIC」9速AT搭載などの改良を実施 - クーペ追加も
[04:39 8/28] ホビー
アストンマーティン「ヴァンキッシュ ザガート ヴォランテ」99台の限定生産
[04:27 8/28] ホビー