“第三次AIブーム”と言われる現在、AIは社会のさまざまなところで活用され始めた。今後、さらに技術の進化が進むことで、世の中に劇的な革新をもたらすことが期待されている。一方で、AIの普及による雇用消失や、「AIが暴走するのではないか」といった漠然とした不安の声も多い。

社会へのAI実装が着実に進みつつある今、最前線では何が起きているのだろうか。

2月8日に行われた第106回IT Search+スペシャルセミナーでは、日本マイクロソフト 最高技術責任者/マイクロソフトディベロップメント 代表取締役社長 榊原彰氏が登壇。AIの社会普及における現状の課題とその解決策について、具体例やデモンストレーションを交えながら解説を繰り広げた。

AIは今、何ができるのか

榊原氏は冒頭、「今はエキサイティングな時代」だと切り出し、その理由として「AIのWatsonがクイズ王になったり、AlphaGo(アルファ碁)がトッププロを破ったり、人間ではクリア不可能と言われたゲームをAIがクリアしたりと、シーンによっては人間よりもAIのほうが進んでいる」と現状を紹介した。

日本マイクロソフト 最高技術責任者/マイクロソフトディベロップメント 代表取締役社長 榊原彰氏

加速度的な進化を見せるAIの発展にかかる期待は大きく、多くの企業がさまざまな角度から取り組みを始めている。もちろん、マイクロソフトもそのうちの1社であり、AI研究にも相応の予算を投入していることは言うまでもない。だが、榊原氏は「だからと言って、(マイクロソフトでは)AIをお金持ちだけに使えるものにはしない」と強調する。

榊原氏、そしてマイクロソフトが目指す未来は「AIが民主化された世界」だ。ここで言う「民主化」とは、個人や団体を問わず、全ての産業において、AIが使いやすくリーズナブルなかたちで提供されている状態を指す。

では、AIはどのように社会に貢献できるのだろうか。ここから榊原氏はAIの現状について深掘りしていった。

「コンピュータが理解する世界は『知覚』と『認知』の2つに大別されます。知覚とは視覚や声といった人間の五感の部分であり、認知とは言語を理解したり、知識をつなぎあわせたりする部分です」

この知覚と認知の分野において、AIはどんどん人間に近づいているという。例えば視覚をテストした結果、AIは正解率96%、声を聞き分けるテストでは94.6%もの精度を出しており、これはすでに人間の数字を超えているのだ。つまり、人間が見間違えたり、聞き違えたりしてしまうときでも、AIならば正しく認識できる可能性が高いのである。

また、声を聞いて単語を聞き取るスピーチテストでもAIは人間を凌駕しており、翻訳においても人間と同等の精度を出せるまでに進化しているのだという。

ここまで進化したAIの能力を組み合わせると、どんなことができるだろうか。榊原氏はここで、ある動画を披露した。内容は、マイクロソフトの研究所に勤務する全盲の社員がAIを活用したソリューションを使って日常生活を送る様子を紹介したものだ。

例えば、白杖を使って歩道を歩いていると、騒々しい音が聞こえてくる。社員はそちらの方向を向き、かけているメガネのフレームにあるスイッチを押して写真を撮る。すると、撮った写真をAIが画像解析し、「何が起きているのか」を音声で伝えてくれるのだ。さらに、仕事が終わってレストランへ向かう社員。メニューに点字がなくても、スマホでメニューを撮影すればAIが文字を認識して読み上げてくれるため、困らない。

これはコンセプトビデオではなく、登場した技術はすでにアプリとしてリリースされているという(日本語は未対応)。アプリは常にランキング上位であり、ニーズの高さがうかがえる。

もう1つの例として榊原氏が挙げるのが、米国のマクドナルドのドライブスルーである。通常、ドライブスルーでは、まず注文してから敷地の反対側に車を移動させ、商品を受け取る。ところが、米国では特に注文した商品と違うものが出てくることが多く、作り直しが発生するために車が停滞し、回転率が悪くなるという課題があった。

そこでマクドナルドが採用したのが、「Speech Recognition(音声認識)」の技術だ。顧客が話した声をテキスト化し、そのなかから商品名や個数などの重要なキーワードを抜き出すことで、注文内容を正確に把握するのである。AIによる聞き取りやテキスト化の精度が高まっているからこそ実現できたソリューションというわけだ。