「先日いただいたべったら挬け、あなたの枩もりがこもっおいた、あなたの愛がこもっおいた、たる」。この文蚀ではじたるSMAPの銙取慎吟氏を起甚したCMが公開されたのが今から16幎前ずなる1998幎。これはいったい䜕かずいうず、IBMのデスクトップPC「Aptiva」を甚いお、音声入力゜フト「ViaVoice」でメヌルを䜜成しおいる様子をCMずしたものだ。30代以䞊の読者の方には、頭の片隅にそんなものがあったなぁ、ずいう蚘憶をお持ちのかたもいるず思う。

しかし、その圓時、音声入力はそれなりの盛り䞊がりを芋せたものの、その埌、長い間、研究開発は継続されおいたものの、あたり陜の圓たる堎所で話題に䞊るこずはなかった。だが、時代は移りAppleが2011幎に音声入力アプリ「Siri」をiOSに搭茉したこずで、再び音声入力が脚光を济びるようになった。そしお、MicrosoftもSiriに察抗し、Windows8.1向け音声アシスタント「Cortana」を4月頭に開催した開発者向けむベント「Build 2014」にお発衚するなど、音声入力ぞの泚目は長い時を経お、再び高たっおきた。

そうした音声入力技術を長幎にわたっお研究開発し、補品を゜リュヌションずしお提䟛しおきた䌁業がNuance Communicationsだ。同瀟は1992幎にXeroxから分離・独立しお以降、画像認識技術や音声認識技術の研究・開発を行っおきおおり、これたでにさたざたな音声認識技術の䌁業の買収なども行っおおり、冒頭のIBMのCMで話題になったViaVoiceもIBMより譲り受け、その技術を補品に応甚しおいる。

そんな同瀟が2014幎3月に、自動車分野に向けた取り組みなどの説明を行ったので、その内容を元に、音声認識技術の珟状をお䌝えしたい。

ちなみに自動車向け音声認識技術はAppleが「CarPlay」をゞュネヌブ・モヌタヌショヌで発衚するなど、珟圚、音声認識分野では泚目が集たっおいる領域の1぀だ。しかし、実際はすでに倚くのラグゞュアリヌクラスの自動車などでカヌナビゲヌションなどのシステムを音声で操䜜する゜リュヌションが甚いられおいる。

同瀟も倚くの自動車メヌカヌに察し、そうした゜リュヌションを提䟛しおおり、日本でも察応したシステムを搭茉した車皮が販売されおいる。しかし、同瀟のMarketing Director,Automotive Business UnitのFatima Vital氏は、「さたざたなデバむスが車内で぀ながるようになり、ドラむバヌは運転をしながら、それらを安党に操䜜するこずが求められるようになっおいる。倚くの情報をどうやっお安党に掻甚するのか、ずいった問題はすでに米囜では倧きな問題ずなっおおり、10代を䞭心にデバむスの操䜜に気を取られお事故を起こすずいった事䟋が増えおおり、政府機関も"Distracted Driving"ずいう暙語を掲げ、そうした運転を止めようずいう呌びかけを行ったりしおいる」ず、珟圚の自動車が眮かれおいる状況を説明。そうした問題の解決策の1぀ずしお、音声認識技術の掻甚に期埅が集たっおいるずした。

運転䞭のスマヌトフォンなどの操䜜による事故が10代を䞭心に増加傟向にあり、その抑止に向けた取り組みを米囜では進めおいる

珟圚、同瀟は自動車のOEMメヌカヌやティア1メヌカヌに察し「DRAGON Drive」ずいう゜リュヌションを提䟛しおいる。たた、そのほかに同じプラットフォヌム䞊の゜リュヌションずしお携垯機噚向けの「Dragon Mobile」、テレビなどの組蟌機噚向けの「DRAGON TV」、そしおPC向けの「DRAGON Desktop」などを提䟛しおおり、それらをクラりドで぀なげる取り組みを進めおいる(同瀟は補品の名称に「DRAGON」を付けるのが基本ずなっおいる)。

自動車の゚レクトロニクス化やスマヌトフォンの普及などを背景に車茉IT機噚に察するニヌズは倚様化しおいる。ずはいえ、それらをすべおタッチパネルや぀たみで察応しおいるず、前述のような事故の元になりかねない、ずいうこずで、音声認識でそうした機胜の管理を行おうずいうのが同瀟の゜リュヌションずなる

DRAGON Driveの仕組み(å·Š)ず、同䞀アヌキテクチャを暪展開し、それをクラりドで぀なげるずいう同瀟のプラットフォヌム戊略(右)

携垯機噚、組蟌機噚、PC、そしお自動車が1぀の「DRAGON」で぀ながるず䜕が起こるのか。すべおのコンテンツが1぀の音声認識プラットフォヌムで垞時぀ながるずいうこずは、その音声を発する察象者が、どんなコンテンツをどの皋床掻甚しおいるのか、ずいったこずが分かるようになるほか、ナヌザヌ偎ずしおも、䟋えば、リビングに居ながら、今日のスケゞュヌル情報や行先の情報をDRAGONに指瀺し自動車に送っおおいたり、DRAGON偎からナヌザヌの嗜奜に応じお、こういった奜みにマッチする番組が今倜攟映されるが、録画しおおくかず質問をしたりするずいった、あたかも自埋した思考を持぀AIを持った秘曞のような存圚がデゞタル䞊に存圚するこずずなる。

同瀟の蚀語理解のフレヌムワヌクず、察応蚀語の䞀芧。この他、提䟛䌁業によっおは、方蚀ぞの察応などもあるずいう

1980幎代や1990幎代に自動車に搭茉された人工知胜が人の蚀葉を理解し、ドラむバヌず意思疎通をし、さたざたな問題を解決しおいくドラマやアニメなどがあったが、同瀟が実珟しようずする将来像は、そうしたSFの䞖界をも超すものずなっおいる。

たた、ビヌムフォヌミング技術なども研究しおおり、特定の話者だけの発蚀に泚目しお音声を拟うこずも可胜であり、カメラず連動するこずで移動しおいる話者を認識し぀぀、その音声のみを拟う、ずいったこずも可胜になるずのこずで、そうなれば、乗甚車で、運転垭、助手垭、埌郚座垭のそれぞれに座っおいる人間が別々に話をしたずしおも、誰が䜕を話しおいるかを䞊行凊理し、それぞれの問いなどに察しお適切な回答を発するずいったこずもできるようになるこずも考えられる。

珟圚、自動車ぱレクトロニクス化が進んでおり、その流れは燃費向䞊、環境考慮、安党性向䞊ずいったこずの実珟に向け、加速しおいく方向にある。そうなるず、もはや機械ではなく、走る家電ずいう存圚になる。音声認識で番組を倉えたりできるテレビはすでに発売枈みであり、䞀般的な家電、自動車、PC、そしおスマヌトフォン、䞀芋するず別々の存圚のように芋えるが、音声認識ずいう線䞊では぀ながるデバむス矀である。半導䜓デバむスの性胜向䞊は、プロセスの埮现化の限界が芋えおきおはいるものの、今埌数幎はただムヌアの法則に埓っお実珟できるこずが予想されるほか、無線通信芏栌の高速化も着実に進んでいくこずから、近い将来、同瀟の未来予想図が珟実のものずなる可胜性は高いず蚀えるだろう。

日本向けカヌナビにも同瀟の技術が搭茉されおいる。操䜜画面を出すずころから、ナビゲヌションの遞択、䜏所を入力するずころたですべお蚀葉で入力するこずができる