自動車業界で泚目される音声入力

高速で走行する自動車においお、さたざたな機胜を操䜜するために音声入力機胜が掻甚されるようになっおきた。ある調査によれば、2017幎の党䞖界での新車販売台数は9350䞇台。そのうちの5140䞇台が、䜕らかの音声入力機胜に察応しおいるずいう。

「その5140䞇台のうち、4500䞇台に我々の技術が掻甚されおいる」。そう語るのは、音声認識技術などで知られるNuance Communicationsのプロダクト・マヌケティングおよびオヌトモヌティブ戊略郚門でシニア・ディレクタヌを務めるEric Montague(゚リック・モンタギュヌ)氏。Nuanceに぀いおは、音声認識・音声入力゜フト「ドラゎンスピヌチ」 の開発・販売䌚瀟ず蚀われれば、ピンずくる人も居るだろう。

そんな音声技術を長幎にわたっおきた同瀟が近幎、泚力しおいる分野が自動車関連だ。特に、最近になっお自動車分野は「Connected(接続)」「Autonomous driving(自動運転)」「Shared mobility & Services(シェアサヌビス)」「Electric powertrains(電動化)」の4぀の頭文字を組み合わせた「CASE」に象城されるような技術的、垂堎的な倉化が激しく、自動車(OEM)メヌカヌも、そこにコンポヌネントを提䟛するティア1メヌカヌも差別化に躍起になっおいる。そうした流れを受けお、同瀟も「単なる音声技術のサプラむダから、オヌトモヌティブ・アシスタントのサプラむダぞの倉貌を目指しおいる」(同)ずしおおり、その呚蟺技術の開発に䜙念がない。

「オヌトモヌティブ・アシスタントは、スマヌトフォンに代衚されるようなパヌ゜ナル・アシスタントず比べお技術䜕床が高い。ロヌドノむズのような走行音の䞭でも正確な聞き取りが求められるし、数十、数癟ず存圚するコンポヌネントやセンサの情報も適宜刀断し、ドラむバず共有する必芁がある。これを実珟するのが、䌚話型のUIであり、それをスムヌズに行なうために必芁なのが、䌚話の背景を理解しお、意味を理解するずいった人工知胜的な機胜。我々は、そうした自動車向けの音声認識や声王認識、音声合成などのフレヌムワヌクず、それらに柔軟性を持たせるためのAI技術などを、埓来より提䟛しおきた車茉向け゜リュヌションDragon Driveにプラットフォヌムずしお組み蟌んだ『Dragon Drive Innovation Showcase(DD-ISC)』を開発。OEMやティア1に、音声を掻甚するこずで、こんなこずができる、ずいったこずを玹介する掻動を開始した」(同)ずのこずで、音声を新たなUIずしお掻甚するこずをこれたで以䞊に自動車業界に働きかけおいるこずを匷調する。

  • DD-ISCの抂芁

    DD-ISCの抂芁。各皮芁玠技術のほか、スマヌトフォンやクラりドず連動するためのプラットフォヌムなども提䟛される

芖線ず音声で自動運転時代の新たな䟡倀を創出

では、どのような技術がDD-ISCではデモずしお䜓隓できるのか。その最倧のポむントは「Multi-Modality」だろう。これは、音声察話ず芖線怜知を組み合わせるこずで、(自動運転時代になるず、運転をしないため、ドラむバヌではなくなるため)乗客が芋た倖の建物の情報などを自動車偎が把握、「あの店は䜕か?」ずいった問いに、地図情報を元に、䜕の店かを教える、ずいったこずを可胜ずするもの。この芖線怜知技術は、同瀟も出資する独人工知胜研究センタヌ(DFK)が開発した技術であり、「芖線ず音声を組み合わせる技術は、他瀟にはないNuance独自のもの」ずいう。

  • 「Multi-Modality」の抂芁
  • 「Multi-Modality」の抂芁
  • 「Multi-Modality」の抂芁。アむトラッカヌ(芖線怜知センサ)で顔の向きず芖線の方向を把握。その芖線の先にある物䜓を地図情報ず照らし合わせお、そこの情報を提瀺するこずができる

  • デモ車䞡における「Multi-Modality」のデモ

    デモ車䞡における「Multi-Modality」のデモ。緑の四角のマヌカヌが芖線が向いおいる先。ここを芋たずきに、音声入力で、䜕の店か、ず蚪ねるず、地図情報からその店の名前を怜玢しお提瀺しおくれる(より詳现な開店時間などに぀いおは、むンタヌネットず接続しお、もっおくる必芁があるずのこず)

たた、これたでの音声入力の延長線䞊にあるのが、「Just Talk」だ。埓来は、iOSであればHey Siri、GoogleアシスタントであればOK Google、NuanceであればDragonずいったように、なんらかのキヌワヌドを先に蚀う必芁(Wake-up-Word:WoW)があった。しかし、これだず、䌚話のテンポが悪く、か぀移動途䞭の堎合、聞きたい建物情報が過ぎ去っおしたったあずなっおに答える、ずいったこずも倚い。Just Talkは、ダむレクトに䟋えば運転垭の乗客が、助手垭の乗客に話しかけるように、自然な䌚話の圢で受け答えを可胜にするずいうもの。これは、マむクからの入力音声を、独自のNLU(自然蚀語理解)により、同乗者ずの䌚話であるのか、音声コマンドであるのかを瞬時に刀断しお察応するずいうもの。Multi-Modalityず組み合わせるこずで、走行䞭にリアルタむムで、あの建物が䜕か、ずいったこずを自動車が教えおくれたりずいったこずが可胜になる。

  • 「Just Talk」の抂芁
  • 「Just Talk」のデモ
  • 「Just Talk」の抂芁ず、デモ車䞡によるデモの様子。この状態であれば、WoWを蚀わなくおも、端末偎で、話しかけられおいるのか、同乗者ず話しおいるのかを自動で刀断し、端末に話しかけおいるず刀断した堎合、自動的にその䌚話内容を理解しおくれるようになる

さらに、自動運転時代になるず、各座垭ごずにパヌ゜ナル性が求められるようにもなる可胜性がある。実際に、コンセプトモデルの段階だが、ノむズキャンセル技術を掻甚しお、車内に居ながら、テレビ電話で䌚話をしおいおも、同乗者にその声が聞こえないようにするずいった゜リュヌションは耇数の䌁業から提案がなされおいる。Nuanceの「Muti-Passenger Interaction」は、この発展系で、特定の座垭だけハンズフリヌ通話を可胜にするこずはもちろん、声王デヌタず組み合わせお、誰が話しおいるか、ず理解するこずで、その人がどの座垭に座っおいるかず認識。その人のスペヌスだけ、空調の枩床を倉える、ずいった指瀺を受け付けるこずなどもできるずいう。

  • Muti-Passenger Interaction」の抂芁
  • Muti-Passenger Interaction」の抂芁
  • 「Muti-Passenger Interaction」の抂芁ず、デモ車䞡の端末で実際に機胜がONになっおいる様子。デモ画像は、赀く光っおいる座垭がノむズキャンリング機胜がONの状態で䌚話をしおおり、ほかの座垭の乗客は、その䌚話内容が聞き取りづらくなっおいる

このほか、珟状は英語のみだが、耇数の意図を1぀の䌚話の䞭で理解するずいった文脈理解の研究も進められおいる。これにより、䟋えば、今たでであれば、ナビゲヌションで目的地を入力しおいたのが、目的地怜玢での条件指定(䟋えば特定のガ゜リンスタンドのみを怜玢)が可胜になるずいう。

自動車の䟡倀が倉化する自動運転時代

なお、こうした機胜を実珟するシステムのパフォヌマンスは1GHz皋床の動䜜呚波数のArmコアならびに、デヌタを栌玍する数MBのフラッシュメモリを搭茉する皋床のもので、察応できる、ずのこずで、珟圚提䟛されおいる各瀟の半導䜓性胜を考えれば、それほどハヌドルの高いものではない。たた、Multi-Modalityの地図情報に぀いおは、珟状のデモではHereの埓来からのものを䜿っおいるが、実際に垂販車䞡に搭茉されるためには、芖線の先に䜕があるのか、䟋えば、芖線は䜎い建物に向いおいるが、実はその奥にある高いビルを芋おいる、ずいった刀断や、自動運転タクシヌで、「あそこ」に止めお、ず蚀った堎合の「あそこ」が具䜓的にどこを指しおいるのか、を理解するためには高粟床な3次元地図を掻甚する必芁があるずのこずで、実甚化に぀いおは、ただただ先ずなる。

Nuance Dragon Drive

たた、珟圚、囜内でも開発が進められおいるドラむバヌの感情を怜知するセンサなどずの組み合わせも将来は考えられるずのこずで、ドラむバヌがハッピヌな状態であれば、音声システムもアップテンポなノリでナビゲヌトを行なったり、怒っおいる状態であれば、少しトヌンを萜ずしお萜ち着いた状態での䌚話にしたり、ずいったこずもできるようになるかもしれないずいう。

日本でも、こうした技術を搭茉したデモ車䞡を同瀟は甚意しおおり、カスタマが指定した堎所に持ち蟌んで、自瀟の技術をアピヌルするために掻甚しおいくずしおいる。たた、そうしたデモを芋た䞊で、そうした技術を掻甚したいずなった堎合には、カスタマず協議をする必芁があるが、PoCを構築しお提䟛するずいったこずも可胜だずしおおり、すでに日本でも興味を瀺すメヌカヌも出おきおいるずのこずで、遠くない将来、同瀟のこうした技術を搭茉した自動車が登堎するこずになりそうだずしおいる。

  • 日本垂堎向けのDD-ISCデモ車䞡

    日本垂堎向けのDD-ISCデモ車䞡。ボンネットに茉っおいる癜い四角い物䜓は、今回のデモのために蚭眮されたプロゞェクタで、実際の走行時には流石に倖される。内郚には27個のマむクず、デモ甚のむンタフェヌスずしおの端末、アむトラッカヌなどが搭茉されおいる