音声感情解析AIの開発を行うEmpathとNTTドコモは5月8日、雑音環境での音声感情認識技術を2018年3月に共同で開発したことを発表した。2018年度に同技術を、ドコモが提供する自動車向けの音声エージェントサービス「AIインフォテイメントサービス」に導入することを目指す。

同技術は、NTTグループのAI「corevo」を構成するドコモ独自の音声感情認識技術と、Empathの音声感情解析AI「Empath」の技術をもとに開発。認識対象の音声に対して、声の高さや音色などの音響的な特徴を分析し、あらかじめ機械学習で生成しておいた感情認識モデルを用いて、音響的な特徴からどの感情の音声であるかを推定する。

  • 音声感情認識のしくみ|

    音声感情認識のしくみ

両社では、同技術を用いて自動車とドライバーを感情によって結びつけることで、楽しいドライブや、居眠り運転の解消などに貢献できると考えており、2017年11月から2018年3月まで実施した実証実験では、走行時の自動車のエンジン音等の特徴を取り入れた認識モデルの生成技術によって、停車中を想定した雑音が小さいSNR(Signal to Noise Ratio:信号対雑音比)が15dB以上の条件から、高速道路走行中を想定した雑音が大きいSNRが0dBの条件において、「怒り」「喜び」「悲しみ」の3つについて、AIが平均75%で感情を判断することができた。

また、AIが感情にあわせた声かけを行うことで、ドライバーの眠気やだるさなどの倦怠感を表す指標値が50%減少し、被験者の93%はAIが自分の気持ちに寄り添ってくれていると感じて、気分良く運転できることを確認できたという。