NTTとピーディーシー(PDC)は1月21日、自然な音声対話が可能な接客型デジタルサイネージを開発したと発表した。

NTTは、研究所が有する音響処理・音声認識・言語処理・音声合成をはじめとしたメディア関連技術を活用し、システムがあらゆる騒音環境下で音声を認識して自然な音声対話を行い、ユーザのさまざまなニーズに応える音声対話プラットフォーム技術の研究開発に取り組んでいる。一方、PDCは、商業施設や公共交通機関などを中心に、国内で急速に普及が進んでいるデジタルサイネージ市場において、大型施設向けシステム導入数でトップシェアを獲得しており、今後、東京オリンピック・パラリンピックが開催される2020年に向けて、さらなる普及・拡大と競争力の強化を狙い、より幅広いユーザが使いやすいユーザインタフェースを持つデジタルサイネージシステムの実現を推進している。

今回、両社は、NTTが持つ研究開発成果と、PDCが持つデジタルサイネージシステムおよびデジタルサイネージに関するノウハウを組み合わせ、デジタルサイネージにおいて、"接客型"という新しい価値を提供することを目指している。接客型デジタルサイネージは、ユーザに能動的に話しかけ、ユーザが通常に人と話すような言葉で発した要望を解釈し、ユーザが置かれた状況に応じてインタラクティブな情報提示を行うことで、自然な対話を可能とするものである。

具体的には、外部情報(API)と連携することにより、商業施設や駅などで、さまざまな情報の提示を可能とする。また、NTTが開発したあらゆる騒音環境下で目的の音声をクリアに集音可能とするインテリジェントマイク技術を組み合わせることで、ショッピングセンターのような60~80dB程度の騒がしい環境下でもユーザの音声を認識することが可能になる。この他、詳細な粒度の固有表現を獲得する固有表現抽出技術、および低コストで作成可能な学習データに基づくタスク判定技術を活用することにより、これまでと同じ対話のシナリオを作成する場合、対話ルール数を従来に比べて約50%削減できるという。

コンセプトイメージ