TISと奈良先端科学技術大学院大学は1月12日、音声や画像、言語などの複数の情報源を用いてロボットと人とのパブリックスペースにおけるスムーズなコミュニケーションの実現を目指す「マルチモーダルインタラクションを用いた対話処理に関する研究」を、2015年11月から共同で開始したことを発表した。
マルチモーダルインタラクションとは、視覚・聴覚を含め、複数(マルチ)のコミュニケーションモードを利用し、システムとインタラクション(コミュニケーション)を行うこと。
今回の共同研究の目的について、ロボットの対話機能の高速化、高度化を実現し、ロボットと人との高度な対話コミュニケーション処理のビジネス活用を目指すとしている。
研究項目については、以下の4点が挙げられている。
ユーザー理解:音声、画像、音声認識後のテキストなどを用いてユーザーの反応を理解
ドメイン知識:ユーザーに提案を行うのに必要な特定ドメインに関する知識構造を構築
対話制御:ユーザー理解、ドメイン知識を基にユーザーにとって最適な提案を実現
発話、ジェスチャー制御:ユーザーの感情などを反映した発話、ジェスチャー制御の実現
TISでは、「機械学習」「自然言語処理」に関わるAI技術の強化のために「AI技術推進室」を2015年11月に新設し、ビジネス活用に向けた技術研究・検証などを進めており、今回の共同研究もその一環として実施するものとしている。
共同研究期間は2016年3月まで。