アジリングアらが音声インタフェース開発ソフトを発表

11月25日から28日までの4日間、東京・お台場の東京ビッグサイトで開催された「2009 国際ロボット展(iREX 2009)」。その初日となった25日に、大阪市都市型産業振興センター「ロボットラボラトリー」および次世代ロボット開発ネットワーク「RooBO」ブースのデモンストレーションコーナーにおいて、音声対話システム開発のAgilinguaの日本法人アジリングアと大阪のロボットベンチャー、ヴイストンが、音声インタフェース開発ソフトウェア「GoTalkヴイストンLite」を共同で発表した。

「2009 国際ロボット展(iREX 2009)」会場風景

「ロボットラボラトリー/RooBO」ブースのデモンストレーションコーナー

発表を行ったヴイストン代表の大和信夫氏(左)と、アジリングア代表の瀬尾ゆう氏(右)

「GoTalkヴイストンLite」は、ヴイストン製のCPUボード搭載ロボットに音声対話機能を付加するもので、対応OSはWindows XP/Vista/7。同日よりダウンロード販売が開始されており、ヴイストンロボットショップでの価格は1万5,000円だが、登録前に15日間の無料使用も可能となっている。

「GoTalkヴイストンLite」起動時の画面

対話プログラム新規作成時の画面

ニューヨークに本社を置くAgilinguaは、カーナビなどの組込機器やモバイル機器のための「音声対話システム」を開発している。「GoTalk」はそのノウハウをベースにホビー用、大学などでの研究・教育用としてリリースしたソフトで、ユーザー自らが音声インタフェースプログラムを作成し、ロボットを音声で操作したり、会話コミュニケーションを楽しんだりできるというもの。

アジリングアでは今年2月に「レゴ マインドストームNXT」対応の「GoTalk レゴ マインドストームNXT Lite」(同社サイトでのダウンロード販売価格は3,980円)も発売しており、今回発表された「GoTalkヴイストンLite」は、ソフトの基本的な機能は踏襲しつつ、ヴイストン製のロボット用CPUボード「VS-RC003/HV」に対応させたバージョンとなっている。そのため対応ロボットは、ヴィストンの「Robovie-X」シリーズ(X/Lite/Pro)「Robovie-nano」シリーズ、「Robovie-i」、「Robovie-PC」、「Vstone Tichno」、日本遠隔制御(JR-PROPO)の「RB2000」、「RB300」など、同CPUボードを搭載したロボット全般ということになる。

「GoTalkヴイストンLite」に対応したヴイストン製ロボット「Robovie-nano」(左)と「Robovie-X」(右)

ソフト本体はWindows XP/Vista/7に対応しており、音声認識や音声合成についてはWindows付属の標準機能(Speech API 5)を使用する形で統合されている。

注:ただしWindows XP以降に標準で含まれる音声合成エンジンは残念ながら英語版のみ。日本語を話させるには、Office XP/2003にバンドルされた「LH Kenji」、「LH Naoko」や、クリエートシステムの「ドキュメントトーカ日本語音声合成エンジン」など、何らかのSAPI5対応日本語エンジンをインストールする必要がある。

スピーカーとマイクが接続されたPC上で動作し、ロボットは基本的にUSBケーブルでPCに接続してモーションを制御するシステムとなっている。

発表時のプレゼンテーション内容

「GoTalkヴイストンLite」発表時の製品説明は、アジリングア代表の瀬尾ゆう子氏がPowerPointによるスライドプレゼンテーションで行った。以下、その内容をご紹介しよう。

まず、製品コンセプトは「ユーザー自身が自由に対話プログラムを作成できる」ことだと言う。話す言葉も自由に設定できるため、ロボットに好みの個性を持たせ、理想的なコミュニケーション・パートナーにすることができる。感情と生活に則した対話によって、より身近な存在としてロボットに愛着を感じられる、と音声コミュニケーションの意義を紹介した。

ユーザー自身がロボットを話せるように、思うとおりの対話プログラムを作成

音声コミュニケーションを実現し、ロボットをより身近で愛着のわく存在に

次に、"GoTalk"はこれまで主に玩具として登場してきた"おしゃべりロボット"とは根本的に異なると強調。従来の製品はあらかじめ話す言葉が決まっており、不特定多数のユーザーとの対話が想定されていたが、"GoTalk"では、ユーザーが思いどおりに、自分に関することを話させることができる。そうした対話のパターンをプログラムし、ロボットとのコミュニケーションを深めることで、充実感や創造性の満足も得られると言う。

対話プログラムを自由に作成できることで、クリエイティブな満足感も得られる

使い勝手についても「次々に新しい会話プログラムを追加していくことができ、制限を感じさせない自由感・爽快感は他の製品にないもの」と自信を見せ、「難し過ぎず、飽きさせない」という相反する2つの特徴もうまくバランスを取って実現したと言う。ビギナーは使いやすいインタフェースで手軽に楽しめる一方、本格ユーザーなら、例えば「回れ」という命令に対してロボットが「右に回りますか?、 左に回りますか?」と聞き返してからアクションを実行する、といった複雑なプログラミングも可能だと言う。

プログラム初心者には使いやすく、上級者は複雑なプログラムも作成可能

音声インタフェースの研究・開発・学習にも

また、使って楽しいだけでなく音声インタフェースの研究・開発・学習にも役立つ、とし、今後ますます使用が広がるこの分野のスキル習得のためにも利用できる、とした。

実際、"GoTalk"の公式サイトには、教育機関を対象として学生の人数に関わらず一律5万円で「GoTalkアカデミックパッケージ」を提供するアカデミックプログラムについてもアナウンスされている。また、上位モデルとしてJavaScriptにより本格的な開発が可能な「GoTalk Pro」シリーズも発売の予定だとか。