【レポート】

NECのパーソナルロボット「PaPeRo」、ぜんじろうと漫才

1 人を"無視しない"高度な認識機能

    山田久美  [2005/03/18]

    東京・大手町の大手町サンケイプラザで16日、NECによるパーソナルロボット「PaPeRo(パペロ)」の機能強化および愛知万博での技術実証運用に関する記者発表が行われた。

    同社では1997年からパーソナルロボットの研究開発に取り組んでおり、初代「R100」(開発期間1997年1月~1999年7月)以降、2代目「PaPeRo2001」(同1999年8月~2001年1月)、3代目「PaPeRo2003」(同2001年2月~2003年4月)とバージョンアップが行われてきたが、今回発表されたのは4代目にあたる「PaPeRo2005」(同2003年5月~2005年3月)と、愛知万博での技術実証実験を行うため、PaRePo2005をベースに一部機能を改良したり、新機能を搭載したりした「チャイルドケアロボットPaPeRo」の2種類。

    PaPeRo2005

    従来4個だった頭部のマイク(額に1個、襟に3個)を新たに4個増設し、結果、頭部に計8つのマイク(額に1個、襟に7個)を装備。ハードウェアの性能・拡張性としては、従来のPaPeRoに比べ、CPUやメモリ、HDD容量がアップしたほか、新たにPCカードスロットや電源出力を搭載したことで、研究プラットフォームとしての拡張性も向上

    PaPeRo2003と比較した、PaPeRo2005におけるバージョンアップ点は次の3つ。

    (1)音声認識・対話性能の強化
    (2)画像を利用したマルチモーダルインタラクションの導入
    (3)プラットフォーム機能の強化

    (1)は、従来4個だった頭部のマイク(額に1個、襟に3個)を新たに4個増設し、結果、頭部に計8つのマイク(額に1個、襟に7個)を装備。これにより、「高精度音源方向検出」「耐雑音音声認識(ノイズキャンセラ)」「ロボット発声中音声認識(エコーキャンセラ)」「楽しい対話(エンターテインメント能力の向上)」という4つの機能を向上させている。

    高精度音源方向検出とは、複数のマイクに音が到達する時間差から音源方向を検出するしくみで、前や後ろなどのさまざまな方向からPaPeRoに呼びかけても、それがどちらの方向であったかを、PaPeRoが認識できるという機能。

    また、家庭での使用を考えた場合、どうしてもTVの音声など、雑音の多い環境を想定する必要があるが、従来のPaPeRoでは、静かな環境でしか人の声を認識することができなかった。それに対し今回、背面にマイクを増やし、そこから入ってくる音声は雑音、額のマイクから入ってくる音声は人の声と認識させるようにしたことで、雑音の多い環境下でも音声認識ができるようになったという。この耐雑音音声認識(ノイズキャンセラ)により、音声認識の誤りは従来の3分の1程度に低減したとされている。

    さらに、従来、PaPeRoの発話中は、ロボット自身のスピーカーから発生する音のせいで人の音声認識が困難であったが、今回、ロボット発声中音声認識(エコーキャンセラ)機能として、額のマイクに届くロボット本体の声を、スピーカーの出力から推定して消去することによって、PaPeRoが発話中でも音声認識が可能になった、つまり、割り込んで話しかけることができるようになった。

    動画
    高精度音源方向検出。複数のマイクに音が到達する時間差から音源方向を検出するしくみ(wmv形式 1.36MB 1分05秒)
    耐雑音音声認識(ノイズキャンセラ)。雑音の多い環境下でも音声認識ができるようになったという(wmv形式 1.14MB 55秒)
    動画
    ロボット発声中音声認識(エコーキャンセラ)。PaPeRoが発話中でも割り込んで話しかけることができる(wmv形式 377KB 17秒)

    一方で、(2)の具体的な機能としては、カメラを使ったコミュニケーションの向上が挙げられ,、「文字認識」「手振り検出」「振り子検出」の3点が可能となっている。

    文字認識については、OCR(光学式文字読取装置)を新搭載したことで、漢字、ひらがな、カタカナ、数字などの、紙に書いた手書き文字を読ませることができるようになり、例えば、音声だけでなく、文字で自分の名前を覚えさせたり、掛け算や足し算といった計算をさせたりすることも可能になった。

    動画
    OCR(光学式文字読取装置)を新搭載。文字で自分の名前を覚えさせることもできる(wmv形式 665KB 31秒)
    掛け算や足し算といった計算も可能(wmv形式 208KB 9秒)

    手振り検出とは、離れた場所からPaPeRoに向かって手を振ると、振っている人を見つけて近寄ってくるという機能。家庭や幼稚園などで行った評価実験を通じ、人はPaPeRoとコミュニケーションを取るため、PaPeRoに向かって手を振るケースが多いということが分かったため、同機能を搭載したという。

    一方、振り子検出は、揺れている振り子を見つけることができるという機能で、PaPeRoに振り子を見せると睡眠モードに入るように設定されている。

    (3)としては、「ハードウェアの性能・拡張性の向上」「ネットワーク連携機能の強化」がある。ハードウェアの性能・拡張性に関しては、CPUやメモリ、HDD容量がアップしたほか、新たにPCカードスロットや電源出力を搭載。研究プラットフォームとしての拡張性も向上した。また、ネットワーク連携機能としては、PaPeRo同士やPaPeRoとネットワーク家電など、情報機器間の連携機能の拡充が図られている。記者発表では、実際に、複数のPaPeRo同士が通信で情報のやりとりを行いながら、一緒にダンスを踊るといったデモンストレーションが披露された。

    さらに、「ユーモア対話」機能も紹介された。これは、ロボットとのより楽しい対話を実現させていこうという、同社ならではのユニークな取り組みで、その第一ステップとして、現在は、「ロボットによるユーモアの表現力」や「ロボットに適したユーモアの形態」の研究を行っているという。具体的には、漫才を題材に、コメディアンのぜんじろう氏と共同研究を行っているとのことで、今回は、ぜんじろう氏とPaPeRoの"パペじろう"との漫才やコントがビデオで紹介された。ロボット特有の機能を活かしたユーモア対話の1つとして早口言葉が挙げられる。PaPeRoの発声は音声合成で行われているため、いくらでも速く喋れる(=再生できる)というわけだ。

    動画
    PaPeRo同士が通信で情報をやりとりし、ダンスを踊った(wmv形式 760KB 31秒)
    ぜんじろう氏と"パペじろう"の漫才。ロボットならではの機能を活かした(wmv形式 407KB 18秒)

    新着記事

    特設サイトの情報

      人気記事

      一覧

      イチオシ記事

      新着記事

      特別企画

      マイナビニュースマガジン