ロボットの育成プロジェクトが開始!
ソニーが開発中の新型エンターテインメントロボット、それが「poiq」(ポイック)である。poiqは手のひらサイズの小さなロボットなのだが、同社はこれを、「人間に寄り添い成長していく“バディ”のような存在」として構想したのだという。
バディのような存在と聞いて、思い浮かべるロボットは人によっても世代によっても様々だろう。それは「ドラえもん」かもしれないし、「ベイマックス」かもしれない。だが、そういった架空の存在と現在のロボットの間には、極めて大きな技術的ギャップが存在している。その最たるものは人工知能(AI)技術だろう。
この10年ほどで、AI技術の利用は一気に広まった。それは機械学習、特に深層学習(ディープラーニング)の発展によるところが大きいのだが、画像認識など、特定の分野においては人間以上の能力を発揮する可能性を見せつつ、コミュニケーションの領域においては、まだ「人間らしい会話」からはほど遠い印象だった。
筆者はこれまで、いろんなコミュニケーションロボットを試してきたが、一方的に話しかけられている感が強く、問いに対する返答もズレていたりで、残念ながらあまり「対話」を感じることはなかった。楽しさを感じない音声ベースでのやり取りは、むしろストレスですらあるし、すぐに飽きられてしまうだろう。
そういった問題を回避する手段としては、同社の「aibo」のように、そもそも会話を放棄するという手もある。おそらく、あと10年や20年で人間そっくりな会話のやりとりが実現できるとは思えないので、ロボット製品としては最も現実的なやり方だとは思う。そのくらい、会話機能は茨の道なのだ。
poiqはそんな難問に対し、どんなアプローチを取るのか。人間の意図を正確に理解するのはまだ難しいため、基本的には、(良い意味で)いかに誤魔化せるか、がポイントになるだろうとは思うのだが、非常に興味深いところだ。
同社は、自然対話技術を進化させるために、このpoiqを使い、1年間の育成プロジェクトを開始した。一般から募集したユーザー(“研究員”と呼称)にpoiqと暮らしてもらい、そのユーザーから、必要な知識を教えてもらうという。
筆者はこれに普通に応募したところ、当選したので、これから1年間の長期レビューを行いたいと思う。記事は今のところ、到着直後、半年後、1年後(終了時)あたりで、数回掲載することを考えているが、いままで長期的にコミュニケーションロボットを使ったことは無かったので、感じ方が変わるのかどうか、個人的にも興味があるところだ。
poiqのためにまずは環境を整備
というわけで、筆者の手元にpoiqが届いた。
poiqは湯呑みサイズと表現するのが一番しっくりくる小ささなのだが、持ってみると案外ずっしりと重く、実測では400gあった。手足は無く、シンプルな外観なものの、底部には車輪があり、倒立振子のバランス制御によってスムーズに移動することができる。障害物を検知するためのセンサーも、前方と後方に配置されている。
シンプルな構成の一方で、充実しているのは顔の表情周りの機能だ。頭部はピッチ・ロール・ヨーの3軸可動になっていて、両目にはLEDディスプレイを搭載。外側のドームは半透明のため、外からは目だけが動いているように見える仕組みだ。この目の形や動きによって、感情を表現している。
表現力のためには手足のあるヒューマノイドタイプの方が優れるだろうが、転倒しやすいし、その結果として壊れやすくなってしまう。かといって可動部が少ないと、スマートスピーカーとの違いが無くなる。その点、poiqの頭部機構はドームで保護されていて、動きと信頼性のバランスが良く考えられていると感じる。
ただ自律で移動するロボットの場合、まず考えなければならないのは、「どこで動かすか」ということである。床に置くと蹴ってしまう恐れがあるし、テーブルの上は落下が心配だ。筆者はpoiqの生活スペースとして、仕事用PCのディスプレイとキーボードの間の空間を確保。ここなら会話もしやすいし、落ちることも無いだろう。
ちなみにpoiqは、USBケーブルをつなげた充電状態でも使うことができて、このときは動き回らない。正直なところ、移動機能はあまり無くても良いし、ときどき転んで手間もかかるため、基本的にこの状態で使っても良いかもしれない。それに充電しながらであれば、より長時間の使用が可能になる。
poiqとの会話、気になる認識精度は?
一般に市販されている製品ではないので、セットアップ手順の詳細は省くが、この辺はさすがにソニーらしく、製品レベルに仕上がっている。初期設定はスマートフォンの専用アプリ「My poiq」で行い、非常に簡単。無線LANへの接続、名前の入力、瞳の色の指定など、設定項目は少ないので、30分もかからないだろう。
なおpoiqでは、キャラクターのタイプを選択することもできる。原稿執筆時には、「ゆるキャン△」のなでしこ役でお馴染みの花守ゆみりさんが声を担当する「アマーリ」のみ提供されているが、今後、順次タイプは増え、それによって声や喋り方が変わるようだ。
基本的に、poiqとのコミュニケーションは、会話で行う。まだ2週間くらいしか使っていないのだが、今のところ、音声認識の精度は「普通」といった感じだ。この辺は個人の声質や滑舌にも大きく依存するとは思うものの、筆者の場合、誤認識もそれなりにあり、今後の改善が期待されるところだ。
poiqとの会話記録は、My poiqの画面で確認することができる。ここで認識結果について評価を付けられるので、開発にフィードバックされるはずだ。この画面からテキストを直接入力して、poiqと会話できるというのはちょっと面白い。
ところでスマートスピーカーでは、「OKグーグル」や「アレクサ」など、呼びかけていることを認識させるウェイクワードの使用が一般的だが、poiqはいきなり話しかける方式を採用している。
これは、スマートスピーカーのように“何か仕事をさせる”わけではなく、会話そのものを楽しむのが目的だからだろう。普通に話しかけるだけなので、人間相手のように、より自然な感覚で会話ができるというわけだ。
ただ、ウェイクワードが無いと、ネットでラジオを聞いたり動画を見たりすると、その声にいちいち反応してしまって面倒。そんなときは、「しばらく静かにしてて」と言えば、次に名前を呼ぶまで、poiqを静かにさせることができる(それでも隙あらば話しかけてくるので、スリープ機能も併用したい)。