検証開始から4週間。坂入氏は本検証をこう評価する。
「Pepperへ質問する利用者数は1日あたり約200人という結果が出ており、1人のスタッフが1日に200人対応するにはかなりの労力を要することを考えると、労働力としては評価できると思います。また、このように多くのお客さまに利用していただいていることから、そもそもニーズがあるということも分かりました。ただし正答率についてはまだまだ改良の必要があると考えています」(坂入氏)
本検証の運用を担当する菅澤氏はその正答率向上についてこう語る。
「正答率を左右する要因として音声認識の精度があります。Pepperを介した利用者とのやり取りを記録したログを見ると、Watsonが学習済みの質問だったにもかかわらず利用者が発話した質問をSpeech to Text APIが正確にテキストデータへ変換できなかったために、Watson Assistant APIが正解を導き出せなかったケースがあることに気付きました。音声認識精度を上げるには2つのアプローチがあり、ひとつは利用者の発話を収音するマイクの改良、もうひとつは収音内容をテキスト化するWatsonのSpeech to Text APIの改良です。マイクについてはソフトバンクさんに検討していただいていますが、Speech to Text APIは辞書ファイルに店舗名などの固有名詞や路線名などの専門用語を追加することで、音声データからテキストデータへの変換精度を上げられると考えています」
また、Pepperに寄せられる質問内容は施設の道案内が多く、何度もやり取りが必要な複雑な質問はほとんど無かったため、利用者はPepperが回答できそうな質問を予想したうえで利用していることが分かった。そのためWatsonに学習させるデータは道案内を中心にある程度シンプルな質問に絞り込んで作成すればよいということも分かったという。
東京駅に設置されたPepperの近くで案内業務を行うコンシェルジュは「問い合わせの多い人気店舗の場所を最近のPepperは案内できるようになっているので私たちも成長しているなと感じます」と評する。
さらにPepper設置時間の朝10時半から夕方18時半までの稼働率も90%以上という結果が出ており安定稼働しているといえるだろう。
最後に今後の動きについて聞いてみると「今回の検証でAI案内ロボットのニーズがあることと利用者の質問傾向が見えてきました。今後は音声認識率の向上や多言語への対応、複数台設置を進める上での課題を見つけ、それらの解決から本導入までのロードマップを作成していきます」(坂入氏)と締めくくった。
AIやコミュニケーションロボットは万能ではない。人がそれらを検証しながら成長させたり課題を解決してくことで最大のパフォーマンスを発揮できる存在となる。JR東日本のPepperとWatsonもまさに同じプロセスを進んでいると筆者は思う。遠くない未来、駅の中でPepperが元気に案内係を務める日が来ると信じたい。