この製品を使ったら、Twitterの投稿が、より直感的なつぶやきになるかもしれないし、メールのやりとりはもっとスムーズにスピーディにまるで会話のようにできるようになるかもしれない。普及すれば、コミュニケーションのあり方や幅に変化をもたらすのでは、との期待は高まる。事実忙しいビジネスパーソンにとって、情報が自動的に入ってくるということは、非常に有用で、需要は高いのではないだろうか。ただ、すでに似たような製品が出回る中、国内で利用者の増加が加速しているという印象はない。なぜだろうか。
筆者も自身のスマホで音声認識機能を試したことがあるが、うまく認識できず、結局手入力した経験がある。便利になるはずの音声認識で何度も読み取り間違いをされては、「使わないでおこう」と結局不要な機能になってしまう。日本語の音声認識はまだまだ発展途上との印象は否めない。
独自の音声認識技術
「音声認識については、意図を理解して、発話するという一連のプロセスのすべての精度を上げていく必要がある」とソニーモバイルでスマートプロダクト部門商品企画課の近藤博仁統括課長。同製品には、それぞれの段階で精度を上げる仕組みを多数組み込んでいるという。それは、ソフト面だけでなく、マイクの位置といったハード面も含まれる。同社は、こういった技術を独自開発している。
上記のような独自技術は、「ソニーエージェントテクノロジー」と呼ばれ、音声対話だけでなく、映像や実際にタッチするなどといった動作、さまざまな入出力を通じてユーザーに情報を提供するための技術と定義し、今後発売される製品・サービスに搭載していく。今回の製品で展開される言語は8つだが、日本企業だからこそ日本語認識の技術には期待したいところだ。
また、この技術は今後さらに発展していくものとしていて、近藤統括課長は、「可能性をいろいろ模索している段階」と位置づけ、「ユーザーのフィードバックを受けて検討する」とした。「需要創造が狙い」と同社は今回の商品を位置づけるが、先の近藤統括課長の言葉からも、この製品はユーザーからの声がどのようなものかみるという位置づけであり、それを分析し、進化させたい意向が見えた。