音声のテキストへの自動入力が進むと随分と働き方改革に貢献できるはずだ。会議での議事録の大枠での書記、インタビューや取材といった類いの仕事でもテープ起こしの苦痛から解放される部分がある。過去に数々のソフトウェアが世に出てきたがなかなかチューニングが難しく、期待通りの成果を得られなかったという人も多いのではないだろうか。

大和総研は21日、大和証券の営業員の入力業務効率化のためにGoogle Speech APIを使ったAI音声認識機能を開発したことを発表した。同社では従来、顧客との電話や面談の記録をCRMシステムに手入力することでレポートを作成、営業品質の向上に努めていたが、この業務に多くの時間が割かれてしまうことで、本来時間を割くべき顧客との面談時間の減少や勤務時間の増加に繋がるなどの課題があったという。

大和総研は、Googleが企業や開発者向けに提供する「Google Cloud Speech API」を用いてAI音声認識機能を開発。営業員がマイクに向かって話す内容が自動的にテキスト変換され、移動中やスキマの時間を活用した効率的な記録が可能になるという。Google Speech APIは110以上の言語や対応し、RESTのほかHTTP/2を用いるオープンソースのgRPCを使ったAPI通信でクラウドから各種端末への機能提供を実現する。同社は、音声機能や専門用語への対応、同社CRMシステムでの適合を検討した結果Google Cloud Speech APIを採用している。今後は、利用者のフィードバックを踏まえ、他の業務への提供拡大を検討していく。