CEVAは、インテリジェントなクラウド型サービスやエッジデバイスの主要ヒューマンインタフェースに向けた音声利用の拡大を目指し、ニューラルネットワークによる音声認識技術「WhisPro」を開発したことを発表した。

同技術は、常時音声認識型で複数のトリガーフレーズに対応しており、ユーザーがスマートフォンやスマートスピーカーなどの音声対応デバイスを使って、クラウド型音声アシスタントサービスを活用することを可能とするもの。カスタマ向けにトリガーフレーズのカスタマイズサービスも提供されるため、スマートホーム以外のクルマやエンタープライズ領域での活用なども可能になるという。

同社が培ってきたフロントエンド音声処理ソフトウェア技術(ノイズリダクションならびにエコーキャンセレーション)と音声DSP、ニューラルネットワーク(Recurrent Neural Network:RNN)のアルゴリズムなどを統合することで、95%以上の認識率を達成しつつ、コンピューティングリソースや消費電力は最小限に抑えることを可能としたと同社では説明しているほか、発話者が離れた場所に居ても、ノイズのある環境であっても、柔軟に適用して動作することができるとしている。

また、カスタマ自のシステム上でWhisPro技術の組み込みやテストを実施する際のガイドラインやツールも、WhisPro SDKitとして提供されるとしている。

なお、同技術は現在、CEVA-TeakLite-4、CEVA-X2、CEVA-BX DSPのカスタマに限定的に英語版がライセンス提供されているが、近日中に中国語(普通話)版も提供が開始される予定だという。

  • WhisPro

    WhisPro利用時のブロックダイヤグラム