NTTは、HTML5ブラウザ上で事前のソフトウェアのインストールなしに音声認識を利用可能とする技術を開発したと発表した。

開発した技術は、W3Cで仕様策定が進められているJavaScript APIを組合せることで、端末種別、OSの違いによらず、HTML5ブラウザから音声認識を使ったサービスの利用を可能とするもの。これにより、ウェブ閲覧者は、特別な準備をすることなしに音声認識を使ったWebアプリケーションの利用が可能となる。

技術のポイント

さらに、周囲騒音に頑健な音声区間検出機能も兼ね備えており、周囲環境によらず、高精度な音声認識が可能となる。

NTTアイティでは本技術をNTTより取得し、「HTML5ブラウザによる音声認識サービス"SpeechRec for Browser"」として、10月から、国内にて販売を開始する予定。

このサービスでは、NTTメディアインテリジェンス研究所が開発した高性能な音声認識エンジンであるVoiceRexを採用。今回、NTTサービスエボリューション研究所のHTML5コンテンツ上での音声認識実装技術を採用し、新たな利用形態として、HTML5ブラウザで音声認識を利用できるようにするサービスを提供する。

他の利用企業との共有型のサービスと異なり、認識辞書や言語モデルなどのカスタマイズにも対応でき、ユーザがどのような用語を検索しているかなど、企業にとってマーケティングなどの面で重要なアクセスログの取得・分析も可能。

音声データの処理をクラウド側に集約しているため、他の様々なサービスとの連携が容易で、HTML5ブラウザを用いたサービスとして、検索キーワード入力、通販サイトでの商品名や個数などの項目入力、ブログやSNSなどでのテキスト入力、タブレット端末を用いた業務報告、データエントリシステム、WebRTCアプリとの連携、対話型サイネージサービスなどが考えられている。

NTTアイティは、本サービスをいち早く提供することにより、Webページ作成ベンダと連携した企業や自治体のWebページの価値向上や、SIベンダと連携しモバイル環境でのタブレット端末を活用した報告システムの利用率向上など、音声認識の利用の幅を広げシェアの拡大を図っていく。

さらに、WebRTCを活用したアプリケーションとの連携による新たな通信サービスや、対話や翻訳などのサービスと連携したサイネージサービスの創出など、音声認識を活用した新たなサービスを創出していくという。