NTTアイティ、スマホやタブレット向けにクラウド型音声認識

NTTアイティは、スマホやタブレット等で音声認識が利用できる「SpeechRec Cloud」を、9月24日より提供開始すると発表した。

「SpeechRec Cloud」は、従来のオンプレミス型の「SpeechRec」を、スマホやタブレット向けに新たにクラウド型サービスとして開発したもの。従来のオンプレミス型と比べ、短期間かつ低コストで利用できる。

「SpeechRec Cloud」は、音声認識エンジンとして、WFST音声認識技術を利用し、NTT研究所が新たに開発した高速・高精度の音声認識エンジン「VoiceRex」を搭載。

また、背景雑音の抑圧や音声データのエンコードなど、音声認識を利用する上で必要となる機能を搭載したクライアントライブラリも用意している。

これまで、音声認識の活用は、大規模なコールセンタでの通話録音音声の認識分野など、オンプレミス型での利用が中心となっており、「SpeechRec」も、コールセンタやIVRなどの分野に導入されてきたが、近年、スマホやタブレット等の普及により、音声認識を活用したさまざまなアプリケーションが登場し、音声認識は身近なインタフェースとして認知されるようになってきた。

「SpeechRec Cloud」は、「SpeechRec Server」にインターネットを介して音声データを送ることにより、リアルタイムで音声認識結果のテキストデータを受け取ることができる。音声データの送信やテキストデータの受信などの処理は、APIを介して行うことができ、さらに、音声認識の効果を導入検討の段階で検討することができるお試し環境も用意している。

「SpeechRec Cloud」サービス概要

サービスは、リアルタイム性や利用頻度といった利用形態に合わせて、「同時接続数保証型」と「ベストエフォート型」の2種類を提供。価格は、同時接続数保証型が初期費用15万円、月額料金は1接続あたり10万円まで。ベストエフォート型が初期費用15万円、月額利用料が1契約あたり3万円、1ユーザーあたり500円(価格はいずれも税別)。