NTTアイティは、音声認識から検索、編集、チューニングまでをワンストップで処理する統合環境「SpeechRec Plus」の販売を、2013年12月中旬より開始すると発表した。

活用例「音声ファイルの認識」(上)、コールセンタ向けバッチ処理システム(下)

同製品は、従来個別に提供していた音声認識ソフト「SpeechRec」、検索・編集ソフト「CallExplorer」、チューニングソフト「ResourceTuner」を統合し、より簡易に利用できるよう開発したもの。

音声認識を活用するためには、運用開始後からの専門的なチューニング活動が不可欠であったが、セキュリティの確保やコストが音声認識導入のための課題となっていた。

今回、NTT研究所が開発した高精度の音声認識エンジン「VoiceRex」を採用し、簡単な操作(誤認識部分のテキスト修正など)で自動的に認識モデルをチューニングする機能を搭載。これにより、個人情報が含まれることの多いコールセンタの通話を、音声認識によるテキスト化からチューニングまで、顧客自身で処理することが可能となる。

Webブラウザや通話録音装置などから入力された音声データは、音声認識部でテキスト化されDB部に格納。音声認識結果は、編集/書き起こし部で誤認識などを適宜修正。この修正結果によりチューニング部で自動的に認識モデルがチューニング。これらの一連の操作は、LANやインターネットなどのNWを介してWebブラウザから行うことが可能。

「SpeechRec Plus」の構成

操作はWebブラウザで行うため、特別なクライアントソフトをインストールする必要はない。また、利用目的に応じて、オンプレミス型、クラウド型の選択が可能。本製品の導入により、これまで音声認識の導入に大きな障壁であったチューニングコストを低減し、コールセンタをはじめとした様々な分野への音声認識の普及が期待できる。

価格は、ソフトウエア・パッケージ一式で500万円(10認識プロセスまで)。クラウド型の利用料金は個別見積で提供される。