日立製作所(以下、日立)は12月18日、野村證券の全国約160ヵ所の営業店や本社で利用する約26,000台の電話機の通話録音データを対象に、大規模な音声テキスト化システムを構築したことを発表した。

  • 音声テキスト化システムの概要図

    音声テキスト化システムの概要図

同システムは、雑音に強い独自のDNN型音声認識エンジンにより、日立の音声認識技術「Speech Recognition Platform」を活用し、日々の膨大な録音データを自動でテキスト変換し、顧客への応対品質向上と通話モニタリングの効率化を支援するもの。テキスト化された大量のデータは、日立が構築したHadoopデータ処理基盤で蓄積される。

通話録音システム「RecwareⅢ」と音声認識基盤をシームレスに連携し、通話録音データとテキスト変換されたデータを紐付けることで、両データを同一画面上で一覧表示して操作が可能。確認したい通話音声をキーワード検索で絞り込み・特定できるため、通話内容の確認作業を効率化するという。

また、音声認識基盤は、声の大きさ、速度、話者間のかぶり、会話の間といった非言語情報を抽出・定量化する機能も備え、テキスト化される言語情報以外からも会話の状況や特長を捉えることができるということだ。