アドバンスト・メディア、AmiVoice Cloud Platformに発話者特定機能

アドバンスト・メディアは、同社の音声認識エンジンAmiVoiceをAPIを通じてWebサイトやアプリケーションに実装できる開発プラットフォーム「AmiVoice Cloud Platform(アミボイスクラウドプラットフォーム)」にて、複数の音声データから発言した人物を特定できる「話者ダイアライゼーション」機能を無料オプションで提供開始した。

AmiVoice Cloud Platform(公式Webサイト)

「話者ダイアライゼーション」は、事前学習なしで複数人が会話をしている音声データの中から特定の発言者を推定して、発言内容と発言者の紐付けを行える機能。テレワークで増加するWeb会議などの議事録や、電話営業の活動記録や社内面談の記録など複数人が参加するシチュエーションでの活用が想定される。発言者は、"speaker0"のようなラベルで表記され、特定の人物名を表記したい場合の処理は開発アプリケーション側で行う。非同期HTTP音声認識APIの無料オプションとしてのみ提供が行われる。使用法はクラウド接続時に「話者ダイアライゼーション」の有効化オプションの設定をするだけ、機能は最大3時間までの音声データのみ利用できる。今後は、同期HTTP音声認識APIや、WebSocket APIでもサービスを利用できるように開発を進めていくという。