アドバンスト・メディアは4月2日、音声認識APIを提供する開発プラットフォームである「AmiVoice Cloud Platform(アミボイス クラウド プラットフォーム)」をアップデートし、領域特化型の音声認識エンジン3種を追加公開した。Webサイトから申し込みと利用が可能。

同APIの利用により、クライアントアプリケーションに特別なライブラリを組み込むことなく音声認識機能を実装できるといい、音声文字化や音声対話、音声制御、音声翻訳など、アプリケーションやWebサイトなどの各種サービスに使用できるという。

  • AmiVoice 音声認識APIのイメージ

従来から提供している「汎用エンジン」に加え、新たに「医療汎用エンジン」「業務報告_製薬エンジン」「業務報告_金融エンジン」の3つの領域特化型エンジンの音声認識APIを提供開始した。

いずれも、リアルタイム処理/バッチ処理/音声データのログ保存の選択が可能。支払いは発話区間のみで1秒単位で計算、ビジネスユース向けの言語フィルタリングの搭載、ユーザー自身が精度向上を図れるカスタマイズ単語登録の搭載、音声認識APIをすぐに体験・開発できるサンプルプログラムの用意といった特徴を持つ。

汎用エンジンは、幅広い用途で利用可能という汎用の音声認識エンジン。音声入力を使ったアプリケーションや各種書き起こし等、ビジネスシーンに適するという。

双方向型のディープラーニング技術である「Bi-LSTM(Bidirectional Long Short-Term Memory)」を実装し、従来の音声認識エンジンと比較して同社調べでエラー改善率が最大で25%と、自然発話を中心とした認識率が大きく向上したとしている。

初月無料使い放題(20日以降の申し込みは翌月まで無料)、毎月60分まで無料で使用可能とのこと。

従量課金は、ログ保存ありの場合で0.025円(税別)/秒、ログ保存なしの場合で0.04円(同)/秒。

医療汎用エンジンは、一般的なビジネス用語に加えて病名・症状・薬品名などの医療用語を予め登録した、医療向けの音声認識エンジン。

利用料金は、月間1時間プランにおけるログ保存ありの場合で月額300円(同)、ログ保存なしの場合で同480円(同)。

この他、月間100時間プランと300時間プランがある。プランの利用時間を超えた分は従量課金となる。

業務報告_製薬・金融エンジンは、日報や業務報告書の音声入力などで利用可能な音声認識エンジンであり、一般的なビジネス用語に加えて製薬・金融業界向けの用語を搭載する。

業務報告_製薬エンジンと業務報告_金融エンジンの利用料金は、月間1時間プランにおけるログ保存ありの場合で月額600円(同)、ログ保存なしの場合で同960円(同)。

いずれもこの他、月間100時間プランと300時間プランがある。プランの利用時間を超えた分は従量課金となる。