ソースネクストは3月14日、AIボイスレコーダー「AutoMemo(オートメモ)」の音声認識エンジンの一部に、ChatGPTで知られるOpenAIの音声認識エンジン「Whisper」を採用すると発表した。適用は3月15日から。

  • AutoMemo(オートメモ)

「オートメモ」は、録音した音声ファイルを文字で確認できるAIボイスレコーダー。2020年12月の初代モデル発売以来、2023年2月末時点で登録累計アカウント数が60,000を超えたという。現在は専用デバイス「オートメモ」「オートメモS」の2つに加え、スマートフォン用アプリ「オートメモ専用アプリ」の計3種類を提供している。

音声からテキストに変換する音声認識エンジンは、オートメモ用に複数のエンジンを組み合わせ最適化しているが、今回、音声認識エンジンの一部に、AIチャットボット「ChatGPT」で知られるOpenAIの音声認識モデル「Whisper」を採用。これにより、複数人での音声や、マイクから離れた小さな音声の認識精度が向上する見込みだ。また、「あー」や「ええと」といったフィラー(つなぎ言葉)の除去にも対応し、全体の文字起こし精度も向上するという。

  • エンジン変更前と変更後における音声認識の違い(イメージ)

「オートメモ」の文字起こしサービスは毎月1時間まで無料利用できる。有料プランとしては、毎月30時間までテキスト化できる月額プラン(月額980円)/年額プラン(年額9,900円)、1回のチャージで10時間分テキスト化する10時間チャージ(1,480円)、1回のチャージで100時間分までテキスト化する100時間チャージ(14,000円)が提供されている。