ソースネクストは6月28日、Webアプリ「AutoMemo Home」(以下、オートメモHome)ベータ版を、今夏の正式公開に先駆けて体験できる先行体験会を開催しました。
オートメモHomeの正式公開は8月1日を予定し、基本利用は無料。オートメモ利用者がオートメモをより便利に使えるWebアプリとなります。
AIボイスレコーダー「オートメモ」とは?
オートメモHomeを紹介する前に、「オートメモ」シリーズの概要を紹介しましょう。オートメモシリーズは、録音した音声を自動で文字起こし(テキスト化)できる文字起こしAIボイスレコーダーです。
2020年12月に、録音専用でスティック型の初代モデル「AutoMemo」を発売したのち、現在は録音・再生・文字起こしができ画面も付いた「オートメモ S」を販売中。また、2022年8月にはアプリ単体でオートメモ Sと同じ機能が使える「オートメモアプリ」をリニューアル提供しています。
2023年3月からは、より高精度の文字起こしを目指すべく、音声認識エンジンの一部にOpenAI社の「Whisper」を採用。ソースネクストでオートメモを担当する辻正鷹氏は、2023年6月28日時点でのユーザー数が83,000ユーザーに達し、右肩上がりでユーザー数が伸びていると紹介しました。
「オートメモHome」はテキスト化から編集まで、1台で完結
今回登場したオートメモのWebアプリ「オートメモHome」を一言でいうと、オートメモ製品で録音した音声・テキストデータを管理し、編集や共有までブラウザだけで完結できるWebアプリです。
辻氏によると、オートメモの主要想定用途の1つである議事録の作成には、これまで録音/データ管理/文字起こし/編集/共有の5つの工程が必要で、このうちオートメモは録音/データ管理/文字起こしの3工程で活用できました。しかし、テキスト化した文字を正確に整えたり、他の人にデータを共有するには、別途ツールが必要です。
オートメモHomeは、これまでカバーされなかった編集/共有部分を補う機能を備え、今後は録音から共有まで、オートメモHomeで全て完結できるようになっていく予定です。
オートメモHomeの主な特徴は次の4つ。
自動で話者を判別する機能
文字起こしデータのテキスト編集
データを共有できる共有URLの発行
音声・テキストデータが自動連携
自動で発言者ごとに文字起こし結果を表示する「話者分離AI」は、各発言者に対してAさん・Bさん・Cさんと割り振り、発言者を分けて表示する機能です。発言者の認識は声の周波数を基にしているそうで、対面の会話やマイクを通じて人が実際にしゃべる一般的なWeb会議などであれば、高い精度で認識するとのことでした。発言者は後から名前を変えることも可能です。
また、これまでオートメモの文字起こしデータを編集するには、メモ帳やテキストエディタなどオートメモ以外のツールを使う必要がありました。しかしオートメモHomeではブラウザ上でそのまま、音声を確認しながらテキストを編集できるようになっています。
音声とテキストが連動したデータを共有する、共有URLの発行機能は、他者がデータを「閲覧のみ」できるURLを発行する機能。例えば会議の録音データの共有リンクを送ると、関係者は音声とテキストの両方を確認可能です。
データの自動連携は、すでに使っているオートメモのアカウントでオートメモHomeを利用すれば、他のオートメモ製品やアプリで録音したデータがクラウドで共有され、転送の手間なくオートメモHomeで管理できるもの。過去にオートメモで録音したデータも、オートメモHome上でまとめてリスト表示されます。
オートメモHomeは2023年4月に購入応援サイト「Makuake」で支援募集していました。今回試したベータ版は支援者に順次リターンされており、一般の人が使えるタイミングは8月1日の正式公開後となります。
現時点ではオートメモHomeでの録音はできませんが(別途オートメモ製品・アプリでの録音が必要)、今後は外部音声ファイルの取り込みや、Web会議録音、文字起こし結果にメモを付けられるメモ機能、データをフォルダで分類するフォルダ管理機能の追加を予定しています。
オートメモHomeを試してみた - 音声認識はほぼ完ぺき、話者分離は状況次第
今回、実際に「オートメモHome」のベータ版を試用してみました。使い方は、オートメモHome(ベータ版)のURLにアクセスし、普段使っているオートメモのアカウントを登録するだけ。ログイン後は、ホーム画面に過去の録音データがリスト化されて並びます。
表示されるデータの初期タイトルは「新規録音_●●(日付)」ですが、タイトル横に配置されたメニューリンクをクリックすると、タイトルの編集や共有リンクの作成、お気に入り登録、データの削除といった操作ができます。
さて、オートメモHomeの大きなポイント、書き起こしデータに話し手を表示する話者分離機能を試すべく、さっそく編集部で「犬派か猫派か」を3人(女性2人、男性1人)で話し合いし、録音・文字起こししてみました。
録音機材はスマートフォン版オートメモアプリで、「Pixel 6a」内蔵マイクで録音しています。
-
オートメモアプリで表示した、犬派か猫派かをアピールする3人の会話。オートメモでは、音声認識エンジン「Whisper」により、フィラー(あのー、ええとなどの間投詞)が排除できる機能がありますが、この会話でも見事に省略されています
上の画像はPixel 6aで録音&テキスト化された音声データ。特に声を大きくしたわけでもなく、社内で軽く雑談をするやや控えめな声量ながら、ほぼ完ぺきに会話を拾っています。
上で紹介したように、会話の話者はオートメモHomeからしか表示できません。アプリ側でクラウドへのアップロードとテキスト変換が終わったタイミングを見計らって、オートメモHomeを確認すると、データ共有の手間もなく「犬派か猫派か」の音声データがリストに追加されていました。果たして話者は表示されるのでしょうか。
実際にオートメモHomeでデータを開いてみると、前半は良好に話者が分かれていました。
しかし会話を追っていくと、途中から3人の会話がすべて一人の話者にまとまっていました。右上にある編集ボタンで、会話の内容を分割したり、話者を新しく追加したりして正しく編集した結果が下の画像です。
編集作業のUIは丁寧に作られている印象。例えば分けたいテキストの前でEnterを2回押すと、改行と同時に話者が自動で設定されます。
また、分けられた会話を統合したい時に、統合したいテキストの前でDeleteキーを2回押すと、自動で前の話者のテキストと統合される、といった操作ができ、快適に編集できました。
しかし、せっかくなので最初からしっかり話者分離されたデータを見たい! という気持ちが抑えられず、編集部員2人(女性1人、男性1人)で再チャレンジ。声を若干大きめに話したところ、今度はほぼ正確に話者が表示されました。
オートメモHomeは現在まだ開発の最中とのことで、今後デザインや機能のアップデートを予定。8月1日の正式リリースも含め、今後の展開を楽しみに待ちたいところです。