専用ボイスレコーダーを売ってるのに、スマホで録音できる「オートメモ」をソースネクストが発売する理由とは？

ソースネクストのAutoMemoシリーズ。左から「AutoMemo」（2020年12月発売）、「AutoMemo S」（2022年1月発売）、「オートメモ」アプリ（2022年8月アップデート）

ソースネクストの自動文字起こし機能付きボイスレコーダー「AutoMemo（オートメモ）」や「AutoMemo S（オートメモエス）」の機能が、スマートフォンでも利用できるようになりました。ハードウェアを持っていなくても、専用アプリで直接録音した音声データがクラウドに送られ、AIを用いて自動で文字起こしされます。

月1時間まではベーシックプランとして無料で利用でき、30時間まで利用できるプレミアムプラン（月額980円）のほか、都度チャージして利用する10時間チャージ（1,480円）と100時間チャージ（14,000円）が選べるしくみ。

利用料金は従来通りですが、スマートフォンで使えるようになったら、ハードウェアが売れなくなってしまうのでは？「オートメモ」シリーズを担当する、辻正鷹さんにリリースの狙いを聞きました。

ソースネクストプロダクトディビジョン企画グループグループマネージャー辻正鷹さん

今回のインタビューを「AutoMemo S」（左）と、iPhoneにインストールした「オートメモ」アプリ（右）で録音してみた

「AutoMemo S」で録音したデータも、iPhoneの「オートメモ」アプリで録音したデータも同様にテキスト化され、アプリでまとめて管理できる。テキスト化したデータを自動でバックアップすることも可能（写真左）
テキスト化された内容は、iPhone（写真中央）でも「AutoMemo S」（写真右）でも、ほぼ同様の結果だった

「普通に使える」「ちゃんと使える」が褒め言葉

――まず、現在発売中のハードウェアの販売状況や、ユーザーの反響について教えてください。

おかげさまで2021年末に発表した「AutoMemo S」が好評で、サービスの累計アカウント数も3万を突破しました。

ユーザーさんからも様々な声をいただいていますが、うれしいのが「ちゃんと使える」という言葉です。こういった新しいデバイスって、実際に使ってみるまでは不安だし、抵抗もあると思うのですが、「ちゃんと使える」「普通に使える」といった言葉を聞くと、我々が作りたかった価値がしっかり届いているとうれしくなりますね。

具体的な数字は公表していませんが、サービスをご利用のお客様の離脱率も少なく、そういう意味では全般的に満足していただいているのかなと感じています。

――今回、ハードウェアがなくてもスマートフォンだけで録音から自動文字起こしまで利用できるようになりましたが、その反響とリリースの狙いを教えてください。

こちらも具体的な数字は公表していませんが、ダウンロード数やアカウント数は、過去のハードウェアのリリース時と比べても遜色がないくらい伸びていて、スタートとしては非常に良かったと思っています。

目指しているのは、より多くの人に「オートメモ」のサービスを使っていただくことなので、そのためのタッチポイントを増やしたいと考えました。自動で文字起こしができるだけじゃなく、データをまとめて管理できるオートメモの世界観に、いろんな形で触れていただければと思っています。

ハードウェアが売れなくなるという「心配はない」

――今後、ハードウェアが売れなくなるという心配はないのでしょうか？

実際にどのような影響があるかは今後を見ていく必要がありますが、正直なところ、私自身はほとんど心配していません。というのもこれまでの分析から、「AutoMemo」や「AutoMemo S」を購入いただいているのは、ハードウェアとしてのボイスレコーダーを必要とされている方だとわかっているからです。

たとえば、役員会議のような場面ではスマートフォンで録音がしづらいなど、シーンによっても、ボイスレコーダーとスマートフォンを使い分けたいというニーズがあると思います。そういう場合に「オートメモ」では、どちらで録音しても同じようにデータを扱えるので、価値を感じていただけると思います。

――社内で反対の声はなかったのでしょうか？

そうですね。社内でも激しく議論したということはありません。確かに反対の声があっても不思議ではなかったかもしれませんが、「オートメモ」の持ってる本質的な価値を届けようと思ったら、いろんなタッチポイントがあった方がいい。「選択肢が増える方がユーザーさんにより便利に使っていただける」ということは、すぐにコンセンサスがとれました。

タッチポイントが増えることで、逆にハードウェアの販売に関しても、ポジティブな影響があるのではと期待しています。

これまではハードウェアが必要だった「AutoMemo」シリーズ。8月末からはアプリ単体での録音・テキスト変換が可能になった

「オートメモ」アプリはユーザーに接するタッチポイントが増えることで、ハードウェアにも好影響があるのでは、と辻さん

――「AutoMemo」や「AutoMemo S」での録音と、スマートフォンのアプリでの録音で、機能的な違いはありますか？

いろいろな機種でテストした中で、最終的な認識の精度に大きな違いはないということは確認が取れています。

もちろん、機種によってマイクの性能などの違いはあると思いますし、一定の環境下、たとえば話者とハードウェアの距離が遠かった場合に、スマートフォンによっては音が拾えない可能性はあると思います。そういった意味では専用端末の方が、アドバンテージがあるかもしれません。

開発のきっかけは「ポケトーク」の言語認識機能から

――そもそも「オートメモ」というサービスは、どのような経緯で誕生したんですか？

きっかけはAI翻訳機の「ポケトーク」でした。翻訳の前段階として、喋った言葉を認識する必要があり、その開発の過程で音声を認識して文字に起こすためのノウハウが社内に蓄積されていたんです。

「これを使って何か別の困りごとを解決できないか」というところからスタートして、会議の議事録作成に使えるボイスレコーダーを製品化することになりました。

最初はボイスレコーダーの進化形として、ハードウェアだけを考えていたのですが、実際にユーザーさんの声を聞いていくと、過去に録音した音声データを文字起こししたいとか、端末を問わず使いたいというニーズがありました。そこで「オートメモ」を、クラウドサービスとして提供していくことにしたんです。

――自動文字起こしサービスには競合も多いですが、「オートメモ」の強みは？

強みは大きく2つあると思っていまして、1つは音声認識の精度です。社内でさまざまなベンチマークを行っていますが、我々のサービスは他社と比べて認識精度が高いです。

もう1つの強みは、ハードウェアを問わず利用できること。ボイスレコーダーの「AutoMemo」や「AutoMemo S」をお使いの方も、スマートフォンを使った録音も、同じ1つのアプリでデータを管理していただけますし、メールでの自動送信やクラウドへの保存を通じてPCでも活用できます。認識精度もそうですが、このようなシームレスな連携も、ユーザーさんに評価いただけているのではないかと思っています。

――ちなみに、音声認識のエンジンは何を使っているのですか？

申し訳ありません、今は公表していません。ただ、会議を録音した時の音声認識性能が最も良いエンジンを選んで利用しています。それだけではなく、蓄積してきたノウハウをもとに独自のAIを組み合わせて、精度を向上させています。

新機能は数カ月に1度ペースを想定。ビデオ会議連携に期待

――今後のアップデートについて教えてください。強化していきたい機能などはありますか？

会員サイトを通じていただいたユーザーさんの声を、チームで毎朝共有しているのですが、その声に1つでも多く、早く、課題の解決に努めていきたいというのはもちろんあります。まずは認識精度を上げていくこと。基礎力を高めて、ユーザーさんの使い勝手を上げていくことが最大のテーマだと思っています。

あとは認識したテキストを編集できる機能や、複数の話者を認識して分離すること、専門用語を辞書のように登録できるようにするなど、いろいろなことを検討しています。特に専門用語は業界、業種、企業によっても異なるため、AIに学習させるにも限界があります。個別辞書のようなものは必要になるのかなと想像しています。

現段階では具体的なことは申し上げづらいのですが、ロードマップに沿って数カ月に1度くらいのペースでは、新機能をリリースできるような開発体制を整えているので、今後の進化に期待していただければと思います。

――引き続き、ハードウェアの開発も続けていくのでしょうか？

もちろん、端末に関しても検討はしています。「AutoMemo S」は好評をいただいていますが、ハードウェアは時代とともに陳腐化していくので、ソフトウェアが進化したら、ハードウェアもどこかのタイミングでアップデートしないと、追いつかなくなるときが来ると考えています。

またスマホのアプリで録音ができるようになったからといって、アプリ1本でいくのは、いろいろなデバイスのデータをシームレスに扱えるというオートメモの精神からもずれると思います。ハードウェアをきちんと進化させていくのは必要なことですし、今後さらにタッチポイントを増やしていく可能性もあると思います。

――そのタッチポイントの中には、たとえばビデオ会議との連携なども含まれていますか？

可能性はあると思います。すでに「AutoMemo S」をスピーカーの前に置いて録音したり、PCと有線でつないだり、別のアカウントで会議に参加して録音するといった方法で、活用されているケースもあります。また、ブラウザから録音済みの音声データをアップロードして、文字起こしができる機能も提供しています。

「オートメモ」という名前には、自動的に文字起こしができるだけでなく、データの保存や管理も自動的にできるという思いが込められています。

わざわざデータをコピーしたり、移したりしなくても全部自動でできる。どんなハードウェアでもアプリでも、データが一元管理できるのは大きな差別化のポイントなので、今後もその使い勝手を良くする努力は続けていきますし、タッチポイントも広げていきたいと思っています。

――ありがとうございました。