ソースネクストは9日、録音した音声を自動でテキスト化するAIボイスレコーダー「AutoMemo(オートメモ)S」を発表しました。

名刺サイズのコンパクトなボディに2.83インチのディスプレイを搭載し、録音状況や文字起こしの結果などがチェックできるようになっています。発売日は2022年1月21日で、価格は24,800円。都内で開催された発表会では、このほか「ポケトーク字幕」の新展開についても紹介がありました。

  • ソースネクストがAIボイスレコーダー「AutoMemo S」やポケトークブランドの新展開を発表。イメージキャラクターの小池栄子さんがアピールした

AutoMemo Sの概要 - どこが進化した?

AutoMemo Sはサイズ92×54×12mm、重さ約88gと、ジャケットの胸ポケットに入ってしまうほどコンパクトな製品。2.83インチのディスプレイはタッチパネルに対応しており、テキスト化された文章から聞きたい箇所を選んで録音データを聞き返す、キーワード検索する、といった操作も可能になりました。

  • 手のひらに納まるサイズ感

文字起こしに対応する言語数は日本語、英語、中国語などを含む計72言語。翻訳機能はなく、一度の録音でテキスト化できるのは1言語のみです。録音したデータはWi-Fiでクラウドにアップロードされるので、容量を心配する必要もありません。

  • 上端にはスピーカーとマイク、下端にはイヤホン端子、充電端子のUSB Type-C、マイクなどを搭載。バッテリーは1,800mAhで、録音時の電池持続時間は約16時間

上端にはスピーカーとマイク、下端にはイヤホン端子、充電端子のUSB Type-C、マイクなどを搭載。バッテリーは1,800mAhで、録音時の電池持続時間は約16時間。

  • 新エンジンの採用により、文字起こしの精度は90%まで改善。担当者は「日々、AIも進化しています。現時点で最善のものを採用しました」と解説していた

このほかAndroid / iOS端末と連携することで、スマホの専用アプリでもテキストのチェックが可能に。テキストや録音データをメールで転送したり、Dropbox、OneDrive、GoogleDriveに自動保存する、といった機能も利用できます。

  • 現行モデル「AutoMemo」との大きさ比較。ディスプレイが搭載されたことで、操作に迷うこともなくなりそう

ソースネクストでは、本製品のために料金プランを用意しています。毎月1時間までの録音データをテキスト化できる「ベーシックプラン」は無料、毎月30時間までの録音データをテキスト化できる「プレミアム」は月額980円となっており、1回のチャージで10時間の録音データをテキスト化できる「10時間チャージ」も1回1,480円で提供します(余った時間は翌月に繰り越し可能)。

  • ベーシックプラン、プレミアム、10時間チャージの料金プランを用意

最後に、担当者は「日本企業のテレワークやWeb会議の生産性を上げ、皆さんが快適に過ごせるサービスを今後も開発していきたい」とアピールしていました。

リモート会議の翻訳、本体なしで使えるように

このあとソースネクスト 代表取締役会長 兼 CEOの松田憲幸氏が登壇。リモート会議を瞬時に翻訳して画面に字幕表示させる「ポケトーク字幕」のアップデートについて紹介しました。

以前、マイナビニュースではAI通訳機「POCKETALK」本体と一緒に使う現行バージョン(2021年9月から提供中)を紹介しましたが、2022年1月からPCのみで利用可能となります。

  • ソースネクスト 代表取締役会長 兼 CEOの松田憲幸氏

ポケトーク字幕は、Windows / Mac向けのソフトウェアとして開発されました。Zoom / Skype / Microsoft Teams / Googleハングアウト / LINE / Slackなどのリモート会議システム上で、スムーズにカメラ映像に字幕を合成表示できます。

対応言語は82言語。自分が話した言葉は同時に最大2言語に翻訳できるため、最大3カ国語間のコミュニケーションが可能になります。

  • 普段から使っているリモート会議システムにも対応しているのが嬉しい

  • 3カ国の人と同時に会話できる

そして、驚いたのが翻訳速度です。ソースネクスト調べでは、他社の一般的な自動翻訳サービスと比べて3.2倍以上も速く翻訳・表示できるとしています。

例えば音声の長さが0.90秒間だった場合、話し終えてから翻訳結果が表示されるまでの時間について、他社製品なら1.76秒~1.87秒はかかりましたが、ポケトーク字幕では0.55秒で瞬時に結果が表示できたそう。

タイムラグがないので、会話もスムーズにテンポよく進んでいくことが予想されます。筆者も会場でデモを見ましたが、その速度は、まるで字幕付きの映画でも見ているかのようでした。

  • 驚異的な翻訳速度

会場で披露されたポケトーク字幕の実演 ※音が出ます

提供時期についてはWindows版が2022年1月、Mac版が2022年2月を予定。利用にはサブスクリプションの契約が必要で、料金は月額1,100円、年額13,200円となっています。なお2022年3月末までは無料で利用できるので、気になる方はこの機会に試してみると良いでしょう。

ソースネクストでは、ポケトーク字幕をPCのソフトウェアとして海外でも販売していく方針。松田氏は「これまで我々は『言葉の壁をなくす』というミッションに取り組んできましたが、少しずつ崩せてきたかな、という実感があります。コロナ禍のコミュニケーションは対面からオンラインに変わりました。また、同時通訳の人に頼んだ場合、(相手が話し、通訳して)時間が2倍かかるので、そんなシーンでも活用してもらえたら。翻訳ソフトウェア市場のグローバルリーダーを目指していきます」と抱負を語りました。

オフラインでは使えないの? 機能拡張は?

最後に質疑応答の時間がもうけられ、記者団の質問に松田氏らが回答しました。

AutoMemo S、AutoMemoはオフラインでは使えないのか、という質問に、技術戦略室の川竹一氏は「録音だけなら可能」と回答。

「オフラインで録音はできます。テキスト化する際には、Wi-Fiなどでクラウドにアップロードしてもらう仕様になっています。一度、テキスト化すればオフラインでも確認できます。ボイスレコーダーのように再生もできます。オンラインで使うことでより便利になる、という方向性で、今後も機能を拡張していきます」と答えました。

単語、用語の登録機能があればいいのに、という声については「現在のところ登録機能はありませんが、今後、ユーザーからのご要望を聞きながら改善していければ」と答えていました。

  • ソースネクスト 技術戦略室 常務執行役員 兼 CTOの川竹一氏

Googleなど、無料の翻訳サービスにどう対抗していくか、という質問では、松田氏は「Googleさんのサービスは、これまでも無料で使えていました。ポケトークは後発です。でも売れている。そこにニーズがあると思います。例えば、法人で翻訳機が必要な場合、『個人のスマホを使って』とは言えません。BtoBの現場では、そのあたりにも優位性があると感じています」としました。

PCソフトウェア版のポケトーク字幕では、専用端末が必要なくなりました。今後、ハードウェアとソフトウェアの売上構成比は、どうなっていくのでしょうか。そうした趣旨の質問に川竹氏は「プロモーション次第」としつつも「今後2~3年後には、ソフトウェアの売上のほうが大きくなるのでは」との見方を示しました。