カシオ計算機がiOS向けボイスレコーダーアプリ「キーワード頭出し ボイスレコーダー」を発表した。独自の音声キーワード検索技術を使い、録音音声を簡単に検索して聞き直しができるというアプリで、単なる「録音」だけでなく「録音の活用」を目指した製品だという。

今回話を聞いたカシオ計算機 コンシューマ事業部企画部アプリ企画推進室の田中孝浩氏

独自の音声キーワード検索技術がどんなものなのか、「キーワード頭出し ボイスレコーダー」を企画・開発したカシオ計算機 コンシューマ事業部企画部アプリ企画推進室の田中孝浩氏に話を聞いてきた。

―― 「キーワード頭出し ボイスレコーダー」とは、どんなアプリでしょうか?一般的なボイスレコーダーと異なる点を教えてください。

「聞き直しの時間を大幅に短縮する」というのがテーマのボイスレコーダーアプリです。音声キーワード検索機能を搭載している点が特徴で、録音した音声の中から特定の発言を検索することができます。

例えば、弊社の製品発表会を録音した音源で、「カシオ」と発言しているところから再生したいとします。その場合、検索窓に「かしお」または「カシオ」とかな入力するだけで、音源の中から該当箇所を検索することができます。検索結果は、検索キーワードと似ている順にリストで表示され、上位の結果から再生していくと、「カシオ」と発言している箇所を、次々に頭出し再生できます。録音時間が長い音源でも簡単に聞きたい部分を探せるわけです。

「キーワード頭出し ボイスレコーダー」の利用イメージ。画面上部の検索窓にキーワードをかな入力すると、類似部分を検出できる

また、音声キーワード検索機能の高速性もポイントです。最新の端末では検索結果が5秒程度で出力できます。

このほか、音声が検出されていない無音を飛ばして再生時間を短縮する「無音スキップ」という機能も搭載します。ほかにも、音の高さを変えずに再生速度を変えたり、ノイズキャンセリングの機能を搭載したり、指定秒数のスキップ機能も備えています。

さらに、録音・再生時にマークやメモを貼り付ける「タグ付け」もできます。「キーワード頭出し ボイスレコーダー」のタグ付けでは、時間をさかのぼってマークすることができる点が特徴です。録音中にiPhoneがスリープ状態になっていて、マークしたい部分にタグ付けできなかった―― といった場合でも、「キーワード頭出し ボイスレコーダー」であれば、「10秒さかのぼってマークをつける」ということが可能です。

―― 音声キーワード検索技術とはどういうものですか? 詳しく教えてください

「キーワード頭出し ボイスレコーダー」では、録音した音声を”テキスト化”して、その中から検索したいキーワードを探すのではなく、検索ワードを”音声特徴化”し、録音音声と照合して検索している点が特徴です。

テキスト化して検索する場合、その音声が何なのか“テキスト“として確定する必要があります。この確定したテキストが検索したい言葉と異なると、もちろん正しく検索できません。ですがキーワードを”音声特徴化”して検索する場合は、録音した音声と音響的に類似するキーワードも探すことができ、発音が曖昧であっても検索することができるんです。この技術を、高精度かつスマートフォンでも動作するような少ない演算量で行うにあたり、カシオの電子辞書の音声圧縮「TRUE VOICE」で培った経験が反映されています。

―― 録音環境はどのぐらい検索精度に影響しますか。

大きな会議室やイベントホールでマイクを使ったような環境でも検索はできますが、もちろんキレイな音声が理想です。雑音が多かったり、バックに音楽が入ったりした場合には精度が落ちます。

―― ひとつの録音音声で話者が異なる場合や外国語が混じっている場合でも検索できるのでしょうか?

話者が違う場合でも検索可能です。イントネーションや男女の声色が違う場合でもキーワードを検出することができます。ですが、外国語については、エンジンに日本語の音声特徴データを使用している関係から、上手く検出できません。

例えば「ソリューション」と日本語発音なら検索できますが、ネイティブの英語の発音だと検出できません。外国語対応については、やりたいと思っています。「for English」といったように、別アプリで提供できたらいいですね。

―― このほか、使い勝手でこだわった点はありますか?

検索窓は、開発当初は1タップしてから表示するようにしていましたが、そうするとキーワードを検索するまで時間がかかってしまうため、画面の一番上に常時表示するようにしました。

―― 今回はiOS向けのみですか、Androidスマートフォンへの展開は考えていますか?

Android対応は技術的に難しくはないのですが、まずはiOSでいいものを作って、これが洗練されたらAndroidもと考えています。 具体的なスケジュールは、今回のiOSアプリの反応を見ながら考えていきたいと思います。

―― 最後に「キーワード頭出し ボイスレコーダー」がどういったユーザーにオススメか教えていただけますでしょうか?

「キーワード頭出し ボイスレコーダー」は、ボイスレコーダーを使う人の多くが、喜んでくれる機能を搭載しています。社会人であれば、会議などで活用できると思います。重要な議題を音声キーワード検索でスムーズに探すことができます。同様に学生の講義などでも活用できるでしょう。特に学生には、ぜひ使ってほしいと考えています。そのため、4月30日まで通常600円のところを360円の特別価格で提供しています。

本稿で紹介した通り「キーワード頭出し ボイスレコーダー」は、カシオがこれまで培った技術力をもとに開発した音声キーワード検索機能が特徴だ。同機能を利用すれば、一般的なボイスレコーダーではできないスムーズな頭出しが可能。大学生の反復学習やビジネスシーンでの議事録作成などに便利に活用できるだろう。この4月から、新たな生活をスタートした学生・社会人は、ダウンロードしてみては、いかがだろうか?