Googleは2019年春から聴覚障害を持つ方もAndroid端末が快適に使えるように、音声をテーマにしたユーザー補助機能を次々に強化しています。

8月21日、Google Japanはユーザー補助機能を強化する狙いと、年内の追加を予定する2つの新機能を記者に向けて説明しました。

  • Googleの音声文字変換アプリ。スマホのマイク近くで話すと、音声をリアルタイムでかなり正確にテキスト化し、会話や音声を「見える化」できます

Googleの音声文字変換アプリが機能拡充

Android Accessibilityは、Android端末のユーザーインターフェースをより快適に操作するために設けられた各種補助機能です。Google純正スマホ「Pixel 3」「Pixel 3a」(XLを含む)端末にはプリインストールされており、その他のAndroid端末ではGoogle Playストアからアプリをダウンロードして使えるものが用意されています。

Google本社でAccessibilityを担当するBrian Kemler氏は「これまで視覚や身体に障害を持つ方のための補助機能からすべてのAndroid製品に搭載してきたが、技術が成熟を迎え、万全の準備が整ったことから、聴覚障害をサポートする機能にいま注力している」と説明しています。2019年の2月には「音声文字変換」と「音声増幅」の機能が先行スタートしています。

  • Googleのユーザー補助(Android Accessibility)の機能拡充に関する記者説明会が開催され、Google本社のAccessibility担当プロダクトマネージャーであるBrian Kemler氏が最新状況を説明。今後追加を予定する新機能を発表しました

スマホ上の全音声コンテンツに字幕をつける

音声文字変換」は、Androidスマホのマイクで周囲の音をモニタリングして、人の会話のみをピックアップしながらリアルタイムでテキスト変換するものです。

英語だけでなく日本語を含む70以上の言語に対応。Android 5.0以降の端末で利用できます。2019年の6月に実施された機能アップデートにより、動物の鳴き声や口笛、拍手など60種類を超える周囲の音も識別して、端末の画面上に可視化できるようになりました。「聴覚に障害を持つ方が人との会話だけでなく、音を通じて周囲の状況を把握できるようにするために必要な機能」と考えて機能を拡充したとKemler氏は説明。

音声変換機能はGoogleの最新の音声認識と人工知能、機械学習の技術により開発されたため、人の声と環境音が正確に識別できることが特徴だといいます。

実際に使ってみると日本語のテキスト変換処理がまだ英語に比べて若干おぼつかない感じもあります(特に、マイクから離れた場所の音声の場合)。Kemler氏は「言語ごとに機械学習のアルゴリズムにまだばらつきがあることは認識している。Googleではこれからも各言語について処理精度を上げていくことに全力を注ぐ」といいます。

  • 2019年は聴覚障害を持つ方々のため、音に関連するユーザー補助機能がハイペースで強化されています

  • Googleアシスタントの自然言語処理、スピーチtoテキスト変換の機能もベースにして開発された音声文字変換

説明会では、この音声文字変換から派生した「Live Caption」という新しいユーザー補助機能がいま開発中であることが、改めてアピールされました。これは「Android端末からアクセスできる音声付きコンテンツにキャプション(字幕)を付けられる機能」で、例えばSNSに公開されている動画や、メッセージアプリに添付された音声まで幅広いターゲットが想定されているようです。年内の提供開始が予定されていますが、最初に使えるようになるのは英語からの見込み。日本語の対応は現時点では未定とのことでした。

  • 動画や音声メッセージにリアルタイムに字幕をつけて、音声情報を可視化できる「Live Caption」は年内に英語から対応するかたちで提供予定

スマホで拾った音をブーストする「音声増幅」

音声増幅」はAndroidスマホのマイクでピックアップした音声から、ユーザーが聞きたい音にズームインして、より明瞭に聴けるようにブーストする機能です。Android 6.0以降を搭載するスマホの、3.5mmヘッドホンジャック、またはUSB端子に有線接続のイヤホンをつないで利用できます。

筆者もこの機能をPixel 3a XLで試してみましたが、周囲の環境ノイズをフィルタリングして聞こえにくくする機能も統合されているため、人の声が立体的に迫ってくる独特の効果が感じられました。最近のワイヤレスヘッドホン・イヤホンに搭載されているアクティブ・ノイズキャンセリング機能や外音取り込み、通話音声のクリアボイス機能と似ているとも言えそうです。Googleの場合は独自に開発した機械学習のアルゴリズムを駆使することで、人の声を高精度にピックアップしているそうです。

  • スマホの内蔵マイクでピックアップした音声を聴きやすくするための増幅機能

  • 有線イヤホン・ヘッドホンから対応。聴きたい音をブーストしたり、ノイズ低減処理が行えます

次世代Android Qは補聴器と連携

Kemler氏はこの音声増幅と同じコンセプトをベースにしたという、新機能の「Hearing Aid Support(補聴器連携)」機能を開発中であることも、改めて紹介しました(Live Captionとともに、5月の開発者イベント「Google I/O 2019」で発表)。年内に正式リリースが予定されているAndroidの次期バージョン「Android Q」から提供が開始されるといいます。

こちらはBluetooth対応の補聴器をAndroid端末にペアリングして、通話や音声付きコンテンツ全般の聴取補助に活用するというものです。従来は補聴器とAndroid端末との間に重く、バッテリーの消費効率もあまり良くない専用アクセサリーをつなぐ必要がありました。新たに補聴器連携が実現すると、Bluetoothワイヤレスイヤホンと同じような感覚で補聴器をAndroidプラットフォームに接続できて、しかもBLE(Bluetooth Low Energy)のチャンネルプロトコルを使うため消費電力が低く抑えられるそうです。

本機能を実現するために、Googleは世界のメジャーな補聴器メーカーと協力しながら機能のブラッシュアップに力を入れてきたといいます。その結果、遅延の少ない安定したワイヤレス伝送と快適な使い心地を実現できたとKemler氏が強調していました。

  • Android Qから端末にBluetooth対応の補聴器を直接つないでオーディオ機器のような使い方が可能になります

音声増幅は普通のイヤホンでも使えるようになる?

Kemler氏は「世界中の人々がGoogleの製品を使って、あらゆる情報へスムーズにアクセスできる環境を実現することが当社の最大のミッション」であると語っています。

例えば音声増幅の機能はAndroid端末とワイヤレスイヤホンもペアリングして使えるようになれば一段と便利に感じられそうです。スマートウォッチやヘッドセットなど、マイクを内蔵してスマホレスでも使える独自のウェアラブルデバイスに展開しても多くのユーザーに歓迎されるのではないでしょうか。

Kemler氏に訊ねたところ「直近でいつそれを実現するということは言えないが、そこが私たちのテクノロジーが向かうべき方向であることは間違いないと考えている。今後はハードウェアやチップセットの性能がさらに向上していくものと思う。Android Accessibilityによるユーザー補助機能のエコシステムも、さらに多くの機器とサービスに広げながら当社のミッションを実現していきたい。また様々な障害を抱える方々のために、ユーザー補助機能の拡大についても積極的に図っていく」と抱負を語っていました。

例えば音声文字変換の機能にはGoogleアシスタントにも利用されている自然言語処理の技術が使われていたり、Andoridに関連する技術はすべてのデバイスが密接に関係しながら日々進化を遂げています。

すべてのGoogleのデバイスを使うユーザーが便利に使える画期的な機能が、元はユーザー補助から生まれたものだったということが、これから次々に起きることも十分に考えられると思います。