説明書を読まなくても使い方がわかるのが、iPhoneの魅力であり強みです。しかし、知っているつもりでも正しく理解していないことがあるはず。このコーナーでは、そんな「いまさら聞けないiPhoneのなぜ」をわかりやすく解説します。今回は、『アプリがSiriに対応すれば、なんでも言葉で命令できるの?』という質問に答えます。

***

アプリがSiriに対応すれば、なんでも言葉で命令できるようになる……ということはありません。Appleが開発者向けに公開している文書によれば、Siriから呼び出せるサードパーティー製アプリの機能は音声/映像の呼び出しとメッセージング、Apple Payによる決済、写真の検索、乗車予約と運動管理に限定されています。

iOS 10で導入された「SiriKit」と呼ばれる開発フレームワークを利用すると、Siriのインターフェイス -- ホームボタンを押すか「ヘイ、シリ」と呼び掛けることをきっかけに音声の聞き取りを開始し、命令として認識する一連の処理 -- を利用できるようになりますが、クラウド上に存在するSiriの音声認識エンジンが判定できる音声パターンは限定的です。そのため、前述したような音声/映像の呼び出しとメッセージングなど、機能が限られると考えられています。

将来的には、利用できる機能/言葉が増えるものと予想されますが、結局のところAppleが定めたフォーマットに沿うことになります。人間の話し言葉は、同じ言語といえど個人差/地域差が大きいこともあり、人間が言葉を聞き取り対応するレベルへ到達するにはしばらく時間がかかりそうです。

ところで、音声をテキストに変換する機能を備えたアプリの開発も可能になりましたが、これはSiriKitとは別モノです。iPhoneへ命令するのではなく、いわゆる"文字起こし"の機能であり、Siriとは異なり記録済の音声(サウンドファイル)をもとに文字起こしすることも可能です。従来のiOSにあったソフトウェアキーボードのマイクボタンで始める音声入力機能が、キーボードの表示なしにアプリから呼び出せるようになった、と理解すればいいでしょうか。アプリのSiri対応とは似て非なる機能なのです。

iOS 10では、Siriからサードパーティー製アプリを呼び出せるようになりましたが、利用できる機能は限られています