高い消費電力が必要なはずの"音声認識技術"

新型iPhoneである「iPhone 3GS」が6月26日に日本でも発売となった。オートフォーカスカメラだけではなくビデオも撮れる、操作応答性が2倍速くなった、GPSのデジタルコンパス機能が付く、Web検索も可能、電池が長持ちという機能だけならエレクトロニクス的な観点からの目新しさはさほどない。

6月26日より発売を開始した次世代iPhone「iPhone 3GS」

しかし、これまで以上に楽しくなった。スマートフォンにパソコン並みの操作性を持ちこみ、コピー&ペーストもできるようになった。マウス代わりにタッチスクリーンに指で指定すればパソコン同様、カット・コピー・ペーストができる。こういった機能拡張の中でも特筆すべきは"ボイスコントロール機能"だ。これは音声認識技術を使ったものであり、これまでは高性能なコンピュータでなければ認識処理できないため携帯電話には使えなかった。音声認識処理の消費電力が大きくなりすぎたからである。

このボイスコントロール機能では、アドレスブックにある名前か電話番号を言えば電話をかけてくれる。さらに音楽を聴きたい場合には、曲名や歌手名を発声すれば目的の曲を聞くことができる。お気に入りの曲を「お気に入り」といえば流してくれる。逆に流れている曲名を忘れてしまった時に「曲名はなんだっけ?」といえは曲名を答えてくれる。

Appleはどうやって音声認識技術の消費電力を下げたのだろうか。そもそも音声認識技術は、マイクを通して入力した音声と、あらかじめ登録しているデータベースの言葉とを比較・参照しパターンマッチングするという技術である。コンピュータに登録してある音声データのパターンは、入力してくる音声のパターンとさまざまな点を詳細に比べる。音声は、たとえ1つの単語でも複雑な信号からなり、人によっても微妙に違いがある。それを言葉としてマッチングをとり一致するとみなせばその音を認識する。このためには高性能のコンピュータをぶんぶん動かさなければならない。結果として、その消費電力は高くなるなのである。しかし携帯電話に組み込み活用するためには消費電力の低減は欠かせない。

同社がスマートフォンに使える程度まで消費電力を下げた技術とはどういうものなのか。これまで同社は内部の技術については決して自ら公開してこなかった。筐体に収めたハードウェアやソフトウェアの部品の技術もメーカーも決して公開しない。部品メーカーも決して語らない。

しかし、同社は仏Nuance Communicationsと2008年、技術提携を結んでおり、iPhone 3GSには、このNuanceの音声認識アルゴリズムのソフトウェアを使っている可能性は高い。