ずいぶん前の出来事だったようにも感じるが、銃乱射事件の容疑者が使用していたiPhoneのロック解除を巡ってAppleとFBIが対立したのはわずか1年前のことである。法的な範囲を超えたデータアクセスを認めないAppleに対して、捜査機関がAppleの協力を得ずにロック解除に成功するという痛み分けに終わったが、世論や報道はAppleのプライバシー保護を支持する声が優勢だった。その半年後にトランプ旋風が巻き起こるのだから分からないものである。

しかし、1年前にAppleがプライバシー保護の流れを作ったからこそ、今スマートフォンが新たな進化を遂げようとしている。

Facebookカメラのカメラエフェクト

開発者カンファレンスF8で、Facebookが「Camera Effects Platform」を発表した。Facebookアプリの「カメラエフェクト」機能のマスクやエフェクト、フレームを外部のクリエイターやデザイナー、組織も作成できるツールを提供する。Camera Effectsでは機会学習技術を用いて、たとえば動画で動く人にヒゲをつけたり、目から光線を発射させるというようなことが可能になる。単なるエフェクトやアニメーションと思われそうだが、FacebookはFacebookカメラを同社のAR (拡張現実)戦略の最初の段階に位置づけている。今はユーザーが面白い動画や写真を共有する手段として普及させ、それがやがて現実と仮想をミックスする次世代のコンピューティングへとつながっていく。

Snapchatのコピーという酷評も受けたが、FacebookはFacebookカメラをARプラットフォームへと成長させようとしている。

今年1月のCESでAmazonのAlexaをサポートするデバイスがたくさん登場し、スマートスピーカーのようないつでも話しかけてデジタルアシスタントを呼び出せるデバイスが開花の時期を迎えようとしている。しかし、FacebookのF8ではスマートスピーカーなどの話題はなかった。現時点で同社が次世代コンピューティングの軸足としているのはスマートフォンである。

F8の基調講演を見ていて、私はMark Zuckerberg氏(CEO)が2016年に掲げた新年の目標「自らAI執事を開発する」を思い出した。その成果をまとめた「Building Jarvis」を、Zuckerberg氏は昨年12月19日に公表している。Javisは音声とテキストでコミュニケーションできるようになっており、当初Zuckerberg氏はアクセスしやすい音声を使うと予想していた。ところが、「予想以上にテキストを多く使用した」という。理由は以下の2つだ。

  • 多くのケースで音声によるコミュニケーションが周囲の人の邪魔になる。
  • 音声は素早い反応を得られるが、詳しく調べたい場合などはよりコントロールできるテキストとディスプレイ表示が適している。

「音声が重要な役割を担うことに疑いはないものの、人々が認識している以上に、AIとのコミュニケーションにおいてテキストは重要である」(Zuckerberg氏)。これから音声は成長していくだろうが、現時点でスマートスピーカーのような音声対応の据え置きデバイスを使うメリットは「素早いレスポンス」のみであり、常に携帯していて柔軟にコントロールできるスマートフォンが最善のソリューションになる、というのがZuckerberg氏の現在の分析だ。

今年1月、初代iPhoneの発表から10年のタイミングで公開されたSteven Levy氏によるAppleのPhil Schiller氏のインタビューでも、Schiller氏が同様の指摘をしている。「私個人は、今でも最高のインテリジェントアシスタントはユーザーと常にあるものだと考えている。キッチンに置かれたデバイスや壁に掛けられたデバイスに縛られるよりも、そうしたものとしてiPhoneを持ち歩きたい」。

常にユーザーと共にあるスマートフォンは、今もっとも「パーソナルなデバイス」と言える。パーソナルなデバイスだからこそ、スマートフォンを利用したよりパーソナルな次世代のサービスの可能性が開ける。

多くのIT企業は、機械学習の開発においてユーザーの端末利用に関するデータをトレーニングデータとしてクラウドに吸い上げて解析している。Appleはユーザーのプライバシーを保護するために機械学習をデバイスで行い、端末利用を学習した結果のアップデートのみを暗号化して収集している。そうした制限があるからAppleはAI開発で後れを取っていると言われている。だが、たとえば医療やファイナンスなど、これからスマートデバイスがよりパーソナルなアシスタントを提供するようになるなら、堅固なプライバシー保護が問われることになる。

そうしたトレンドをGoogleも感じているようで、4月6日にGoogle Researchが、モバイルユーザーのプライバシーを保護しながらユーザーの利用データを機械学習に用いる「Federated Learning」を公表した。ユーザーの端末利用の学習を端末内で行い、処理前のユーザーデータをクラウドに送ることはない。現在、スマートフォン用キーボード「Gboard」のクエリ提案にFederated Learningを採用しており、今後Gboardの入力提案や写真のランキングなどへの拡大を計画している。

今月初めに、AppleのAプロセッサに採用されているGPUコア「PowerVR」を開発するImagination Technologiesが、同社のIP(知的財産)の使用を終了するという旨の通告をAppleから受けたことを明らかにした。Appleは独自にGPUコアのデザインを進めているという。

前回の決算発表においてApple CFOのLuca Maestri氏が、コア技術に関してはAppleがコントロールできるようにすると述べていた。AppleがGPUを重んじるのは、2D/3Dグラフィックスやゲームのためだけではない。CPUよりも並列実行性能に優れるGPUは機械学習処理に適している。また、スマートフォンによるモバイルARを実用的なものにするためにもモバイルGPUの成長が欠かせない。

AIアシスタントやモバイルARは、ユーザーのことを深く知るパーソナルなサービスになってこそ実用的でユーザーのニーズを満たすものになる。そうでなかったら音声やロケーションを活かせる検索でしかない。それを実現できる現時点での最善のソリューションが、多くの人が常に携帯しているスマートフォンであり、だからこそユーザーのプライバシー保護を徹底するモバイルプラットフォームが違いを生み出せる。