今年はどのようなCESだったのか、数年後に振り返った時におそらく「音声アシスタントの年」と言われるのではないだろうか。Amazonの「Alexa」とGoogleの「Google Assistant」が大きな話題になり、特にAlexaは車、スマート家電、スマートスピーカーを含むAV機器、ヘルス関連デバイス、ロボット、コントロールデバイスなど様々な製品やデバイス、サービスに採用され、その数は700を超えると言われている。
Alexaが評価を上げたのは、Amazonのスマートスピーカー「Echo」の米国での大ヒットによるものだ。Echoからスマートスピーカー市場が形成され、それが音声インタフェースの可能性へと成長して今日に至る。
「AlexaとGoogle Assistantはどのように違うの?」とよく聞かれるが、実は賢さを比べたらGoogle Assistantに軍配が上がる。例えば、「シルク製の服を洗濯機で洗っても大丈夫?」というような検索から情報を引き出すリクエストに、Alexaは答えられないことが多い。一方でGoogle Assistantは「卵2つのタンパク質の量は?」というような質問でも、ちゃんと2個分を計算して答えてくれる。しかし、音声デジタルアシスタントとしてはAlexaの方が頼りになるのだ。
Alexaはインタラクションに優れている。例えば、パスタをゆでるために「10分のタイマーをセット」、ついでに「音楽をかけて」と頼み、電話がかかってきたら「止めて」とリクエスト、電話の後に「あと何分?」と聞く。Alexaは「止めて」が音楽の一時停止だと理解し、「あと何分?」がパスタがゆであがるまでの時間だと判断して、音楽再生を止め、タイマーの残り時間を読み上げる。
このような会話の流れで、他の音声デジタルアシスタントはコンテキストを踏まえずに、作業の流れから「あと何分?」で音楽再生の残り時間を答えたりする。他にも、音楽を再生し始めたら音楽アプリに移ってしまって、それ以外のリクエストに対応してくれなくなるなど、音声インタラクションが迷子になることも多い。結局、スマートフォンで使っていたら音声ではなく、画面を見て指で操作することになる。
ユーザーのリクエストに関して不確かなことがあれば、Alexaは質問してくる。すごく賢いわけではないが、対話が続き、結果的に音声だけでちゃんと操作できる。確実であり、逆にしつこく聞き返されて煩わしい思いをすることもない。
一昨年末に「2016年はAmazon勝負の年、シリコンバレーのテクノロジー業界誌が予想」で、昨年に「誰もが音声インタフェースを使い始めるパラダイムシフト」で、Echo/Alexaのインパクトを紹介した時に、私は部屋に置いておくだけでいつでも普通に話しかけてアシスタントを受けられるユビキタスさがEcho/Alexaの魅力であるとした。実際、それがスマートスピーカーのヒットにつながったのだが、Echoのライバルが登場し始めた今もEchoが魅力を保っている理由を考えると、Alexaの優れたインタラクションという結論に至る。
音声による操作が継続されるように設計されたAlexaは、音声インタラクションのための基本システムのようである。だから、他のベンダーや開発者も好んでAlexaを採用する。スマートスピーカー「Google Home」を出したGoogleも、急速にGoogle Assistantの音声インタラクションを改善しているが、まだAlexaに一日の長がある。
バックワードアプローチから誕生したEcho
Churchill ClubのCHURCHILLSでEcho開発チームがマジカルチーム賞を受賞した時に、AmazonのMike George氏とToni Reid氏がその点について語っている。
なぜEchoが成功したのか? なぜAlexaの音声インタラクションは優れているのか? George氏の答えは「(Echoに)スクリーンがないから」である。だから、スクリーンを見ないで済む音声インタラクションを考えた。
「それは理由にならない」と思うかもしれないが、Echo以前、そして以後も他の音声デジタルアシスタントはスクリーンに頼って、音声インタラクションを中途半端なものにしてきた。それは音声認識など技術が十分ではないからと見られていたが、そうではなかったことをEcho/Alexaが証明した。実装や提供の方法を工夫すれば、今ある技術でも十分に便利なソリューションになる。
音声インタラクションのメリットは手が自由(ハンズフリー)になることだ。料理をしながら、レシピを確かめたり、人数分の材料の計算してもらったり、音楽をかけてもらったり、スマートフォンやタブレット、PCに束縛されないWebコンテンツやサービスの活用が可能になる。
つまり、Echo/Alexaの目的はハンズフリーの実現であり、それには画面を見ずに済む音声インタラクションが必要であり、それを便利に使えるようにするデバイスがスマートスピーカーだった。これはAmazonで有名なWorking Backwardsの賜物と言える。
バックワードアプローチは、名前が示すように逆向き、開発段階の製品定義において、製品ローンチ時に必要なドキュメントをいきなり作成する方法で、具体的には以下のような4つのステップを踏む。
- プレスリリースを作成
- FAQを作成
- 顧客体験を定義
- ユーザーマニュアルを作成
最初にプレスリリースを書くのは、その製品がなぜ存在し、どのような機能を持ち、どのように役立つかをシンプルかつ明確に、開発者の間や社内ではなく、顧客に受け入れてもらえるように定義するためだ。Working Backwardsは顧客を中心に据えた開発プロセスであり、そこから作り出された体験がEcho/Alexaの強みになっている。