米Googleは8月13日(現地時間)、Made by Googleイベントを開催し、「Pixel 9」と「Pixel 9 Pro」シリーズ、「Pixel 9 Pro Fold」を発表した。それらはGemini時代に入って初のPixelスマートフォンであり、イベントではPixel新製品やAndroidスマートフォンで利用できるようになる多くのAI機能が披露された。

Googleは、これまで10月に開催することが多かった秋のMade by Googleイベントを今年は8月に開催し、Appleよりも早くスマートフォンの新モデルを発表した。

イベントでは、Appleの名前こそ出さなかったものの、プレゼンテーションからは、Appleが6月に発表した「Apple Intelligence」への対抗意識がうかがえた。Apple Intelligenceは一部の機能の英語環境での開発者向けベータテストが始まったばかりで、日本語など多言語対応は2025年以降になる予定だ。イベントでGoogleは、Geminiがすでに45言語で200以上の国・地域で利用できることを強調し、AI機能の多くのデモをライブで披露することで、AIスマートフォンへの移行準備が整っていることをアピールした。

以下は、イベントでGoogleが見せた10のAI機能である。

Pixel Screenshots

Pixel Screenshotsは、ユーザーが撮影したスクリーンショットの内容を読み取って分析し、ユーザーの質問に対応する。 たとえば、気になった商品のページのスクリーンショットを撮っておくとScreenshotsが自動分類してくれるので、自転車の購入を検討する際に「自転車」と検索すると、過去の自転車に関するスクリーンショットを確認できる。Screenshotsはスクリーンショットを分類するだけではなく、自転車の価格などスクリーンショットに含まれる情報への質問にも対応できる。

  • Pixel Screenshots

    スクリーンショットが手軽な情報収集手段に。 Pixel Screenshotsアプリを開き(左)、「bikes」と検索するだけで、過去にスクリーンショットを撮影した自転車のWebページを一覧できる

Pixel Studio

Pixel Studioは、Tensor G4で動作するオンデバイスAI機能とクラウド上のImagen 3 text-to-imageモデルを用いる画像生成アプリである。生成は高速で、ユーザーは言葉によるプロンプトを使用して要素を追加または削除しながら、画像を柔軟に作成・編集できる。

イベントのデモでは、焚き火の写真を生成し、ゴールデンゲートブリッジや花火を背景に追加したり、雰囲気やスタイルを変更しながら、簡単にビーチパーティの招待カードを完成させた。

Call Notes

Call Notes(通話メモ)は、電話での会話を自動的に書き起こして要約を生成する。たとえば、電話で紹介してもらったレストランの名前のメモを紛失しても、Call Notesで簡単に調べられる。通話の際のメモを不要にする機能である。Call Notesの処理は全てデバイス内で行われる。

Pixel Weather

Pixel 9シリーズとともに、Pixelに天気アプリが登場する。天気予報や天候に関するデータに加え、それらに基づいたAIサマリーを提供する。ユーザーは、雨がいつ降り始め、いつ降り止むかといった予報、傘や温かい服装が必要といった天気に関するガイドをすばやく確認できる。カスタマイズにも対応し、近くで山火事が発生している際に大気質指標(AQI)をすぐに確認できるようにするなど、ユーザーのニーズに応じたパーソナライズが可能である。

Add Me

誰かに撮影を頼むことなく、全員が写ったグループ写真を撮影できる機能。たとえば、3人のグループ写真を撮る際に、3人が収まる構図で2人だけが並んで1人が撮影し、次にどちらかと撮影を入れ替わって、最初の撮影者が入った状態で2枚目を撮影すると、3人が並んだ写真が合成される。2枚目の写真を撮影する際には拡張現実を使用して、うまく構図を合わせられる仕組みになっている。

  • Add Me

    3人のグループ写真で、1枚目に2人を撮影(左)、撮影を交代してオーバーレイで位置を合わせ(中左)、2枚目を撮影(中右)。2枚の写真が合成されて3人のグループ写真が完成する(右)

Magic Editor / Reimagine

テキストボックスに生成したい内容を入力して、写真を創造的に生まれ変わらせられる生成AI機能。曇った日の風景を晴天にしたり、撮影した写真からクリエイティブな写真を簡単に作成できる。

  • Magic Editor / Reimagine

    恐竜のパーカーを着て庭で恐竜ポーズする子供の写真を、Reimagineを使って中生代の風景に変える

Magic Editor / Auto frame

撮影した写真の構図を、生成AIを利用して修正する機能。被写体がはみ出したり、横にずれた写真でも、被写体が中心におさまる構図にし、フレーミングの修正でできた空白は生成AIで埋める。この機能は、写真の被写体を強調するようにトレーニングされている。

Gemini Live

レスポンスのよい音声対話で、自由に会話するようにGeminiを利用できる。ハンズフリーでも利用可能で、Geminiアプリをバックグラウンドで、または携帯電話がロックされている時でも会話を行える。Android端末のGemini Advanced加入者を対象に、8月13日から英語で提供を開始し、数週間中にiOSおよび他の言語にも拡大する予定。開始時点で、10種類の声が用意されている。

GeminiでAndroidがより便利に

GeminiがAndroidに深く統合され、Androidのユーザー体験においてより多くのコンテキスト認識機能を提供する。Androidユーザーは、デバイスを使用中に画面に表示されている内容について、Geminiを呼び出して質問することができる。たとえば、YouTubeでレストラン紹介のビデオを再生している際に、ビデオで紹介されているレストランをリストアップしてもらい、さらにGoogleマップへの追加を依頼できる。

  • GeminiでAndroidがより便利に

    韓国のコンビニを紹介しているYouTubeビデオを再生しながら、Geminiに「彼女が食べている食べ物のリストを作成して」と依頼

また、Geminiで生成した画像をGmailやメッセージといったアプリにドラッグ&ドロップできるなど、ユーザーが使用している多くのアプリとGeminiはインタラクトできる。

Googleアプリと連携して日常をサポート

Geminiアプリは、拡張機能を使用して他のGoogleアプリやサービスと連携することで、ユーザーからの質問に対してより有用な回答を提供する。たとえば、YouTubeで面白いスピーチの動画を探し、それらを参考にGeminiとスピーチを作成することが可能である。一部のGemini拡張機能では、ユーザーが許可すると、ユーザーの個人情報や他のGoogleサービスのコンテンツにもGeminiを利用できる。イベントでは、サブリナ・カーペンターのツアー・ポスターを撮影し、Geminiに「今年サンフランシスコに来る時に時間が空いているか確認して」と頼むライブデモが行われた。Geminiがポスターから日程を読み取り、Googleカレンダーと照らし合わせて、コンサートに行けることを確認した。

  • Googleアプリと連携して日常をサポート

    サブリナ・カーペンターのツアー・スケジュールを撮影し、サンスランシスコ公演の日に他の予定が入っていないか、Geminiに確認してもらう

Googleは数週間中に、Keep、Tasks、Utilitiesなどの新しい拡張機能をリリースする予定で、YouTube Musicの機能も拡充される。