米Googleは3月3日、「Gemini Live」に画面共有およびライブ動画機能を追加すると発表した。3月後半より、Android向けに「Google One AIプレミアム」プランの一部として、Gemini Advancedの加入者に提供開始される。同社は、スペイン・バルセロナで開催中のMWC Barcelona 2025(3月3日〜6日)の会場で、これらのデモを披露している。
Gemini Liveは、レスポンスのよい音声対話を特徴とし、自然に会話するようにGeminiを利用できる機能である。画面共有とライブ動画の追加により、ビジュアル認識を活用した機能が可能になる。スマートフォンを通して、ユーザーが見ている現実世界やコンテンツをGeminiが理解し、対話に反映させられる。
具体的には、画面共有を利用すると、ユーザーはスマートフォンの画面を見ながら、表示されているコンテンツについてGeminiに質問できる。下の例では、オンラインショップで気に入ったバギージーンズを見つけた際に、画面を共有しながら「このジーンズに合うトップスは?」と尋ねている。Geminiはスタイルやカジュアルなデザインを考慮し、シンプルな白いTシャツまたは黒のタートルネックを勧めている。
ライブ動画機能では、スマートフォンのカメラを"AIの目"として、周囲のものをGeminiが認識する。Googleは2024年5月に開催した開発者カンファレンス「Google I/O 2024」において、AIエージェント「Project Astra」の一部として、この技術を披露していた。
下の例では、ライブ動画を活用して、素焼きの花瓶にかける釉薬をGeminiに相談している。すでにある花瓶と色サンプルを並べ、「ミッドセンチュリーモダンな雰囲気に合う色は?」と尋ねると、Geminiは「オリーブグリーンと落ち着いたブルーのどちらか。特に、2列目左端のオリーブグリーンが良いのでは」といった具体的なアドバイスを提供している。
Googleはまた、iOS用のGeminiアプリをアップデートし、ロック画面用のウィジェットを追加した。「プロンプト入力」「Liveで話す」「マイクを開く」「カメラを使う」「画像を共有」「ファイルを共有」の6つがあり、これらを利用することで、Face IDでアンロックするデバイスではロック画面からワンタップでGeminiの機能にアクセスできる。