Googleは2月25日(米国時間)、Android端末で「Gemini」が複数手順のタスクを肩代わりするエージェンティックAI機能を発表した。同日、Samsungが米サンフランシスコで開催した「Galaxy Unpacked」で早期プレビューを公開。Pixel 10、Pixel 10 Pro、Samsung Galaxy S26シリーズ向けのGeminiアプリでベータ機能として、米国と韓国でまもなく展開開始となる。まずはフード・食料品デリバリーおよびライドシェア分野の一部アプリが対象となる。
これは、複数の工程を要する日常的なタスクをGeminiが代行する「マルチステップ・タスク自動化」機能である。ユーザーは必要な場面のみ確認や介入を行う。
具体的には、スマートフォンの電源ボタンを長押ししてGeminiを起動し、「帰宅のための車を予約して」、「DoorDashで前回と同じメニューを注文して」などと指示する。Geminiはバックグラウンドでタスクを実行し、その間もユーザーは他のアプリを通常どおり利用できる。
この種のエージェント機能では、プライバシーおよびセキュリティの確保が重要となる。Googleは安全性とプライバシーを重視した設計として、以下の3点を挙げている。
- ユーザー主導の実行: 自動化はユーザーの明示的な指示によってのみ開始され、タスク完了後すぐに停止する。
- 透明性の確保: 通知を通じて処理の進行状況を確認でき、必要に応じて中断や操作の引き継ぎが可能である。
- 限定的なアクセス:Geminiは対応アプリを安全な仮想ウィンドウ上で実行し、アクセス範囲を対象アプリ内に限定する。デバイス内の他のデータには触れられない設計である。
Googleはマルチステップ・タスク自動化について、「まだ始まりに過ぎない」としており、初期ユーザーからのフィードバックを反映しながら、対象カテゴリやアプリの拡大を進めていく方針だ。
このほかにも、Galaxy S26への「かこって検索(Circle to Search)」の強化と、AIによる詐欺電話の高度検出機能の提供も発表された。
かこって検索は、画面上の単一オブジェクトだけでなく、複数の対象を同時に認識できるマルチオブジェクト画像認識に対応する。例えば、ファッション画像に写る衣服やアクセサリーをまとめて識別して検索し、それぞれの詳細情報を表示できる。
詐欺検出は、端末内で動作するGeminiモデルを用い、通話中に不審なパターンを検知した場合に音声と振動で警告を発する。解析はデバイス上で完結し、通話音声や文字起こしデータが保存・外部送信されることはない。連絡先に登録済みの相手からの通話については自動的に無効化される。


