ブラウザにAIを統合 - 「Gemini in Chrome」を体験
今年前半、生成AIは「バイブコーディング」の話題をきっかけに、主にプログラミング分野で活発な動きを見せていました。では、一般ユーザーの生産性を高めてくれるものは何か……そんな視点で注目されそうなのがブラウザへのAI統合です。「テックトピア:米国のテクノロジー業界の舞台裏」の過去回はこちらを参照。
前回は早期アクセスが始まったPerplexityの「Comet」の使用感を紹介しました。それに続いて今回は、米国で提供が始まった「Gemini in Chrome」の第一印象をお届けします。
Gemini in Chromeは、デスクトップ版のChromeブラウザに統合されたGemini機能です。現時点では、米国でGoogle AI ProまたはGoogle AI Ultraプランの加入者が利用可能となっています。
利用可能な環境では、Chromeの右上にGeminiボタンが表示され、ワンクリックで会話を開始できます。簡単にGeminiを呼び出せるだけではありません。Web版のGeminiとの最大の違いは、Chromeの画面をGeminiと共有できること。
つまり、いま自分が見ているページをGeminiと一緒に閲覧しながら対話し、情報収集やスムーズなWebブラウジングをサポートしてもらえるのです。現時点で、Gemini in Chromeでは以下のようなことが可能です。
- 表示中のWebコンテンツに関する質問:映画の紹介ページを見ながら「これは実話ベース?」と尋ねたり、商品仕様の比較、あるいはレシピをグルテンフリーに調整してもらうなど、コピー&ペースト不要のインタラクティブな探索が可能です。
- Web記事の要約や主なポイントの抽出
- リサーチや学習のサポート:専門用語の多い技術文書の解説や、学習ガイドの作成、アイデア出しの補助などもこなします。
-
Gemini 2.5の新たなオーディオ生成技術の記事を読みながら「従来のGeminiのオーディオ生成との違いは?」とGeminiに質問。閲覧中の記事を踏まえた回答を得られます。現在Gemini in Chromeは米国向けのみの提供ですが、日本語の利用は可能です
さらに、モバイル版Geminiで提供されている「Gemini Live」も利用できます。これは、レスポンスの速い自然な音声対話ができる機能で、マルチモーダル対応です。
テキストよりも直感的にやりとりでき、たとえば「この映画は話題になったのに興行収入が振るわなかったのはなぜ?」のような雑談感覚の質問がより楽しくなり、また質問を重ねるような対話を効率よく進めることができます。
PerplexityのCometと比較した最大の違い
さて、PerplexityのCometと比較した際の最大の違いは、Geminiがプライバシーに細やかに配慮している点です。画面共有はデフォルトでオフ。共有したいときは、対話ウインドウ左下の「Share」ボタンを押すことで明示的に開始します。共有中は画面の縁が青く光るため、「うっかり共有しっぱなしだった……」という事態も防げます。
その一方で、プライバシー保護を重視している分、制約もあります。Geminiが確認できるのは、画面上のアクティブな単一タブのみで、基本的に表示されている部分に限定されます。今後の大きな可能性と見なされているAIエージェント機能についても、ユーザーの意図を汲み取ってGeminiが能動的にタスクをこなすような機能は備わっていません。
閲覧履歴やブックマークの検索、Chromeの設定支援なども未対応です。これらはユーザーが許可すれば「できるようになる」と予想していましたが、ChromeのユーザーデータにGeminiはアクセスできず、ブックマーク編集や設定画面の共有も不可となっています。
そのため、単純に「できること」を比較すると、ユーザーの許可を条件に、積極的にエージェント的な機能を実装しているCometに軍配が上がります。CometはAI検索とAI活用を中心に設計されたブラウザである一方で、Gemini in Chromeは従来のWebブラウザの延長にあるAI拡張機能といえます。
ただ、Cometの方がより未来のブラウザを体験できるものの、実際に使用するうえでは「どこまでAIに任せていいのか?」という線引きの難しさを覚えます。AIをめぐるプライバシー保護のあり方が十分確立されていない現状において、安全確保を優先するなら結局は「許可を与えない」という判断に落ち着きます。
他方、Gemini in Chromeで「できること」は限定的ですが、まだ一般に普及していないAIエージェントにまで踏み込まず、多くのユーザーが使い慣れてきたAIチャットボットの範囲でGeminiが機能しており、安心してAIを活用できます。
また、限定的といってもすでにGeminiを日常的に使用しているユーザーであるなら、その統合効果は大きいものです。私自身、最近はGeminiを使う頻度が増えており、ここ2年はArcをメインブラウザに使用してきましたが、ブラウジングに個人のGemini環境を活用できる便利さでChromeから離れがたくなりました。
今回のGemini in Chromeは、いわば最初の一歩。Googleがこれを単なるアシスタント機能にとどめるつもりはなく、今後は自律的かつエージェント的な方向へと進化させるのは明らかです。
“信頼”と“制御”のバランスが重視されているGemini in Chrome
Google I/Oでは、音声によるブラウザ操作の強化、複数タブの連携やブラウザ機能とのより深い統合などが示唆されており、将来GeminiがChromeの体験を根本的に変える可能性を秘めているといえるでしょう。
たとえば、ショッピングサイトで商品を自動的に比較し、最適なものを提案、さらには購入手続きの一部まで行うようなエージェントを想像すると、その便利さの反面、誤った判断や意図しない操作への懸念が生じます。
だからこそ、Gemini in Chromeでは“信頼”と“制御”のバランスが重視されており、ユーザーがAIの能力を活用しながらも、最終的なコントロールは人間が持つという設計思想が感じられます。
この信頼感は、Google製品から失われつつあったものです。近年「Google検索の信頼性が低下している」といった報道が増えています。主な要因として、広告の増加やアフィリエイトサイトの氾濫、SEO技術の進化が挙げられます。
特に医療・金融・製品レビューなどの分野では、信頼性の高い情報が広告型コンテンツの陰に埋もれ、ユーザーが本当に知りたい情報にたどり着きづらくなっています。
広告は、かつて「情報に誰もがアクセスできるようにする」というGoogleの使命実現に大きな役割を果たしました。しかし、いまやその役割と収益優先のバランスが問われています。
Google I/Oでは、AI検索においても広告を導入する方針が示されましたが、GoogleがAI時代にもユーザーの支持を得るためには、ユーザーの信頼を取り戻し、その上に収益モデルを構築しなければなりません。
なぜなら、検索におけるGoogle一強が崩れる可能性をはらむ競争環境が形成されつつあるからです。最大のライバルであるOpenAIは、5年後に「十億人規模のユーザーを持つ」という目標を掲げる一方で、広告モデルの導入には慎重な姿勢を見せています(完全に否定はしていません)。
ブラウザ開発の噂もささやかれる同社はインターネットの“入口”となる地位をどう築こうとしているのでしょうか。次回は、そんなOpenAIのパーソナルAI戦略にフォーカスしようと思います。