米OpenAIは10月21日(現地時間)、「ChatGPT」を中核に据えた新しいWebブラウザ「ChatGPT Atlas」(以下Atlas)を発表した。ChatGPTの検索機能やメモリ機能、エージェント機能を統合し、ユーザーの行動を学び、文脈を理解して支援する“AIブラウザ”として設計されている。発表とともにmacOS版がリリースされ、今後Windows、iOS、Androidにも展開予定である。

このOpenAIによる初のAIブラウザは以下のような特徴を持つ。

  • Chromiumを採用し、タブ、ブックマーク、拡張機能(Chrome用拡張機能を利用可能)、オートコンプリート、シークレットモード(Incognito mode)など、従来のブラウザの主要機能を備える。
  • ChatGPTが統合されており、別のタブやChatGPTアプリに切り替えることなく、WebブラウジングしながらChatGPTを利用できる。
  • 「メモリ(Memory)」により、Webブラウジングをパーソナライズ。ユーザーの行動を学び、文脈を理解してユーザーを支援する。
  • 「エージェント」がサイトと対話し、ユーザーの代わりにアクションを実行する。

ブラウザベンチマーク「Speedometer 3.0」と「Kraken」を10回実行した平均スコアは、Googleの「Chrome」を下回り、Appleの「Safari」と同等だった。

パフォーマンスは平均的だが、Atlasの最大の特徴はChatGPTがブラウザのあらゆる場面に統合されている点である。新規タブのホーム画面がAtlas版のChatGPTになっており、検索機能を兼ね備えたURLバーからもChatGPTを利用できる。

ChatGPTと対話しながらWebブラウジング

Webページを開くと、「右上」に「Ask ChatGPT」というボタンが表示され、クリックすると「ChatGPTサイドバー」(サイドパネル)が現れる。そして、開いているタブについて、質問したり要約を依頼するなど、ChatGPTを利用できる。

  • ChatGPTサイドバー

    たくさんの記事を全て確認する時間がなくても、サイドバーで「おすすめの記事は」と尋ねると、特に注目される記事を選んで注目ポイントをまとめてくれる

従来のWeb検索エンジンがリンクのリストを返すのに対し、ChatGPT Searchでは検索結果について直接ChatGPTと会話ができる。対話内に表示されるリンクをクリックすると、WebページとChatGPTの会話画面が自動的に分割表示され、常に「アシスタント」が隣にいる状態でブラウジングを継続できる。

  • ChatGPT Searchの検索結果についてChatGPTと会話

    「AIブラウザとは?」と検索し(左)、代表的なAIブラウザの1つとして表示された「Atlas」のWikipediaページのリンクをクリックすると、自動的にWikipediaページとChatGPTチャットが分割表示される(右)。「戻る」をクリックすると、ChatGPTチャット画面に戻る

複数のタブを横断したアシスタントにも対応しており、例えば2つの製品ページを開き、スペックの違いを比較する表を作成させることが可能である。ただし現時点では、タブごとに同じチャットスレッドを指定する必要があり、他のAIブラウザに比べて操作手順はやや複雑である。

  • 2つのタブを横断して製品比較

    iPad ProとiPad Airの製品ページを開き、ChatGPTに仕様の違いをまとめてもらう。「違いの説明」も付けられており、違いを効率的に把握できる

また、Webフォームフィールド(Gmailの新規メール作成、Google KeepやGoogleドキュメントのメモ・文書作成など)では、テキストを選択するとハイライト上にChatGPTロゴが表示され、フォーム内で直接ChatGPTを利用できる(インライン執筆支援)。

ブラウザメモリ

「メモリ」を有効にすると、過去に閲覧したページや会話の履歴をもとに、よりパーソナライズされた提案を行う。例えば、ユーザーが複数の求人サイトを閲覧していた場合、ChatGPTに対し「先週見た求人情報をすべて見つけて、面接の準備に使える業界動向のサマリーを作成して」といった指示が可能になる。

メモリ機能は任意であり、設定画面で閲覧履歴と紐づくデータをいつでも確認・削除できる。

エージェントモードで「スラムダンク」の聖地巡礼ルート作成

「エージェントモード」は、ChatGPTがブラウザ上でユーザーに代わって作業を実行する。Plus、Pro、Businessユーザー向けのプレビュー機能として提供される。

これは「ChatGPT Agent」をWebブラウジング向けに拡張したもので、ユーザーの指示に応じてWebページを開き、情報収集や予約、買い物などのタスクを自動実行する。例えば、レシピを渡して「食材を見つけてカートに追加し、自宅に配送して」と依頼すると、ChatGPTがオンラインスーパーのサイトを操作して注文作業を進める。

エージェントモードは操作対象のウェブサイトがログイン状態でも利用可能である。ログアウトモードで使用することで、機密データへのアクセスや意図しない動作の実行といったリスクを制限できる。

  • 作業中のエージェントモード

    エージェントモードで「Google Mapsを操作して『スラムダンク』の聖地を巡るルート作成」を依頼。エージェントが操作しているページは青く表示され、操作をリアルタイムで確認しながら、いつでもユーザーが停止したり、操作を引き継ぐことができる

  • 「スラムダンク」の聖地巡礼ルート完成

    「スラムダンク」の聖地巡礼ルート完成

エージェントモードは完全自動ではなく、操作の可視化とユーザーによる介入を前提に設計されている。エージェントの作業中、Atlasの画面上に操作状態およびタスクフローが表示され、ユーザーはステップ単位で介入・修正できる。

プライバシーと安全性

プライバシー面では、ChatGPTによるWebページの参照をサイトごとに制御できる。ChatGPTに参照させたくない場合は、URLバー左側の設定アイコンをクリックし、「ChatGPTのページの表示」から「許可しない」を選択する。

また、シークレットモードで開いたタブでは、ChatGPTからログアウトされた状態となり、チャット内容やメモリデータはアカウントに保存されない。

Atlasのデフォルト設定では、閲覧コンテンツがモデル学習に使用されることはない。ただし、ChatGPTアカウントでチャット学習を有効にしている場合、Atlas内でも同様に有効となる。

未成年向けの利用制限として、ChatGPTのペアレンタルコントロールがAtlasにも適用される。保護者がブラウザメモリやエージェントモードを無効化することも可能である。

今後の展開

OpenAIは今後もAtlasの改善を続け、マルチプロフィール対応、開発者向けツールの強化、Apps SDKで開発者がAtlas内でアプリの発見可能性を高める方法などを今後のロードマップに含めている。Webサイトの運営者は、ARIAタグを追加することで、ChatGPTエージェントがAtlas上で自サイトをより適切に扱えるようにすることが可能だ。

発表のライブストリームで、サム・アルトマンCEOは、Atlasのコンセプトとして「パーソナライズされたAIアシスタント」の方向性を示した。

カスタム指示がWeb上のどこへ行っても自分についてきてくれる。単にブラウザ上でAIチャットを利用できるだけでなく、ユーザーの設定や好みがどのサイトやサービスを使っていても一貫して反映されるユーザー環境の実現を目指す。

「エージェントがユーザーのために作業を進める中で、ユーザーのことをより深く理解し、必要になりそうな情報を先回りして集めたり、インターネット上で関心を持ちそうなものを見つけてまとめてくれたりする。今回の発表ではその一端を紹介したにすぎないが、今後さらに発展させていきたい」と語った。

OpenAIは、こうした“パーソナルAIアシスタント”構想をブラウザという枠を超えて進化させようとしており、Atlasはそのビジョンの中核を担う存在である。