今回は、2025年9月24日〜10月5日に発表されたAI関連の注目すべきトピックを紹介する。OpenAIは、「ChatGPT Pulse」や「ACP(Agentic Commerce Protocol)」、「Sora 2」などを立て続けにリリースした。GitHubはターミナル向けの「GitHub Copilot CLI」をパブリックプレビューとして公開した。Googleは「Gemini Robotics 1.5」で産業分野でのAI活用に切り込み、StripeとOpenAIがAIによる商取引用の新プロトコル「ACP」を公開した。そして、Anthropicは主力モデル「Claude Sonnet 4.5」をリリース、このニュースは小誌でも大きな注目を集めた。

それぞれ詳しく見ていこう。

OpenAI、能動的に会話を開始する「ChatGPT Pulse」ベータ版公開

9月25日、OpenAIはモバイル版ChatGPTの新機能「ChatGPT Pulse」をベータ版として公開した。これは、ChatGPTがユーザーとのそれまでの会話やフィードバック、カレンダーなどの接続アプリから得られる情報に基づいてパーソナライズしたデータを収集し、それを定期的に配信するというもの(参考記事:OpenAI、パーソナライズした情報を毎日配信する「ChatGPT Pulse」プレビュー提供開始 | TECH+(テックプラス))。

ChatGPT Pulseは、AIが自分からテーマを提供して会話を開始するという点が、従来のAIチャットとは大きく異なる。これによって、ユーザーはそれまで認識していなかった新しい情報に触れ、そこからAIとの会話を始められるというメリットがある。従来はユーザー側から会話をはじめる必要があったので、ユーザー自身が決めた内容にテーマが絞られるという特性があった。

GitHub、GitHub Copilot CLIをパブリックプレビューとして公開

9月25日、GitHubは「GitHub Copilot CLI」をパブリックプレビューとして公開した。GitHub Copilot CLIは、同社が提供するコーディングエージェント「GitHub Copilot」のCLI版で、開発者はターミナル上で直接AIエージェントと対話しながらコードの作成や編集、デバッグ、リファクタリングなどを行うことができる。

GitHubのMCPサーバにデフォルトで接続可能で、リポジトリのプルリクエストやIssueへも自然言語でアクセスできる。カスタムMCPサーバにも対応しているので、自作のMCPやサードパーティのMCPに接続して機能を拡張することもできる。

Copilotの有料プランのユーザーであれば追加料金なしで利用できるが、現時点ではまだ早期プレビュー段階なため、正式リリースまでには機能変更や仕様調整の可能性もあるとのことだ。

  • コマンドライン向けのコーディングエージェント「GitHub Copilot CLI 出典:GitHub」

    コマンドライン向けのコーディングエージェント「GitHub Copilot CLI 出典:GitHub」

Google、ロボット制御向けAIモデル「Gemini Robotics 1.5」「同ER 1.5」発表

9月25日、Googleがロボット制御向けのAIモデルとして「Gemini Robotics 1.5」と「Gemini Robotics-ER 1.5」を発表した(参考記事:Google、次世代ロボットAI「Gemini Robotics 1.5」などを発表 | TECH+(テックプラス))。

Gemini Robotics 1.5は視覚情報と自然言語での指示をもとにロボットの動作を制御する高性能な視覚・言語・行動(VLA: Vision-Language-Action)モデル。このモデルは、行動を起こす前に思考し、そのプロセスを可視化できる。また、複数の機体を横断して学習できるため、スキル習得を加速させることが可能となっている。

Gemini Robotics-ER 1.5は、環境理解と高次推論を担う高性能な視覚・言語モデル(VLM: Vision-Language Model)である。空間認識、タスク分割、進捗推定、外部ツール呼び出しなど、ロボットの高次元な行動を統括する役割を持つ。これら2つのモデルを組み合わせることで、ロボットは複雑なタスクを計画・判断しつつ、物理空間で安全に行動できるようになるという。

  • GoogleがGemini Robotics 1.5を発表

    GoogleがGemini Robotics 1.5を発表

StripeとOpenAIがAIによる商取引用の新プロトコル「ACP」公開

9月29日、StripeとOpenAIは共同で「Agentic Commerce Protocol (ACP) 」を発表し、オープンソースで公開した。ACPは、AIエージェント、消費者、事業者の3者をむすびつけて購入プロセスを調整するオープンプロトコルである(関連記事:ChatGPTのチャット内で商品の直接購入が可能に | TECH+(テックプラス))。

このプロトコルに対応したAIエージェントは、消費者と事業者の間で決済に関するさまざまな処理を仲介する。これによって、消費者はAIサービス内から外部のeコマースサイトでの商品の購入を完了することが可能になる。例えば、AIチャットにACPが組み込まれていれば、ユーザーはチャットに表示された「購入」ボタンをクリックするだけで、対応するショッピングサイトで商品を購入できる。

OpenAIは、ChatGPTに対してこのACPを組み込んだ「インスタントチェックアウト機能」をリリースした。現在、この機能は米国のユーザー向けに提供されており、マーケットプレイスEtsyの加盟店から商品が購入できる。Shopifyの加盟店などにも近日中に対応する予定だという。

  • ACPを使ったChatGPTのインスタントチェックアウトの仕組み 出典:OpenAI

    ACPを使ったChatGPTのインスタントチェックアウトの仕組み 出典:OpenAI

Anthropic、AIモデルの最新版「Claude Sonnet 4.5」をリリース

9月30日、Anthropicは生成AIモデル「Claude Sonnet」の最新バージョンとなる「Claude Sonnet 4.5」をパブリックプレビューとして公開した。従来のモデルと比較して推論能力が向上しており、より難易度の高い課題を倫理的に解決することが可能になっている(参考記事: Anthropic「Claude Sonnet 4.5」発表、Opus超えのコーディング能力を1/5の料金で | TECH+(テックプラス))。

Anthropicは、Sonnet 4.5を「世界最高のコーディングモデル」と表現しており、コーディングのベンチマークの結果は上位モデルの「Claude Opus 4.1」を上回っている。Sonnet 4.5はとくに複数ステップからなる複雑なタスクの実行に優れており、30時間以上のタスクでも集中力を維持できるという。

Sonnet 4.5は既存のSonnet 4と同じ料金体系で利用できる。Anthropicでは、あらゆる用途でClaude Sonnet 4.5へのアップグレードを推奨している。

  • コーディングベンチマーク「SWE-bench Verified」による各モデルの比較 出典:Anthropic

    コーディングベンチマーク「SWE-bench Verified」による各モデルの比較 出典:Anthropic

OpenAI、最新動画生成AI「Sora 2」をリリース

10月1日、OpenAIは動画生成AI「Sora」の最新バージョンとなる「Sora 2」をリリースした。OpenAIによれば、Sora 2は従来のモデルに比べて物理法則の理解に優れており、映像内で物体の落下や衝突などが適切に反応するなど、現実世界の挙動をより忠実に再現できるという。オリンピックの体操競技や、パドルボードでのバックフリップなど、これまでは正確に表現するのが難しかった複雑な動きを、より自然に映像化することが可能になった。

また、音声の生成技術も向上しており、セリフやサウンド効果、背景音を映像に正しく同期するように生成できる。実際の人物の映像を入力して、その人物を生成動画の中に登場させる「カメオ機能」も備えている。

Sora 2は、iOS向けのソーシャルアプリ「Sora」を通じて提供される。当初は招待制でのローンチとなっているが、対象は段階的に拡大していくとのこと。将来的にはAPIの公開も予定されている。

大きく進化したSora 2だが、著作権に関する懸念も生じている。Sora 2の公開以来、インターネット上には他社の著作物を模した精巧なAI生成動画が大量に投稿されている。OpenAIは、著作権に違反するコンテンツをブロックするフィルターや、著作権違反を報告する仕組みを設けてはいるが、現時点の対策は不十分であり、責任ある企業としての対応が求められている。