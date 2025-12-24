2025年12月5日〜12月22日に発表されたAI関連の注目すべきトピックを紹介する。Linux FoundationはAnthropic、Block、OpenAIらと共同でエージェント型AIのための新団体「Agentic AI Foundation（AAIF）」を設立した。AIモデルの最新版としては、OpenAIが「GPT-5.2」、「GPT-5.2-Codex」、「GPT Images」を、Googleが「Gemini 3 Flash」を、NVIDIAがオープンモデルの「Nemotron 3」をリリースした。またGoogleは実験的なAIブラウザー「Disco」を発表した。

それぞれ詳しく見ていこう。

Linux Foundationがエージェント型AIの標準化を推進する「Agentic AI Foundation」を設立

12月9日、Linux Foundationはエージェント型AIのための新団体「Agentic AI Foundation（AAIF）」の設立を発表した（参考記事:Linux Foundationが「Agentic AI Foundation」の設立でAIエージェント標準化を推進 | TECH+（テックプラス））。AIエージェント技術の透明で協調的な進化を促進する中立的な基盤を提供することを目的としており、Anthropic、Block、OpenAIが主要技術を寄贈する形でスタートする。AWS、Google、Microsoft、Cloudflareなどの主要企業もプラチナメンバーとして参加する。

中核となるのは、Anthropicの「MCP（Model Context Protocol）」、Blockの「goose」、OpenAIの「AGENTS.md」の3つ。MCPはAIモデルを外部のツールやデータ、アプリケーションに接続するためのプロトコルで、すでに多くのAIサービスやAIツールで採用が進んでいる。gooseは言語モデル、拡張可能なツール、MCP統合を組み合わせたオープンソースのエージェントフレームワークで、ローカル優先で信頼性の高いエージェント実行環境を提供する。

AGENTS.mdはAIエージェント向けのガイドライン記述フォーマットで、異なるリポジトリーやツールチェーンで一貫した振る舞いを実現するのに役立つ。これらの基盤技術をAAIFが統合し、標準化することで、エージェント型AIの相互運用性や持続可能性の向上を目指すという。

Agentic AI Foundationの3つの中核プロジェクト 出典:Agentic AI Foundation

OpenAI、最新AIモデル「GPT-5.2」および「GPT-5.2-Codex」をリリース

12月11日、AIモデル「GPT」シリーズの最新版となる「GPT-5.2」をリリースした（参考記事:OpenAIが「GPT-5.2」発表、Gemini急伸で“コードレッド”発動下の最新AIモデル | TECH+（テックプラス））。汎用的な知性、長文コンテキストの理解、エージェントによるツール呼び出し、画像理解など幅広い領域で大幅な性能向上を実現しており、専門的な知識作業や複雑なタスクへの対応力が従来モデルを上回っている。

GPT-5.2における主なアップデートとしては、まず長文コンテキストの理解能力が大きく改善された点が挙げられる。これにより、数十万トークン規模の文書でも前後関係を保持して精度の高い応答が可能になったという。また、推論・論理的思考能力やツール呼び出し機能が強化されており、スプレッドシートやプレゼン資料、コード生成など実務的な成果物の生成精度と効率が向上した。さらに、誤情報の抑制や事実性の改善も進んでいる点も特徴として挙げられている。

また、OpenAIは12月18日にGPT-5.2ベースのコーディング支援AI「GPT-5.2-Codex」もリリースした。主なアップデートとしては、過去のやりとりを圧縮して長時間にわたるコーディング作業を実現するコンテキスト圧縮、リファクタリングや大規模なコード移行といった複雑タスクへの対応強化、Windows環境でのパフォーマンス向上などが挙げられている。

スプレッドシートやプレゼン資料生成などの実務タスク性能が向上 出典:OpenAI

Google Labs、Geminiを搭載したAIブラウザー「Disco」を発表

12月11日、Googleの研究部門であるGoogle LabsがAIモデル「Gemini 3」を搭載した実験的なWebブラウザー「Disco」を発表した。DiscoはWebとの関わり方を根本から見直すという野心的な試みの一環であり、従来のWebブラウザーとは異なる新しいWeb体験を提供することを目的としている。

Discoの中核となるのは「GenTabs」と呼ばれる機能で、開いている複数のタブやチャット履歴からユーザーの意図をAIが解析し、ユーザーの目的に特化したカスタムアプリを自動生成する。GenTabsを使えば、旅行計画や学習支援、食事管理など、複数のWebページの情報を統合した実用的なアプリを、コーディング不要で即座に構築できる。Discoを使ったユーザー体験は、Webで調べ物をするのではなく、アプリを使った作業の中で自然にWebと対話するというものになる。

Discoはまだ初期テスト段階であり、使ってみたいユーザーはウェイトリストに登録してアクセス権が提供されるのを待つ必要がある。現在提供されているのはmacOS版のみだが、WindowsおよびChromeOSにも今後対応する予定だという。

Web利用の目的に特化したカスタムアプリを素早く構築 出典:Google

NVIDIA、オープンモデルの「Nemotron 3」ファミリーを発表

12月15日、NVIDIAはオープンAIモデルの新シリーズ「Nemotron 3」ファミリーを発表した（参考記事:NVIDIAがオープンAIモデル「Nemotron 3」発表、マルチエージェントを効率化 | TECH+（テックプラス））。Nemotron 3は、エージェント型AIアプリケーションの構築を目的としたオープンな大規模モデル、データセット、ライブラリーの集合で、Nano／Super／Ultraの三つのサイズで提供される。

Nemotron 3ファミリーの中核となるのはハイブリッド型Mixture-of-Experts（MoE）アーキテクチャーで、エキスパート（専門家）の役割を担うニューラルネットワークと、入力内容に応じて使用するエキスパートを選択するルーターネットワークを組み合わせることで、推論効率とコスト最適化の両立を実現している。

Nanoモデルは300億パラメーターの小型モデルで、対象を絞った高効率のタスクに適している。Superモデルは約1,000億のパラメーターとトークンあたり最大100億のアクティブパラメーターを備えた高精度推論モデルで、複雑なタスクや長時間のエージェント作業に対応できるとされている。Ultraモデルは約5000億のパラメーターとトークンあたり最大500億のアクティブパラメーターを備え、複雑なAIアプリケーションや大規模なマルチエージェントシステムの構築に対応する。

NVIDIAではさらに、大規模なトレーニングデータセットや開発用ライブラリーも合わせて公開。スタートアップから大企業まで、幅広い開発者が迅速にエージェント型AIを実装できる環境を提供していくという。

Nemotron 3のハイブリッドアーキテクチャー 出典:NVIDIA

OpenAI、画像生成AIモデル「GPT Images」の最新版をリリース

12月16日、OpenAIは画像生成AIモデル「GPT Image」の新バージョンをリリースした。生成・編集の両面で従来モデルから大きく進化しており、処理速度も従来より最大4倍高速になったという。

今回のアップデートでは、テキスト理解力の向上によって、指示に対する追従性が大幅に改善している。構図、スタイル、細部の条件など複雑なプロンプトを正確に解釈し、意図に沿った画像を安定して生成できる。とくに文字を含む画像や、UIモック、図解、インフォグラフィックといった、従来は難易度の高かった生成においても、可読性と整合性が大きく向上した。テキストレンダリングも向上しており、文字量の多いテキストや小さな文字も正確に扱えるようになった。

大量の人物の顔も鮮明に描き分けられる 出典:OpenAI

Google、速度と効率重視のAIモデル「Gemini 3 Flash」をリリース

12月17日、Googleは高速性と低コストを重視したAIモデルの最新版「Gemini 3 Flash」をリリースした。Gemini 3 Flashは、Gemini 3ファミリーの中でも軽量かつ高効率ないちづけのモデルであり、リアルタイム性が求められる用途や大量リクエスト処理に適した設計になっている点が特徴。

Gemini 3 Flashは推論速度を重視して最適化されており、チャット、要約、分類、軽量な推論タスクなどで即時性の高い応答を実現する。Gemini 3 Proと比べて処理が軽く、アプリケーションへの組み込みやユーザー向けインタラクションにおいて、スケーラブルに利用できる点が大きな強みとなる。

それに加えて、マルチモーダル対応と実用十分な知能水準を備えているのも大きなポイント。テキストだけでなく画像理解にも対応し、日常的な質問応答や業務補助、コンテンツ生成といった用途で十分な実用性を発揮する。また、Gemini 3 Flashは反復開発向けに設計されているため、コーディングタスクでは低レイテンシでProグレードの性能を発揮することができる。SWE-bench VerifiedベンチマークではGemini 2.5シリーズだけでなくGemini 3 Proを上回る評価を獲得したという。

Gemini 3 Flashは、2.5 Flashに代わって、Geminiアプリのデフォルトモデルとして展開されている。