今回は、2026年2月6日~2月23日に発表されたAI関連の注目すべきトピックを紹介する。OpenAI、Google、AnthropicがAIモデルの最新版「GPT-5.3-Codex-Spark」、「Gemini 3.1 Pro」、「Claude Sonnet 4.6」をそれぞれリリース。Googleはさらに「Gemini 3 Deep Think」の大幅アップデートも発表した。AnthropicはAIによって脆弱性を検出する新セキュリティ機能「Claude Code Security」の提供を開始。また、同社は中国のAI企業からAIモデルの蒸留攻撃を受けたとして、対策を講じたことを発表した。

それぞれ詳しく見ていこう。→連載「AIトレンド最前線」のこれまでの回はこちらを参照

OpenAI、小型モデル「GPT-5.3-Codex-Spark」を研究プレビューとして公開

2月12日、OpenAIはGPT-5.3-Codexを小型・高速化したAIモデル「GPT-5.3-Codex-Spark」を研究プレビューとして公開した。リアルタイムコーディング向けに最適化されたこのモデルは、超低レイテンシのハードウェア上で動作させた場合、1秒あたり1000トークン以上という高速な生成速度を実現するという。これはほぼ瞬時に応答していると感じられる速度であり、即時性が求められるインタラクティブなタスクにも適用できる。

OpenAIによれば、Codex-SparkはCerebras社とのパートナーシップによって実現したもので、同社が提供する超低レイテンシーの基盤上で提供されているという。ベンチマークでは、ベースとなったGPT-5.3-Codexと比較して、短時間でタスクを完了しながらも高い性能を示している。従来のCodexと組み合わせれば、長時間タスクと短時間での反復作業の双方に対応できるとのことだ。

研究プレビューはChatGPT Proユーザー向けに提供され、128kのコンテキスト対応によって大規模テキスト処理も可能となっている。ただし、専用の低レイテンシーのハードウェア上で動作するため、利用には通常とは別のレート制限が適用される。今後、実際のワークロードで最適化を進めながら提供範囲を拡大していく方針だ。

  • GPT‑5.3‑Codexと比較して短時間でタスクを完了しながらも高い性能を示している 出典:OpenAI

    GPT-5.3-Codexと比較して短時間でタスクを完了しながらも高い性能を示している 出典:OpenAI

Google、「Gemini 3 Deep Think」の大幅アップデートを発表

2月12日、Googleは科学・研究・エンジニアリング領域の課題解決に特化した高度推論モデルとして「Gemini 3 Deep Think」を大幅アップデートしたと伝えた。このアップデートによって複雑な問題への対応力が大幅に強化されており、数学、物理、化学といった専門分野で高度な解析と論理展開が可能になったとのこと。評価ベンチマークでは最先端モデルを上回る成果を記録し、理論的にも高い推論能力を持つことが確認されている。

新しいDeep Thinkモードは、Google AI Ultraの利用者がGeminiアプリで利用できるようになる。また、Googleは今回はじめてGemini API経由でのDeep Thinkモードの提供も開始するそうで、現在早期アクセスへの申請を受け付けている。

  • 主要ベンチマークにおける競合モデルとの比較 出典:Google

    主要ベンチマークにおける競合モデルとの比較 出典:Google

Anthropic、高性能と実用性を両立する「Claude Sonnet 4.6」リリース

2月17日、AnthropicはAIモデルCalude Sonnetの最新版となる「Claude Sonnet 4.6」をリリースした。今回のアップデートでは、コーディング、長文コンテキストによる推論、エージェント計画、ナレッジワーク、デザインまで幅広い能力が向上したとのこと。ベータ版で100万トークンのコンテキストウィンドウも備えている点も特長として挙げられている。

Sonnet 4.6はコストと性能のバランスが取れたモデルとして位置付けられているが、4.6では一部のベンチマークで上位モデルの「Opus」シリーズに迫る評価を獲得している。特に、コーディングやPC操作といった実務に直結する作業において顕著な性能改善を示しており、高度なタスクをこれまでよりも手軽に自動化できる可能性がある。

現在、Sonnet 4.6はClaudeの全プラン、Claude Cowork、Claude Code、API、および主要なクラウドプラットフォームで利用できる。価格は前モデルSonnet 4.5と同水準に据え置かれているため、高性能AIをコスト効率よく活用できる点が注目されている。

  • 一部ベンチマークでOpusシリーズに匹敵する性能を実現 出典:Anthropic

    一部ベンチマークでOpusシリーズに匹敵する性能を実現 出典:Anthropic

Google、高度な推論力を備えた「Gemini 3.1 Pro」のプレビュー提供を開始

2月19日、GoogleはAIモデルの最新バージョン「Gemini 3.1 Pro」を公開し、プレビュー版として提供を開始した。従来のGemini 3 Proをベースに、複雑な問題解決や高度な推論処理能力をさらに強化したもので、最大の特長として論理的推論能力の大幅な向上が挙げられている。

ベンチマークでは、抽象的な論理課題を解く能力指標が従来比で2倍以上に達し、複雑な計画立案や多段階タスク処理でも高い性能を発揮したことが示された。これは、単純な応答生成を超えた深い思考が可能になることを意味しており、研究・開発・ビジネス領域での活用範囲がさらに広がる見込みだ。

Gemini 3.1 Proは、GeminiアプリやNotebookLM、Gemini API、および開発者向けプラットフォームなどにおいて、Google AI ProおよびUltraのユーザーが利用できる。今後、プレビュー版のフィードバックをもとにエージェントワークフローなどの改良を行った上で一般公開される予定となっている。

  • 複雑な問題解決のための推論能力が強化された 出典:Google

    複雑な問題解決のための推論能力が強化された 出典:Google

Anthropic、AI搭載の新しいセキュリティ機能「Claude Code Security」の提供を開始

2月20日、AnthropicはAI搭載の新セキュリティ機能「Claude Code Security」を発表し、リサーチプレビューとしての提供を開始した。これは、AIコーディング支援ツール「Claude Code」上で動作するセキュリティ機能で、ソフトウェアコードベースを自動的にスキャンして脆弱性を検出し、修正案を提示するというもの。従来のルールベースの静的解析とは異なり、AIがコードの意味やデータの流れを理解して推論することにより、複雑なロジックの中に隠れた脆弱性も発見できる点が大きな特長となっている。

Anthropicによれば、Claude Code Securityでは、スキャン結果に対して多段階の検証プロセスを組み込むことで誤検知を抑制する仕組みになっているという。発見した脆弱性には、危険度と信頼度を付与してレポートする。また、AIが生成した修正案は、人間の開発者による承認を経た上で自動でコードに適用することができる。

Claude Code Securityは、現在は限定的なリサーチプレビューとして、EnterpriseプランおよびTeamプランの法人ユーザー向けに提供されている。また、オープンソースソフトウェアのメンテナーは、無料の優先アクセスを申請することができる。

Anthropic、DeepSeekらによるモデル蒸留攻撃事例を公表

2月23日、Anthropicは自社の大規模言語モデルが蒸留攻撃(distillation attacks)を受けていたことを公表した。蒸留攻撃とは、API経由で大量の出力を取得し、それを学習データとして別モデルを構築する手法である。先進モデルに対して、その能力を不正に模倣したり、安全対策を回避したりする目的で行われるケースが多い。今回の事案では、DeepSeek、Moonshot AI、MiniMaxと関連が疑われる利用が確認されたとのことだ。

Anthropicによれば、特定のアカウントによる自動化された大量の問い合わせパターンを分析した結果、出力の体系的な収集が行われていた兆候を検知したという。内部調査を経て、モデル性能の抽出や再現を意図した可能性があるとして、該当アカウントの停止などの措置を講じた。

同社は、この攻撃を先進的なAIモデルが直面する新たな知的財産リスクを示す事例だと位置付けている。調査結果を受けて、不審な利用パターンを特定するための行動分析や異常検知システムを強化し、モデルの出力が大規模に収集される兆候を早期に把握する仕組みを導入したことを発表。同時に、このような蒸留攻撃に対処するには、業界関係者、政策立案者、さらには世界中のAIコミュニティーが協調して行動する必要があると警鐘を鳴らしている。