米OpenAIは12月18日(現地時間)、同社の最新基盤モデル「GPT-5.2」をベースに、コーディング用途に最適化した新モデル「GPT-5.2-Codex」を公開した。高度なエージェント機能に加え、長時間にわたる作業や大規模なコード変更への対応力、Windows環境での実用性、サイバーセキュリティ能力などが強化された。ChatGPTの有料ユーザー向けに提供が開始されており、今後数週間以内にAPI経由での利用も可能になる予定である。
大規模なプログラムを扱う際、AIが一度に理解できる情報の限界、コンテキストウインドウの制約が課題となってきた。GPT-5.2-Codexは、作業履歴や文脈を内部的に圧縮・整理して扱う仕組みを備え、工程の長いタスクにおいても文脈を維持したまま処理を継続できるよう設計されている。
また、GPT-5.1世代から5.2世代への進化により、大規模なリファクタリングやシステム移行といった、複雑で高度な判断を伴うタスクにおける成功率が向上したとしている。
GPT-5.2-Codexは、ソフトウェア修正タスクを対象としたベンチマーク「SWE-Bench Pro」や、実際の端末操作を想定したエージェント性能を測る「Terminal-Bench 2.0」において最先端のスコアを記録した。従来モデルはLinux環境での利用に強みを持っていたが、GPT-5.2-CodexではWindows環境におけるエージェント型コーディングが格段に効果的かつ信頼性の高いものとなったという。
下の表は、情報セキュリティ分野で行われる旗取りゲームを模した「Professional Capture-the-Flag (CTF)」評価の結果である。
GPT-5-Codex以降、サイバーセキュリティ能力が急速に向上している。GPT-5.1-Codex-MaxではReactの未知の脆弱性を発見し開発元への報告・修正に繋がった事例があり、GPT-5.2-Codexでさらに性能が向上した。Preparedness Frameworkのサイバー能力評価における「高」レベルには未達だが、将来の能力向上に向けた開発・配備ロードマップが策定されているという。
AIのサイバー能力が向上すれば、それを悪用するデュアルユースのリスクも高まる。OpenAIは、APIユーザーに対して安全にアクセスを有効化するとともに、防御的なサイバーセキュリティ業務に取り組む専門家や組織を対象に、今後の新機能や、より制約の少ないモデルを試験的に提供する招待制のパイロットプログラムを並行して実施している。


