米OpenAIは5月16日(現地時間)、ChatGPT上で動作する開発支援エージェント「Codex」のリサーチプレビュー版を発表した。ChatGPTのPro、Enterprise、Teamユーザーを対象に段階的な提供が始まっている。

Codexの核となるのは「codex-1」と呼ばれるAIモデルで、OpenAIの汎用推論モデル「o3」をソフトウェア開発用に最適化したものである。Codexはこのモデルを活用し、コードの生成や修正、バグ修正、テストの自動実行、プルリクエストの提案など、ソフトウェア開発の様々な局面で開発者を支援する。

Codexは、ChatGPTのサイドバーからアクセス可能で、プロンプトを入力して「Code」をクリックすることで新しいコーディングタスクを割り当てられる 。コードベースに関する質問をする場合は「Ask」を使用する 。

このエージェントは、タスクごとに独立した環境を用意し、必要に応じて自動的にテストを繰り返しながら完成度を高めていく。タスクの完了には、その複雑さに応じて通常1分から30分程度を要し、ユーザーは進捗をリアルタイムで確認できる。

開発者は、AGENTS.mdというREADME.mdに似たテキストファイルをリポジトリ内に配置することで、Codexにプロジェクト固有のナビゲーション方法、テストコマンドの実行方法、プロジェクトの標準的な慣行への準拠方法などを指示できる。

このような柔軟性と自律性により、CodexはOpenAIの技術チーム内ですでに日々の開発ツールの一部として活用し始められている。特にリファクタリングや命名変更、テスト作成といった反復的・単純な作業の効率化に利用されており、また新機能の下地作りやコンポーネントの接続、バグ修正、ドキュメントの下書きなどでも有効性が確認されているという。

OpenAIはCodexの設計において、透明性と安全性を最優先事項として掲げている。ユーザーは、引用情報、ターミナルログ、テスト結果を通じてCodexの作業内容を確認できる。Codex自身も、不明点があったりテストに失敗した場合には、その問題を明示的に伝え、ユーザーがその情報に基づいて判断できるようになっている。

マルウェア開発のような悪意のあるソフトウェア開発への利用を防ぐため、Codexはそのようなリクエストを識別して拒否するように訓練されている。

Codexはクラウド上の安全で隔離されたコンテナ内で動作し、タスク実行中、インターネットへのアクセスは無効化され、エージェントのインタラクションは、GitHubリポジトリを通じて明示的に提供されるコードと、セットアップスクリプトによってユーザーが設定した依存関係のみに制限される。外部のWebサイトやAPI、その他のサービスにアクセスすることはできない。

OpenAIは、ターミナルで動作する軽量なオープンソースのコーディングエージェント「Codex CLI」も提供しており、こちらもアップデートされた 。新たに、Codex CLIでの使用に特化したo4-miniのバージョンであるcodex-1の小型版がデフォルトモデルとして利用可能になった 。これにより、CLIでのより高速なワークフローと、低遅延でのコードに関する質疑応答や編集が可能になる。

Codexは、ChatGPT Pro、Enterprise、Teamのユーザーに対して順次提供が開始されており、PlusおよびEduユーザーへの提供も間もなく予定されている。今後数週間は追加費用なしで利用でき、Codexの機能を自由に試すことができる。その後はレート制限が導入され、オンデマンドで追加利用量を購入できる柔軟な料金オプションが提供される予定である。

codex-mini-latestはResponses APIで利用可能となっており、料金は100万トークンあたり入力が1.50ドル、出力が6ドル。プロンプトキャッシュが適用される場合、最大75%の割引が適用される。