Anthropic、同社史上最高性能のAI「Mythos」発表　危険性を踏まえ一般公開見送り

米Anthropicは4月7日（米国時間）、新たなフロンティアモデル「Claude Mythos」を発表した。同社は、このモデルが高いサイバー攻撃能力にもつながり得ることから一般公開は行わず、防御的なサイバーセキュリティ用途に限定して、プレビュー版の「Mythos Preview」を40以上の組織に提供する。同社はこの取り組みを「Project Glasswing」と名付け、重要ソフトウェアの防御を目的とした業界横断プロジェクトと位置づけている。

Anthropicによれば、Mythos Previewは現行の最上位モデルであるClaude Opus 4.6を複数の評価で大幅に上回る性能を持つ。ソフトウェアコーディングのベンチマーク「SWE-bench Verified」ではOpus 4.6の80.8%に対し93.9%を達成。学術的推論（GPQA Diamond）でも94.6%と高い水準を示した。サイバーセキュリティ分野の評価基準「CyberGym」では、Opus 4.6の66.6%に対し83.1%を記録している。

Anthropicは、Mythos Previewについてサイバーセキュリティに特化した訓練は行っていないとしている。Terminal-Bench 2.0で、Opus 4.6の65.4%を大きく上回る82.0%を達成するなど、強力なエージェント型コーディング能力や推論力がサイバー分野での高い性能につながっていると説明している。

Anthropicによると、Mythos Previewはここ数週間のテストで、主要OSや主要Webブラウザを含む広範なソフトウェアから、数千件の高深刻度のゼロデイ脆弱性を発見した。OpenBSDで27年間潜んでいた脆弱性、動画処理ライブラリFFmpegで16年間見過ごされてきた脆弱性など、それらの中には長年にわたって人間によるレビューや数百万回の自動テストをすり抜けてきたものも含まれる。

Anthropicは、現時点でMythos Previewを一般に公開する予定はないと明言している。 AIモデルのコーディング能力が急速に高まり、悪意ある主体に拡散した場合に国家安全保障や経済、公共の安全に深刻な影響を及ぼし得るとみている。

同社の社内検証において、セキュリティ訓練を受けていないエンジニアでも、Mythos Previewへの指示によって短時間でリモートコード実行につながる脆弱性を発見し、完全動作するエクスプロイトを作成できた事例が確認されたという。これは、専門知識がなくても高度なサイバー攻撃が可能になり得る現実を浮き彫りにしている。

大手テクノロジー企業が発足パートナーとして参加

Project Glasswingには、Amazon Web Services、Apple、Broadcom、Cisco、CrowdStrike、Google、JPMorganChase、Linux Foundation、Microsoft、NVIDIA、Palo Alto Networksが発足パートナーとして参加する。

Anthropicはこれらに加え、重要ソフトウェア基盤を構築・保守する40以上の追加組織にもアクセスを広げる計画で、最大1億ドル分のMythos Preview利用クレジットを提供する。また、オープンソースのセキュリティ関連組織に対して400万ドルの直接寄付も行う。寄付先にはLinux Foundation傘下のAlpha-OmegaおよびOpenSSF、Apache Software Foundationが含まれる。

Anthropicは、Mythos Previewの攻撃・防御両面でのサイバー能力について、米国政府関係者との継続的な協議を進めているとしている。同社は、重要インフラの防御は民主主義国家にとって最重要の安全保障課題であり、米国とその同盟国がAI技術で優位を維持する必要があるとの認識も示した。