Neowinは4月7日(現地時間)、「Anthropic just unveiled its most dangerous AI model and is keeping it out of public hands」において、Anthropicが最新AIモデル「Claude Mythos Preview」を発表したものの、その強力すぎる性能ゆえに一般公開を制限する異例の措置を講じたと報じた。

Neowinはこれを「通常の製品発表というよりは世界的な緊急信号に近い」と指摘している。

  • なぜAnthropicのAI「Claude Mythos」は公開されないのか Photo:PIXTA

    なぜAnthropicのAI「Claude Mythos」は公開されないのか Photo:PIXTA

Claude Mythosは何がすごい?従来モデルとの違いは

Anthropicは4月7日に生成AIの新たなフロンティアモデルのプレビュー版「Claude Mythos Preview」を発表した。このモデルの発表は、世界的なソフトウェアにおける脆弱性の発見および修正を目的とした「Project Glasswing」の一環である。

AnthropicはMythos Previewについて、これまでの最高峰であった「Claude 4 Opus」を大幅に上回る性能を備えていると説明している。しかし、その圧倒的な能力ゆえに一般への公開がきわめて危険であると判断し、一般公開を見送る判断を下した。

なぜ危険?脆弱性を組み合わせてPC乗っ取りも可能に

同社が公開を制限する措置を取った背景には、このモデルが持つ高度なサイバー攻撃能力がある。内部テストにおいて、Mythos PreviewはオープンソースのOSやライブラリで、すでに数千件に及ぶ深刻な脆弱性の特定に成功したという。

さらに、単に欠陥を見つけるだけでなく、複数のLinuxカーネルの脆弱性を自律的に組み合わせることで、PCの完全な乗っ取りにも成功したとのこと。

AIがサイバー攻撃を自動化する時代は来るのか?

歴史的に、サイバー攻撃への参入障壁は、攻撃者に要求される専門知識の高さによって保たれてきた。Mythos Previewはその前提を崩しうる存在だ。高度なエージェント型推論とコーディング能力は、サイバーセキュリティ分野に特化して開発されたわけではないにもかかわらず、結果としてサイバー攻撃に転用可能な能力を内包している。

実際に、サイバー攻撃グループが、既存のLLMを使用してサイバー攻撃や諜報活動を自動化していたという事例も報告されている。

Mythos Previewはこれまで人間の能力では発見できなかった多くの脆弱性を発見したが、この能力は悪意を持って用いれば、容易にサイバー攻撃に転用できてしまう。これは、「Anthropicが危険なモデルを作った」という個別の問題ではなく、AIの能力向上が構造的に内包しているリスクだと言える。

なぜ一般公開されない?誰が使えるのか

Mythos Previewは現在、誰でも利用できるわけではない。Project Glasswingに参加するパートナーに対してのみ公開されている。

その参加企業には、Apple、Amazon Web Services(AWS)、Google、Microsoft、NVIDIAといった主要なテック企業が名を連ねている。

また、重要ソフトウェア基盤を構築・保守する40以上の追加組織にもアクセス権を広げ、最大1億ドルのMythos Preview利用クレジットを提供する計画である。

なぜこれらの企業が選ばれたのか。いずれも世界中のソフトウェア基盤やクラウドインフラを支える存在であり、脆弱性の影響範囲が極めて広いからだ。

加えて、Linux FoundationやApache Software Foundationなどのオープンソースセキュリティ団体に400万ドルを直接寄付することも発表した。AIを使ったサイバー攻撃の先鋭化に対抗するには、より強力な最新AIによって先行して防御側の能力を高めるしかない。