なぜ公開されない？危険すぎるAnthropicのAI「Claude Mythos」の正体とリスク

Neowinは4月7日(現地時間)、「Anthropic just unveiled its most dangerous AI model and is keeping it out of public hands」において、Anthropicが最新AIモデル「Claude Mythos Preview」を発表したものの、その強力すぎる性能ゆえに一般公開を制限する異例の措置を講じたと報じた。

Neowinはこれを「通常の製品発表というよりは世界的な緊急信号に近い」と指摘している。

なぜAnthropicのAI「Claude Mythos」は公開されないのか　Photo:PIXTA

Claude Mythosは何がすごい？従来モデルとの違いは

Anthropicは4月7日に生成AIの新たなフロンティアモデルのプレビュー版「Claude Mythos Preview」を発表した。このモデルの発表は、世界的なソフトウェアにおける脆弱性の発見および修正を目的とした「Project Glasswing」の一環である。

AnthropicはMythos Previewについて、これまでの最高峰であった「Claude 4 Opus」を大幅に上回る性能を備えていると説明している。しかし、その圧倒的な能力ゆえに一般への公開がきわめて危険であると判断し、一般公開を見送る判断を下した。

なぜ危険？脆弱性を組み合わせてPC乗っ取りも可能に

同社が公開を制限する措置を取った背景には、このモデルが持つ高度なサイバー攻撃能力がある。内部テストにおいて、Mythos PreviewはオープンソースのOSやライブラリで、すでに数千件に及ぶ深刻な脆弱性の特定に成功したという。

さらに、単に欠陥を見つけるだけでなく、複数のLinuxカーネルの脆弱性を自律的に組み合わせることで、PCの完全な乗っ取りにも成功したとのこと。

関連記事: Anthropic、同社史上最高性能のAI「Mythos」発表　危険性を踏まえ一般公開見送り | TECH+（テックプラス）

AIがサイバー攻撃を自動化する時代は来るのか？

歴史的に、サイバー攻撃への参入障壁は、攻撃者に要求される専門知識の高さによって保たれてきた。Mythos Previewはその前提を崩しうる存在だ。高度なエージェント型推論とコーディング能力は、サイバーセキュリティ分野に特化して開発されたわけではないにもかかわらず、結果としてサイバー攻撃に転用可能な能力を内包している。

実際に、サイバー攻撃グループが、既存のLLMを使用してサイバー攻撃や諜報活動を自動化していたという事例も報告されている。

Mythos Previewはこれまで人間の能力では発見できなかった多くの脆弱性を発見したが、この能力は悪意を持って用いれば、容易にサイバー攻撃に転用できてしまう。これは、「Anthropicが危険なモデルを作った」という個別の問題ではなく、AIの能力向上が構造的に内包しているリスクだと言える。