米Anthropicと米Mozillaは3月6日(現地時間)、Webブラウザ「Firefox」を対象とした共同の脆弱性調査で、AIモデル「Claude」が22件の脆弱性を発見したと発表した。このうち14件は深刻度の高い脆弱性に分類されている。これは2025年に修正された深刻度の高い脆弱性の約5分の1に相当する。Mozillaによれば、これらの問題の大半は2月24日に公開された「Firefox 148」で修正済みである。
FirefoxはオープンソースプロジェクトのWebブラウザであり、長年にわたりファジング(無作為なデータを大量に入力し、クラッシュや想定外の動作を誘発させる検証手法)や静的解析、外部研究者による監査を受けてきた。Anthropicは、Claudeが未知のセキュリティ脆弱性を発見する能力を測るため、最も厳しく検証されてきたオープンソースソフトの1つであるFirefoxを調査対象に選んだ。
調査は「Claude Opus 4.6」を中心に実施された。まずFirefoxのJavaScriptエンジンを重点的に調べたところ、開始から約20分で「Use After Free(解放後使用)」と呼ばれる深刻な問題を発見した。これは、不要になったメモリ領域を解放した後も、プログラムがその領域にアクセスし続けてしまう不具合である。悪用された場合、攻撃者によって不正なコードが実行される恐れがある。
Anthropicは2週間にわたって調査を行い、最終的にMozillaへ112件の報告を提出した。このうち22件がCVE番号付きのセキュリティ脆弱性であった。残る90件はクラッシュやロジックエラーなど、直接はセキュリティ問題に当たらない不具合だった。ただし、こうした不具合も複数の弱点を組み合わせる攻撃の足掛かりになる可能性がある。
今回の調査は、既存のセキュリティテストでは見つけにくかった論理的な欠陥についても、AIが発見に役立つ可能性を示した。これは、AIが従来のセキュリティ手法を補完する新たな防御手段になり得ることを示す事例といえる。
一方、Anthropicは、Claudeの「見つける」能力に比べ、「悪用する」能力はまだ限定的だと説明している。実際に、発見済みの脆弱性を使った攻撃コード(エクスプロイト)の作成を試み、約4000ドル分のAPI利用枠を費やして数百回のテストを繰り返したものの、成功したのは2件のみであった。しかも、それらはサンドボックスなどの保護機構を意図的に外した検証環境でのみ機能するものであった。現時点では、AIは攻撃側よりも防御側でより実用的に機能していると分析されている。
なおAnthropicは2月、セキュリティ分野でのAI活用を支援する「Claude Code Security」をリサーチプレビューとして公開している。これはコードベースを解析し、脆弱性の検出や修正案の提示を行う機能であり、企業顧客やオープンソース保守者向けに提供されている。Anthropicは今回の調査を、同機能が想定する活用シナリオの有効性を示す事例に位置づけている。
