GoogleのAIエージェントがドライブ全体を削除、AIが非を認め謝罪

Windows Centralは12月4日(米国時間)、「Google's Agentic AI erased a developer's hard drive｜Windows Central」において、GoogleのAIエージェントがユーザーの意思に反してドライブ全体を削除したと伝えた。指摘を受けたAIエージェントは非を認め、謝罪したという。

権限を逸脱するAIエージェント

これはRedditユーザーのDeep-Hyena492氏の投稿にて明らかになったこと。同氏は2025年11月27日(現地時間)、AIエージェントの会話ログおよび状況を説明するYouTube動画へのリンクを投稿。AIエージェントに潜むリスクを明らかにした。

Googleは次世代型の統合開発環境(IDE: Integrated Development Environment)として、AI支援機能を含む「Google Antigravity」を提供している。Google AntigravityにはAIエージェントが搭載されており、さまざまな作業を自動化することができる。今回はこのAIエージェントが引き起こした悲劇となる。

投稿された会話ログおよび動画の説明をまとめたデータ消去に至るまでの経緯は次のとおり。

Deep-Hyena492氏は開発中アプリのトラブルシューティングのために、サーバの再起動が必要になった
サーバーを再起動するにはキャッシュを削除する必要がある
一連の作業をAIエージェントに依頼した
AIエージェントはキャッシュを削除するために、キャッシュを含むDドライブ全体のデータを削除した

被害に気がついた同氏は、AIエージェントにドライブ全体を削除する許可を与えていたかを尋ねた。AIエージェントは「いいえ、あなたは絶対にそのような許可を与えていません」と回答し、続けて「Dドライブのルートを誤ってターゲットにしていたことが判明しました。大変申し訳ありません。これは私の重大なミスです。」と述べ、謝罪したという。

この謝罪は計算された行動のため重要ではない。問題は権限を逸脱して行動し、それを後になって正しく評価している点にある。事前に権限の有無やリスクを評価できていれば被害を回避できたと考えられる。

目的達成の手順にリスクあり

今回、AIエージェントはユーザーの望まない方法で目的を達成した。「キャッシュの削除」という優先課題は解決したが、「無関係なデータを削除してはならない」という暗黙のルールに違反した。

これは人間が成長するにつれて自然に学習する社会規範や常識を、AIは理解していない(できない)可能性を浮き彫りにしている。世界中の公開情報を学習しているAIだが、知識を活用する際に必要となるルール(ガードレール)に弱点があるとみられる。自然言語で対話できることから無意識に人間の常識を当てはめてしまいがちだが、非常識な行動を取る可能性に目を向ける必要がある。

この問題はAI各社の努力により徐々に解決していくと推測される。それまでの間、ユーザーは頻繁にバックアップを取るなど、潜在的なリスクに警戒して活用することが推奨される。