Microsoftは8月5日(現地時間)、支援なしにソフトウェアを分析・分類できる自律型AIエージェント「Project Ire」を発表した。詳細は公式ブログ記事「Project Ire autonomously identifies malware at scale - Microsoft Research」にてアナウンスしている。
ブログによると、Project Ireはセキュリティの専門知識、運用に関する知識、世界中のマルウェアテレメトリデータ、そしてAI研究を結集して構築されたAIシステムとされる。ソフトウェアの出所や目的に関する手掛かりが一切ない状況から完全なリバースエンジニアリングを行い、その出力を検証することでソフトウェアの害悪の有無を判定できるという。
リバースエンジニアリングツールを使用するAIエージェントが課題に対処
Project Ireは、ソフトウェアのリバースエンジニアリングツールを使用し、低レベルのバイナリ解析から制御フローの構築、コード動作の高レベル解釈まで推論可能とされる。害悪の評価プロセスは、主要機能の特定と専門家の見解との照合によって行われるという。
主要機能の特定は、ファイルの種類、構造、潜在的な関心領域の特定から始まり、angrおよびGhidraなどのフレームワークを使用した制御フローグラフの再構築、反復的な機能分析と専用ツールの呼び出しによって行われる。この反復処理では「証拠の連鎖」が記録され、どのようにして結論に至ったかを示すログが記録される。
このようにして構築された主要機能などのレポートは、マルウェアリバースエンジニアなどの専門家の見解を活用する検証ツールで照合され、最終レポートの作成と害悪の分類が行われる。
予備テストでは優れた性能を確認
Microsoftは性能評価として、2つの初期評価を実施している。1つは悪意のあるものと、無害なものが混在するWindowsドライバーを使用。もう一方は、アンチウイルスソフトウェアを無効にするマルウェアを特定できるかが検証された。
前者の試験では、全ファイルの90%を正しく識別し、無害なファイルの誤検出は2%にとどまったという。適合率は0.98、再現率は0.83を達成し、セキュリティ運用への導入が十分可能だとしている。
後者についてもProject Ireは悪意のあるコードを特定し、悪意のあるソフトウェアと識別できたという。ただ、この試験ではコードの動作を誤認したことが確認されている。最終的な検証ツールによる照合の段階で、この誤認については「検証できなかった」との結論を生成しており、ハルシネーション(誤情報の生成)をある程度防止できたとしている。
MicrosoftはProject Ireの成果をMicrosoft Defenderで活用する予定だ。当面は速度と精度の向上に注力し、未知のマルウェアに遭遇した場合においても正しく分類できるように取り組むとしている。そして最終的には未知のマルウェアをメモリ内で直接、大規模に、検出できるようにしたいと将来の展望を述べている。
