富士通は12月12日、セキュリティの攻撃や防御などに特化したスキルやナレッジを持つ複数のAIエージェントを連携させることで、ITシステムの脆弱性を悪用する攻撃や生成AIへの攻撃といった新たな脅威へのプロアクティブなセキュリティ対策を支援するマルチAIエージェントセキュリティ技術を開発したことを発表した。

今回開発した技術は、組織や拠点をまたぐ複数のAIエージェントを連携できるマルチAIエージェント連携技術、プロアクティブなセキュリティ対策に必要なAIエージェントを実現するセキュリティAIエージェント技術、生成AIのセキュリティ耐性について自動で確認し攻撃を自動的に防御・緩和する生成AIセキュリティ強化技術の3つの技術で構成される。

  • マルチAIエージェントセキュリティ技術の全体像

    マルチAIエージェントセキュリティ技術の全体像

マルチAIエージェント連携技術

組織や拠点ごとに開発されたAIエージェントを、それぞれの環境の差異を意識することなく透過的に協働させるマルチAIエージェント連携技術は、セキュリティ用途だけでなく汎用的に利用可能だという。

従来はAIエージェント同士を協働させる場合、組織や拠点のポリシーを遵守した上でのデータ秘匿やプライバシー保護が課題となる。これらの課題を解決するため、協働におけるポリシーを自律的に制御して接続するセキュアエージェントゲートウェイを組織や拠点ごとのAIエージェント基盤に導入することで、開発者が意識することなくAIエージェントを連携できるようになった。

  • AIエージェント連携のイメージ

    AIエージェント連携のイメージ

セキュリティAIエージェント技術

プロアクティブなセキュリティ対策に必要なセキュリティAIエージェントとして、攻撃AIエージェント、防御AIエージェント、テストAIエージェントをそれぞれ開発。Ben-Gurion University of the Negev(ベングリオン大学)と共同開発した技術を各AIエージェントに搭載した。

攻撃AIエージェントは、新たな脆弱性を有する対象ITシステムを侵害し得る攻撃シナリオを作成する技術である、「TTP(Tactics, Techniques, and Procedures)類推エンジン」を搭載する。防御AIエージェントは企業のリスクプロファイルに基づいた防御策を提案する技術を搭載。テストAIエージェントは本番環境システムから検証用仮想環境「サイバーツイン」を自動で構築し、防御策の影響を分析する技術を搭載する。

これらのAIエージェントをマルチAIエージェント連携技術で連携させることで、テストAIエージェントが構築した「サイバーツイン」上で攻撃AIエージェントと防御AIエージェントによる攻撃・防御シミュレーションが交互に行われ、新たな脆弱性へのプロアクティブな対策が可能となる。

生成AIセキュリティ強化技術

富士通は生成AIへの新しい攻撃に備えるため、セキュリティ耐性について自動で網羅性高く確認を行うLLM脆弱性スキャナーと、攻撃を自動的に防御・緩和できるLLMガードレールをベングリオン大学と共同開発した。

LLM脆弱性スキャナーは、生成AIに存在する3500超の脆弱性に対応。LLM脆弱性スキャナーには生成コード脆弱性チェック機能や、LLMの応答に合わせて適切な攻撃プロンプトを選択し高精度な攻撃と評価を実現するアダプティブ・プロンプト技術、生成AIを活用した脆弱性説明技術が含まれており、セキュリティの専門知識を持たなくても脆弱性評価が行えるという。

LLMガードレールはLLM脆弱性スキャナーと連携し、脆弱性と判定され対処が必要な攻撃的なプロンプトをITシステム運用中に検知し拒絶する機能である、ガード規則を自動的に適用して不適切な回答を防ぐことで、生成AIの安心安全な運用を支援する。

LLM脆弱性スキャナーとLLMガードレールは、それぞれ攻撃AIエージェントおよび防御AIエージェントと連携して動作することで、生成AI活用システムへのプロアクティブなセキュリティ対策を実現する。

  • 生成AIセキュリティ強化技術

    生成AIセキュリティ強化技術