フォント改ざんでAI検出を回避、主要ツールがすべて失敗

LayerX Securityは3月17日(現地時間)、「Poisoned Typeface: How Simple Font Rendering Poisons Every AI Assistant, And Only Microsoft Cares - LayerX」において、Webサイトに表示される悪意のあるテキストをAIから隠蔽する手法を発見したと報じた。

この手法はフォントの仕組みを悪用し、人間には正常に見える一方で、AIには意味不明な文字列として認識させるという特徴を持つ。この結果、ChatGPTやClaudeなど主要なAIツールによる検出はすべて失敗したとされ、ClickFix戦術などの攻撃成功率を高める可能性がある。

悪意のあるテキストをAIから隠蔽する手法が発見　Photo：PIXTA

フォント改ざんで「表示」と「実体」を乖離させる

この攻撃手法は文字のレンダリングに使用する「フォント」を悪用する手口とされる。通常のフォントは文字とグリフ(描画形状)が1対で定義され、「A」は「A」、「あ」は「あ」にマッピングされる。

今回発見された手法はこの常識を逆手に取り、文字を別のグリフにマッピングするカスタムフォントを使用する。「実際の文字」と「表示される文字」が一致せず、正常に表示されるHTMLファイルを作成すると、ファイルには意味のわからない文字列が記述されることになる。

LayerX Securityが公開したサンプル。上が実際の表示、下がHTMLファイル内の文字列

ChatGPTやClaudeでも検出できず、すべてのAIが失敗

この手法で細工されたHTMLファイルをAIツールで解析した場合、AIは「意味のわからない文字列」をそのまま処理することになる。そのため、悪意ある指示や誘導の意図を正しく理解できない。

LayerX SecurityはChatGPTやClaudeなど複数のAIチャットで検証を行い、すべてのツールで攻撃の検出に失敗したと報告している。

この仕組みは、文字列を見かけ上とは異なる内容に変換する点で、簡易的な暗号化とも言える。したがってAIだけでなく、従来のセキュリティ製品でも検出を回避する可能性がある。

AI各社は対応に温度差、Microsoftのみ対策を検討

LayerX Securityは責任ある情報開示に基づき、AnthropicやOpenAIなど、主要なAIプラットフォームプロバイダーにこのことを通知した。しかしながら、この手法はAIツールのセキュリティ範囲外にあるとして、多くの企業は、この問題をAIのセキュリティ範囲外として対応を拒否したという。

一方でMicrosoftは対策に前向きな姿勢を示しており、Googleも一時的に対応を表明したが、その後撤回したとされる。

AIの「安全性」を過信するな、ユーザー側の警戒が必要

LayerX Securityはこの攻撃を検出する方法として、ファイル内の文字列と、実際のレンダリング結果を比較する手法を提案している。この他にはカスタムフォントのグリフを読み取り、正確性判定を行う方法が考えられるが、こちらは提案していない。

ただし現時点で一般ユーザー向けの明確な対策は示されていない。今回の手法はClickFix戦術やフィッシング詐欺への応用が想定されるため、ユーザー側の警戒が重要になる。

特に、Webサイト上でコマンド入力を求められる場合や、アプリのインストール・アップデートを促される場合には慎重な判断が求められる。

フォント改ざんでAI検出を回避、主要ツールがすべて失敗

フォント改ざんで「表示」と「実体」を乖離させる

ChatGPTやClaudeでも検出できず、すべてのAIが失敗

AI各社は対応に温度差、Microsoftのみ対策を検討

AIの「安全性」を過信するな、ユーザー側の警戒が必要

AIが勧める、あなたのための会員限定記事

Google Workspaceをビジネスで活用する第136回編集可能なスライド生成に変化、「Googleスライド」のスライド生成機能を応用

SK hynixの2026年第1四半期売上高は前年同期比3倍の52兆ウォン、利益は5倍増で過去最高を更新

XRISM、スターバースト銀河観測で重元素を運ぶ「銀河風」の正体に肉薄

ソフトバンク×WeWork、AIスタートアップを“一体支援”　計算基盤とコミュニティで事業化へ

Intelの2026年第1四半期の売上高は前年同期比7％増の136億ドル、AI需要が後押し

ルネサスの2026年第1四半期決算、営業利益はGAAPベースで前年同期比320.7％増の906億円

編集部が選ぶ関連記事

MetaのAIグラス、トイレ映像も共有される可能性　社内レビューの実態とは

Google、iPhoneを狙う強力なエクスプロイトキット「Coruna」を発見

OpenAI、AIコードレビュー「Codex Security」公開　OSSで脆弱性14件発見

AIエージェントフレームワーク「MS-Agent」に脆弱性、任意コマンド実行の恐れ

関連リンク

iPhoneやiPadで“消した通知が消えない問題”修正　iOS 26.4.2とiOS 18.7.8公開

フィッシング詐欺はなぜ急増した？攻撃基盤は中国から米国クラウドへ移行か

AI活用に伴うセキュリティ管理を支援する「AI対応データ保護管理サービス」、TIS

Windows 11にウイルス対策ソフトは不要？Defenderだけで十分なのか

クラウド環境をトータルに守る統合セキュリティ「サテライトオフィス/ネクストセットセキュリティスイート」

日本のクレカ情報は「世界最高値」　NetflixやSNSも売買の実態

このカテゴリーについて

フォント改ざんでAI検出を回避、主要ツールがすべて失敗

フォント改ざんで「表示」と「実体」を乖離させる

ChatGPTやClaudeでも検出できず、すべてのAIが失敗

AI各社は対応に温度差、Microsoftのみ対策を検討

AIの「安全性」を過信するな、ユーザー側の警戒が必要

AIが勧める、あなたのための会員限定記事

Google Workspaceをビジネスで活用する 第136回 編集可能なスライド生成に変化、「Googleスライド」のスライド生成機能を応用

SK hynixの2026年第1四半期売上高は前年同期比3倍の52兆ウォン、利益は5倍増で過去最高を更新

XRISM、スターバースト銀河観測で重元素を運ぶ「銀河風」の正体に肉薄

ソフトバンク×WeWork、AIスタートアップを“一体支援” 計算基盤とコミュニティで事業化へ

Intelの2026年第1四半期の売上高は前年同期比7％増の136億ドル、AI需要が後押し

ルネサスの2026年第1四半期決算、営業利益はGAAPベースで前年同期比320.7％増の906億円

編集部が選ぶ関連記事

MetaのAIグラス、トイレ映像も共有される可能性 社内レビューの実態とは

Google、iPhoneを狙う強力なエクスプロイトキット「Coruna」を発見

OpenAI、AIコードレビュー「Codex Security」公開 OSSで脆弱性14件発見

AIエージェントフレームワーク「MS-Agent」に脆弱性、任意コマンド実行の恐れ

関連リンク

iPhoneやiPadで“消した通知が消えない問題”修正 iOS 26.4.2とiOS 18.7.8公開

フィッシング詐欺はなぜ急増した？攻撃基盤は中国から米国クラウドへ移行か

AI活用に伴うセキュリティ管理を支援する「AI対応データ保護管理サービス」、TIS

Windows 11にウイルス対策ソフトは不要？Defenderだけで十分なのか

クラウド環境をトータルに守る統合セキュリティ「サテライトオフィス/ネクストセット セキュリティスイート」

日本のクレカ情報は「世界最高値」 NetflixやSNSも売買の実態

このカテゴリーについて

Google Workspaceをビジネスで活用する第136回編集可能なスライド生成に変化、「Googleスライド」のスライド生成機能を応用

ソフトバンク×WeWork、AIスタートアップを“一体支援”　計算基盤とコミュニティで事業化へ

MetaのAIグラス、トイレ映像も共有される可能性　社内レビューの実態とは

OpenAI、AIコードレビュー「Codex Security」公開　OSSで脆弱性14件発見

iPhoneやiPadで“消した通知が消えない問題”修正　iOS 26.4.2とiOS 18.7.8公開

クラウド環境をトータルに守る統合セキュリティ「サテライトオフィス/ネクストセットセキュリティスイート」

日本のクレカ情報は「世界最高値」　NetflixやSNSも売買の実態