富士通は9月26日、対話型生成AI(Artificial Intelligence:人工知能)から出力される回答の信頼性を向上する2つのAIトラスト技術として、幻覚(Hallucination)検出技術とフィッシングURL検出技術を開発したことを明らかにした。
また、これらの技術は「Fujitsu Kozuchi (code name) - Fujitsu AI Platform」の対話型生成AIコアエンジンに搭載し、9月28日より順次国内の法人向けに実証実験環境として提供する。さらに、個人向けにも同社のポータルサイト上からトライアル環境として提供するという。
今回開発した幻覚検出技術とは、生成AIの出力で幻覚が生じやすい箇所を特定して重点的に確認する技術だ。固有名詞や数値などの固有表現の部分で幻覚が生じやすく、質問のたびに回答内容が変化しやすいという傾向からヒントを得ているようだ。
具体的には、回答文を主語、述語、目的語などに分解して、その中の固有表現部分を特定した上で、そこを空欄にし尋ねるという穴埋め質問を自動で作成して外部の対話型生成AIへ複数回質問する手法である。これにより、固有表現部分の回答のばらつきをより正確に捉え、高精度に幻覚スコアを算出しているという。
もう一方のフィッシングURL検出技術は、対話型生成AIの回答文に含まれるURL情報がフィッシングURLかどうかを判定して、利用者へ画面上で提示する技術である。この技術はフィッシングURLを特定するだけでなく、AIの判断を故意に誤らせる既存の敵対的攻撃にも対応させている、
また、同技術は対話型生成AIに限らず、帳票データを扱うAIに対する全般的な攻撃への対策としても活用が期待できるとのことだ