NTT、情報漏洩を防止しつつ大規模言語モデルを活用する新技術を開発

NTTは7月7日、大規模言語モデル(LLM)を用いた自動応答システムにおいて、過去の利用者データからの情報漏洩を抑えつつ、応答精度を向上させる手法を確立したと発表した。

同成果は、NTT 社会情報研究所の山﨑雄輔氏、NTT コミュニケーション科学基礎研究所の丹羽健太氏、NTT コンピュータ＆データサイエンス研究所の千々和大輝氏、NTT 社会情報研究所の深見匠氏、同・三浦尭之氏らの共同研究チームによるもの。詳細は、7月13日から19日にかけて開催される機械学習分野の国際会議「ICML 2025」にて発表される予定だ。

文脈内学習(ICL)は、与えられた例文に基づきLLMの応答を誘導する手法で、定型的な問い合わせ対応の自動化などに有効だ。例えば、LLMベースのチャットボットで「購入物品の未着→配送」のような過去の利用者の入力と応答のペア(例題)を文脈として与えることで、新規の問い合わせも過去の傾向に基づき分類し、自動で定型応答を示す。

しかしこの仕組みでは、過去の問い合わせ内容が別の利用者への応答に反映されるため、似た問い合わせを繰り返されると、特定の情報が統計的に第三者に漏れる危険性があるとのこと。これは、個人を直接特定しない情報でも、やり取りの中で漏洩しうる点が特徴であり、今後のLLM活用における懸念事項だとされる。

近年、入力と応答が1対1の構造化データに対する統計的な漏洩リスク低減のため、例題に単語レベルでノイズを加える「差分プライベートなICL」(DP-ICL)が使われている。しかし、ノイズの影響で例題が曖昧になり、LLMが正しい応答傾向を捉えにくいため、応答精度が大きく低下する課題があった。これまで無関係な単語の除外といった経験的な工夫で、その精度改善が試みられてきたが、その理論的説明は不十分だった。そこで研究チームは今回、DP-ICLにおける応答精度低下の原因を理論的に分析。安全性と応答精度を両立する。新たな安全な例題生成手法を提案したとする。

ICLの利用における情報漏洩リスクと、その対処アプローチの概要。(a)ICLを用いたサービスイメージと機微情報漏洩リスクの例。(b)ノイズによる漏洩リスク低減イメージ(出所:NTT Webサイト)

ICLは、例題に基づきLLMが応答傾向(ルール)を推定する仕組みといえる。今回の研究では、ノイズがこのルール推定に与える影響をベイズ推論で理論的に解析した結果、2つの新たな知見が明らかに。まず、無関係な単語を生成候補からあらかじめ除外することで、ノイズによるルール推定への悪影響を緩和できることが理論的に示された。これは、経験的に行われてきた単語の生成候補削減による性能改善の理論的な裏付けとなるという。また次に、ルールを特徴づける単語の生成確率を意図的に高めることで、ノイズが加えられた例題からでもLLMが正しいルールをより高精度に推定できることがわかったとのこと。これは、既存研究で見落とされていた、DP-ICL応答精度改善の新たな方向性を示すものだとしている。

例えば、「注文番号＃12345のイヤホンが届いていなかった」に対しては、「配送」という応答と分類するのが正しい対応だ。しかし例題にノイズを加えると、「なんか商品が変なのだが→配送」のような曖昧な例題が生成される場合がある。この文は一見自然だが、「とりあえず」や「商品」といった語は分類の手がかりとしては乏しく、本来の重要語である「イヤホン」や「届かない」などの情報が埋もれてしまう。すると、新たな入力「商品が破損して届いた」に対しても、モデルが「配送」と誤分類するなど、ルールの誤認による分類ミスが生じるリスクがある。

この誤りに対し、今回の成果により、「なんか」のような分類に寄与しない単語を生成候補から除外することで、ルールの安定した推定が可能になった。さらに、「届かない」や「壊れた」といったルールを特徴づける単語の生成確率を適切に高めることで、ノイズが加えられてもLLMが「配送」や「返品」などのルールをより正確に推定できると理論的に示された。

そしてこれらの理論的知見に基づき、差分プライバシーを維持しつつルールの推定精度を向上させる新たな例題生成手法「Plausible Token Amplification」(PTA)が提案された。PTAは、無関係な語の生成を抑え、ルールを特徴づける単語の生成確率を高めた上で、ノイズを加えて安全な例題を生成する。これにより、ノイズ入りの安全な例題からでもLLMは正しいルールを高精度に推定でき、応答精度と安全性の両立を実現する。

今回提案されたPTAの概略図。(左)重要な単語を強調。(右)ルール推定成功により応答精度が向上(出所:NTT Webサイト)

PTAの有効性は、ニュース記事のトピック分類タスクを用いて既存DP-ICL手法と比較した結果、精度向上が確認されたといい、ノイズを加えないICLとも同等の精度を実現できることも解明されたとした。

文章分類タスクにおける評価結果。(左)差分プライバシーにより定量化される安全性の強度ε(値が小さいほど漏洩リスクが低い)を変化させた場合のベンチマーク精度の手法間比較。(右)トピックカテゴリが「世界情勢」の場合に、PTAで生成されたニュース記事の冒頭例(出所:NTT Webサイト)

研究チームは今後、安全な例題生成時の単語強調処理を高度化し、定型タスクにおける統計的な情報漏洩リスクを抑えつつ、高精度な応答を維持できる手法の確立を目指すとした。これにより、医療・金融・行政など、データの扱いに慎重さが求められる分野でのLLM活用が期待されるとする。

現在のPTAは、入力と応答があらかじめ定められた形式を前提とするが、今後はより柔軟な構造の入力を扱うタスクへの応用も視野に入るという。例えば、自由記述形式の問い合わせや複数分類の併用など、実運用で求められるユースケースへの対応も可能にする。これにより、将来のデータ漏洩リスクに備え、より幅広い分野でデータのセキュリティに配慮したLLM活用環境の実現を目指すとしている。