NTTは7月7日、倧芏暡蚀語モデル(LLM)を甚いた自動応答システムにおいお、過去の利甚者デヌタからの情報挏掩を抑え぀぀、応答粟床を向䞊させる手法を確立したず発衚した。

同成果は、NTT 瀟䌚情報研究所の山雄茔氏、NTT コミュニケヌション科孊基瀎研究所の䞹矜健倪氏、NTT コンピュヌタデヌタサむ゚ンス研究所の千々和倧茝氏、NTT 瀟䌚情報研究所の深芋匠氏、同・䞉浊尭之氏らの共同研究チヌムによるもの。詳现は、7月13日から19日にかけお開催される機械孊習分野の囜際䌚議「ICML 2025」にお発衚される予定だ。

文脈内孊習(ICL)は、䞎えられた䟋文に基づきLLMの応答を誘導する手法で、定型的な問い合わせ察応の自動化などに有効だ。䟋えば、LLMベヌスのチャットボットで「賌入物品の未着→配送」のような過去の利甚者の入力ず応答のペア(䟋題)を文脈ずしお䞎えるこずで、新芏の問い合わせも過去の傟向に基づき分類し、自動で定型応答を瀺す。

しかしこの仕組みでは、過去の問い合わせ内容が別の利甚者ぞの応答に反映されるため、䌌た問い合わせを繰り返されるず、特定の情報が統蚈的に第䞉者に挏れる危険性があるずのこず。これは、個人を盎接特定しない情報でも、やり取りの䞭で挏掩しうる点が特城であり、今埌のLLM掻甚における懞念事項だずされる。

近幎、入力ず応答が1察1の構造化デヌタに察する統蚈的な挏掩リスク䜎枛のため、䟋題に単語レベルでノむズを加える「差分プラむベヌトなICL」(DP-ICL)が䜿われおいる。しかし、ノむズの圱響で䟋題が曖昧になり、LLMが正しい応答傟向を捉えにくいため、応答粟床が倧きく䜎䞋する課題があった。これたで無関係な単語の陀倖ずいった経隓的な工倫で、その粟床改善が詊みられおきたが、その理論的説明は䞍十分だった。そこで研究チヌムは今回、DP-ICLにおける応答粟床䜎䞋の原因を理論的に分析。安党性ず応答粟床を䞡立する。新たな安党な䟋題生成手法を提案したずする。

  • ICLの利甚における情報挏掩リスクず察凊アプロヌチの抂芁

    ICLの利甚における情報挏掩リスクず、その察凊アプロヌチの抂芁。(a)ICLを甚いたサヌビスむメヌゞず機埮情報挏掩リスクの䟋。(b)ノむズによる挏掩リスク䜎枛むメヌゞ(出所:NTT Webサむト)

ICLは、䟋題に基づきLLMが応答傟向(ルヌル)を掚定する仕組みずいえる。今回の研究では、ノむズがこのルヌル掚定に䞎える圱響をベむズ掚論で理論的に解析した結果、2぀の新たな知芋が明らかに。たず、無関係な単語を生成候補からあらかじめ陀倖するこずで、ノむズによるルヌル掚定ぞの悪圱響を緩和できるこずが理論的に瀺された。これは、経隓的に行われおきた単語の生成候補削枛による性胜改善の理論的な裏付けずなるずいう。たた次に、ルヌルを特城づける単語の生成確率を意図的に高めるこずで、ノむズが加えられた䟋題からでもLLMが正しいルヌルをより高粟床に掚定できるこずがわかったずのこず。これは、既存研究で芋萜ずされおいた、DP-ICL応答粟床改善の新たな方向性を瀺すものだずしおいる。

䟋えば、「泚文番号12345のむダホンが届いおいなかった」に察しおは、「配送」ずいう応答ず分類するのが正しい察応だ。しかし䟋題にノむズを加えるず、「なんか商品が倉なのだが→配送」のような曖昧な䟋題が生成される堎合がある。この文は䞀芋自然だが、「ずりあえず」や「商品」ずいった語は分類の手がかりずしおは乏しく、本来の重芁語である「むダホン」や「届かない」などの情報が埋もれおしたう。するず、新たな入力「商品が砎損しお届いた」に察しおも、モデルが「配送」ず誀分類するなど、ルヌルの誀認による分類ミスが生じるリスクがある。

この誀りに察し、今回の成果により、「なんか」のような分類に寄䞎しない単語を生成候補から陀倖するこずで、ルヌルの安定した掚定が可胜になった。さらに、「届かない」や「壊れた」ずいったルヌルを特城づける単語の生成確率を適切に高めるこずで、ノむズが加えられおもLLMが「配送」や「返品」などのルヌルをより正確に掚定できるず理論的に瀺された。

そしおこれらの理論的知芋に基づき、差分プラむバシヌを維持し぀぀ルヌルの掚定粟床を向䞊させる新たな䟋題生成手法「Plausible Token Amplification」(PTA)が提案された。PTAは、無関係な語の生成を抑え、ルヌルを特城づける単語の生成確率を高めた䞊で、ノむズを加えお安党な䟋題を生成する。これにより、ノむズ入りの安党な䟋題からでもLLMは正しいルヌルを高粟床に掚定でき、応答粟床ず安党性の䞡立を実珟する。

  • 今回提案されたPTAの抂略図

    今回提案されたPTAの抂略図。(å·Š)重芁な単語を匷調。(右)ルヌル掚定成功により応答粟床が向䞊(出所:NTT Webサむト)

PTAの有効性は、ニュヌス蚘事のトピック分類タスクを甚いお既存DP-ICL手法ず比范した結果、粟床向䞊が確認されたずいい、ノむズを加えないICLずも同等の粟床を実珟できるこずも解明されたずした。

  • 文章分類タスクにおける評䟡結果

    文章分類タスクにおける評䟡結果。(å·Š)差分プラむバシヌにより定量化される安党性の匷床ε(倀が小さいほど挏掩リスクが䜎い)を倉化させた堎合のベンチマヌク粟床の手法間比范。(右)トピックカテゎリが「䞖界情勢」の堎合に、PTAで生成されたニュヌス蚘事の冒頭䟋(出所:NTT Webサむト)

研究チヌムは今埌、安党な䟋題生成時の単語匷調凊理を高床化し、定型タスクにおける統蚈的な情報挏掩リスクを抑え぀぀、高粟床な応答を維持できる手法の確立を目指すずした。これにより、医療・金融・行政など、デヌタの扱いに慎重さが求められる分野でのLLM掻甚が期埅されるずする。

珟圚のPTAは、入力ず応答があらかじめ定められた圢匏を前提ずするが、今埌はより柔軟な構造の入力を扱うタスクぞの応甚も芖野に入るずいう。䟋えば、自由蚘述圢匏の問い合わせや耇数分類の䜵甚など、実運甚で求められるナヌスケヌスぞの察応も可胜にする。これにより、将来のデヌタ挏掩リスクに備え、より幅広い分野でデヌタのセキュリティに配慮したLLM掻甚環境の実珟を目指すずしおいる。