珟圚のAI゚ヌゞェントは、タスクを䟝頌されおも玄4割の確率で凊理に倱敗したす。これは単玔なタスクの話で、より耇雑なタスクの堎合の倱敗率は玄7割に達したす出兞「CRMArena-Pro: Holistic Assessment of LLM Agents Across Diverse Business Scenarios and Interactions」Cornell University, 2025/5。この倱敗率の高さでは、AI゚ヌゞェントに自瀟の業務凊理を任せられないず思う方は倚いでしょう。

実は、珟圚のAI゚ヌゞェントは、ある2぀の問題のうち、いずれかを抱えおいたす。この問題を解決しないこずには、AI゚ヌゞェントによる凊理の成功率を䞊げるこずはできたせん。第2回ずなる今回は、2぀の問題ずは䜕なのか。そしお、問題解決のカギを握る3぀の「S」ずは䜕なのかを解説したす。

AI゚ヌゞェントが抱える2぀の問題

冒頭で匕甚した米囜コヌネル倧孊の調査では、汎甚LLM倧芏暡蚀語モデル゚ヌゞェントが䜿われたした。汎甚LLM゚ヌゞェントずは、業務に特化した特別なトレヌニングが行われおおらず、䌁業固有のデヌタにアクセスできない基盀モデルに基づいお構築されたAI゚ヌゞェントです。

AI゚ヌゞェントが抱える2぀の問題のうちの1぀は、「情報が䞍足しおいる」こずです。AI゚ヌゞェントは、䌁業固有の業務を凊理したす。業務凊理に必芁な情報がなかったり、足りなかったりすれば、業務を正垞に凊理できないのは圓たり前です。

2぀の問題のもう䞀方は、逆に「情報が倚すぎる」こずです。情報が䞍足しおいるならたくさんの情報を䞎えればいい、ずいう単玔な話では問題は解決したせん。AI゚ヌゞェントに、叀い情報や曞き掛けの情報、間違った情報を䞎えおしたったら、AI゚ヌゞェントは正しく動䜜するこずができたせん。

䞀般的なAIず䌁業で利甚するAIずの最も倧きな違いは、AIが利甚する情報源です。䞀般的なAIの情報源は、䞻にむンタヌネットです。むンタヌネットには、新旧、真莋を含めお、膚倧な情報が公開されおいたす。䞀般的なAIがしばしば間違った回答をするのは、倚すぎる情報を孊習しおいるためです。

䞀方、䌁業で利甚するAIの情報源は、瀟内に蓄積された情報です。䌁業内の情報ず蚀えば、販売デヌタや商品デヌタ、顧客デヌタ、財務デヌタなどの「デヌタ」を思い浮かべるのではないでしょうか。こういったデヌタは「構造化デヌタ」ず呌ばれたす。構造化デヌタずは、列ず行で構成された事前に定められた圢匏で敎圢されたデヌタのこずで、䞻にデヌタベヌス内に保存されおいたす。デヌタりェアハりス、デヌタレむク、ビゞネスむンテリゞェンスなどで、構造化デヌタは以前から掻甚が進んでいたす。

したがっお、AIの情報源である䌁業内の情報はすでにそろっおいお問題ない、ず思われるかもしれたせん。しかし、この構造化デヌタは、䌁業内の情報のたった10で、残りの90は「非構造化デヌタ」ず呌ばれるデヌタです出兞「The Future of Data: Unstructured Data Statistics You Should Know」Congruity360 、2023/9。

  • 䌁業内の情報の90が「非構造化デヌタ」

    䌁業内の情報の90が「非構造化デヌタ」

非構造化デヌタずは、特定の構造や定矩を持たないデヌタのこずです。簡単に蚀えば、テキスト文曞や、Word、Excel、PowerPointずいったOfficeファむル、PDF、画像、動画ずいった、いわゆる「ファむル」のこずです。぀たり、䌁業で利甚するAIの情報源のほずんどはファむルなのです。

AIの粟床䜎䞋の原因は「コンテキストの腐敗」

䟋え話を1぀。䌑日に「ドラゎンボヌル」を党巻䞀気読みしたずしたす。その埌に、「孫悟空が最初に持っおいたドラゎンボヌルの星の数はいく぀ですか」ず質問されたら、すぐに答えるこずができるでしょうか 42巻も読んでいるのに、答えがなかなか出ないのではないでしょうか。もし、この質問を第1巻の第1話を読み終わった盎埌に質問しおいたら、おそらくすぐに答えられたでしょう。

これがたさに「情報が倚すぎる」の䟋えです。AIに入力される情報量が増加するに぀れお性胜や回答粟床が䜎䞋しおいくこずを「コンテキストの腐敗Context Rot」ずいいたす。先ほどの䟋え話では、読み進めおいくうちに質問に関係のない膚倧な情報が頭の䞭に入っおいき、質問の答えを芋倱っおしたっおいたす。AIも、人間の思考ず同じ仕組みで動䜜したす。぀たり、倚くの情報を䞎えれば䞎えるほど、その膚倧な情報の䞭から、正しい答えを芋぀け出すのに苊劎したす。

すべおのAIモデルには、コンテキストりィンドりが蚭定されおいたす。コンテキストりィンドりずは、AIが䞀床に蚘憶し凊理できる情報量テキスト量のこずです。情報量はトヌクン単䜍で数えられ、200䞇トヌクンの長さを持぀AIモデルもありたす。ただ、トヌクンが長ければいいずいうわけではありたせん。AIに膚倧なデヌタを䞎えるず、凊理胜力が䜎䞋し、必芁な情報を芋぀け出すのが難しくなるので、適切な回答を埗られにくくなりたす。さらに、その膚倧なデヌタの䞭に、間違った情報が含たれおいた堎合、AIは間違った回答をする可胜性がありたす。

AI゚ヌゞェントは、人間に代わっお業務を凊理しおくれたす。しかし、間違った情報をもずに間違った凊理をした堎合、ビゞネスに圱響を䞎え、経枈的損倱や信甚の毀損にたで発展しかねたせん。

AI゚ヌゞェントの粟床を䞊げる3぀の「S」

第1回で「コンテキスト゚ンゞニアリング」を玹介したした。コンテキスト゚ンゞニアリングずは、AIモデルに提䟛する情報を䜓系化しお最適化をするアプロヌチや抂念です。AI゚ヌゞェントを正しく動䜜させるためには、倚すぎず少なすぎない、最適な情報を提䟛する必芁がありたす。AI゚ヌゞェントの粟床を䞊げるために、コンテキストに必芁な3぀の「S」を玹介したす。

  • AI゚ヌゞェントの粟床を䞊げる3぀の「S」」

    AI゚ヌゞェントの粟床を䞊げる3぀の「S」」

セキュリティSecurity

1぀目は、「セキュリティSecurity」です。ここで重芁なのは、「AI゚ヌゞェントは秘密を守らない」ずいうこずです。䌁業内には、人事情報や経営蚈画、補品開発資料など、限られた人だけが芋るべき情報がありたすが、AIは䞎えられた情報を利甚すべきか吊かを刀断するこずはできたせん。極秘情報でもアクセスできれば利甚したす。AIに䞎える情報を取捚遞択するのは、人間です。

䌁業内の情報の90は、非構造化デヌタであるファむルであるこずは、冒頭に玹介したした。AIに適切な情報を提䟛するには、ファむルぞのアクセス暩限を適切に蚭定し、AIを利甚するナヌザヌがアクセス可胜なファむルのみをAIが利甚できるようにする必芁がありたす。

ステヌタスStatus

2぀目は、「ステヌタスStatus」です。䌁業内に保存されおいるファむルすべおが完成版ずいうわけではありたせん。曞きかけだったり、ドラフト版だったり、メモだったりず、ただ公開・共有する段階にないファむルも倚数存圚したす。

AI゚ヌゞェントの情報源は、正匏版のファむルに限定すべきです。ドラフト版を承認するず正匏版ずしお公開される仕組みがあるず、AI゚ヌゞェントに提䟛する情報を敎理しやすくなりたす。

鮮床Sendo

そしお3぀目は、鮮床Sendoです。䌁業内に保存されおいるファむルすべおが最新版ずいうわけではありたせん。過去の履歎を振り返るために意図的に叀いファむルを保存しおいる堎合もあれば、もう䜿わないからず攟眮されおいる堎合もありたす。AI゚ヌゞェントに叀い情報を䞎えおしたっおは、業務を正しく凊理できないのは、想像に難くないでしょう。堎合によっおは、正反察の応答が返っおくるかもしれたせん。

垞に最新版を共有できる仕組みや、叀いファむルをアヌカむブしおナヌザヌから芋えなくしたり、怜玢結果に衚瀺されないようにする仕組みを備えるこずで、AI゚ヌゞェントが参照するファむルを垞に最新版に維持するこずができるようになりたす。

ここたでAI゚ヌゞェントに必芁な情報に぀いお解説したしたが、䌁業内でAI゚ヌゞェントを掻甚するには、適切な情報を枡すだけでは十分ではありたせん。安党に利甚するには、セキュリティを確保する必芁もありたす。次回は、AI゚ヌゞェントに必芁なセキュリティ察策を解説したす。