AIエージェントを業務で使いこなすためのポイント(2) AIエージェントの精度を上げる3つの「S」とは？

現在のAIエージェントは、タスクを依頼されても約4割の確率で処理に失敗します。これは単純なタスクの話で、より複雑なタスクの場合の失敗率は約7割に達します（出典：「CRMArena-Pro: Holistic Assessment of LLM Agents Across Diverse Business Scenarios and Interactions」（Cornell University, 2025/5）。この失敗率の高さでは、AIエージェントに自社の業務処理を任せられないと思う方は多いでしょう。

実は、現在のAIエージェントは、ある2つの問題のうち、いずれかを抱えています。この問題を解決しないことには、AIエージェントによる処理の成功率を上げることはできません。第2回となる今回は、2つの問題とは何なのか。そして、問題解決のカギを握る3つの「S」とは何なのかを解説します。

AIエージェントが抱える2つの問題

冒頭で引用した米国コーネル大学の調査では、汎用LLM（大規模言語モデル）エージェントが使われました。汎用LLMエージェントとは、業務に特化した特別なトレーニングが行われておらず、企業固有のデータにアクセスできない基盤モデルに基づいて構築されたAIエージェントです。

AIエージェントが抱える2つの問題のうちの1つは、「情報が不足している」ことです。AIエージェントは、企業固有の業務を処理します。業務処理に必要な情報がなかったり、足りなかったりすれば、業務を正常に処理できないのは当たり前です。

2つの問題のもう一方は、逆に「情報が多すぎる」ことです。情報が不足しているならたくさんの情報を与えればいい、という単純な話では問題は解決しません。AIエージェントに、古い情報や書き掛けの情報、間違った情報を与えてしまったら、AIエージェントは正しく動作することができません。

一般的なAIと企業で利用するAIとの最も大きな違いは、AIが利用する情報源です。一般的なAIの情報源は、主にインターネットです。インターネットには、新旧、真贋を含めて、膨大な情報が公開されています。一般的なAIがしばしば間違った回答をするのは、多すぎる情報を学習しているためです。

一方、企業で利用するAIの情報源は、社内に蓄積された情報です。企業内の情報と言えば、販売データや商品データ、顧客データ、財務データなどの「データ」を思い浮かべるのではないでしょうか。こういったデータは「構造化データ」と呼ばれます。構造化データとは、列と行で構成された事前に定められた形式で整形されたデータのことで、主にデータベース内に保存されています。データウェアハウス、データレイク、ビジネスインテリジェンスなどで、構造化データは以前から活用が進んでいます。

したがって、AIの情報源である企業内の情報はすでにそろっていて問題ない、と思われるかもしれません。しかし、この構造化データは、企業内の情報のたった10％で、残りの90％は「非構造化データ」と呼ばれるデータです（出典：「The Future of Data: Unstructured Data Statistics You Should Know」（Congruity360 、2023/9））。

企業内の情報の90％が「非構造化データ」

非構造化データとは、特定の構造や定義を持たないデータのことです。簡単に言えば、テキスト文書や、Word、Excel、PowerPointといったOfficeファイル、PDF、画像、動画といった、いわゆる「ファイル」のことです。つまり、企業で利用するAIの情報源のほとんどはファイルなのです。

AIの精度低下の原因は「コンテキストの腐敗」

例え話を1つ。休日に「ドラゴンボール」を全巻一気読みしたとします。その後に、「孫悟空が最初に持っていたドラゴンボールの星の数はいくつですか？」と質問されたら、すぐに答えることができるでしょうか？ 42巻も読んでいるのに、答えがなかなか出ないのではないでしょうか。もし、この質問を第1巻の第1話を読み終わった直後に質問していたら、おそらくすぐに答えられたでしょう。

これがまさに「情報が多すぎる」の例えです。AIに入力される情報量が増加するにつれて性能や回答精度が低下していくことを「コンテキストの腐敗（Context Rot）」といいます。先ほどの例え話では、読み進めていくうちに質問に関係のない膨大な情報が頭の中に入っていき、質問の答えを見失ってしまっています。AIも、人間の思考と同じ仕組みで動作します。つまり、多くの情報を与えれば与えるほど、その膨大な情報の中から、正しい答えを見つけ出すのに苦労します。

すべてのAIモデルには、コンテキストウィンドウが設定されています。コンテキストウィンドウとは、AIが一度に記憶し処理できる情報量（テキスト量）のことです。情報量はトークン単位で数えられ、200万トークンの長さを持つAIモデルもあります。ただ、トークンが長ければいいというわけではありません。AIに膨大なデータを与えると、処理能力が低下し、必要な情報を見つけ出すのが難しくなるので、適切な回答を得られにくくなります。さらに、その膨大なデータの中に、間違った情報が含まれていた場合、AIは間違った回答をする可能性があります。

AIエージェントは、人間に代わって業務を処理してくれます。しかし、間違った情報をもとに間違った処理をした場合、ビジネスに影響を与え、経済的損失や信用の毀損にまで発展しかねません。

AIエージェントの精度を上げる3つの「S」

第1回で「コンテキストエンジニアリング」を紹介しました。コンテキストエンジニアリングとは、AIモデルに提供する情報を体系化して最適化をするアプローチや概念です。AIエージェントを正しく動作させるためには、多すぎず少なすぎない、最適な情報を提供する必要があります。AIエージェントの精度を上げるために、コンテキストに必要な3つの「S」を紹介します。

AIエージェントの精度を上げる3つの「S」」

セキュリティ（Security）

1つ目は、「セキュリティ（Security）」です。ここで重要なのは、「AIエージェントは秘密を守らない」ということです。企業内には、人事情報や経営計画、製品開発資料など、限られた人だけが見るべき情報がありますが、AIは与えられた情報を利用すべきか否かを判断することはできません。極秘情報でもアクセスできれば利用します。AIに与える情報を取捨選択するのは、人間です。

企業内の情報の90％は、非構造化データであるファイルであることは、冒頭に紹介しました。AIに適切な情報を提供するには、ファイルへのアクセス権限を適切に設定し、AIを利用するユーザーがアクセス可能なファイルのみをAIが利用できるようにする必要があります。

ステータス（Status）

2つ目は、「ステータス（Status）」です。企業内に保存されているファイルすべてが完成版というわけではありません。書きかけだったり、ドラフト版だったり、メモだったりと、まだ公開・共有する段階にないファイルも多数存在します。

AIエージェントの情報源は、正式版のファイルに限定すべきです。ドラフト版を承認すると正式版として公開される仕組みがあると、AIエージェントに提供する情報を整理しやすくなります。

鮮度（Sendo）

そして3つ目は、鮮度（Sendo）です。企業内に保存されているファイルすべてが最新版というわけではありません。過去の履歴を振り返るために意図的に古いファイルを保存している場合もあれば、もう使わないからと放置されている場合もあります。AIエージェントに古い情報を与えてしまっては、業務を正しく処理できないのは、想像に難くないでしょう。場合によっては、正反対の応答が返ってくるかもしれません。

常に最新版を共有できる仕組みや、古いファイルをアーカイブしてユーザーから見えなくしたり、検索結果に表示されないようにする仕組みを備えることで、AIエージェントが参照するファイルを常に最新版に維持することができるようになります。

ここまでAIエージェントに必要な情報について解説しましたが、企業内でAIエージェントを活用するには、適切な情報を渡すだけでは十分ではありません。安全に利用するには、セキュリティを確保する必要もあります。次回は、AIエージェントに必要なセキュリティ対策を解説します。

武田新之助

たけだしんのすけ

この著者の記事一覧はこちら

AIエージェントの精度を上げる3つの「S」とは？

目次

AIエージェントが抱える2つの問題

AIの精度低下の原因は「コンテキストの腐敗」