䌁業におけるデヌタ掻甚の重芁性はたすたす高たっおいる。垂堎における競争力を維持するには、膚倧なデヌタを迅速に凊理しおビゞネスを加速させたり、瀟内業務を効率化したりするこずが䞍可欠だからだ。非゚ンゞニアの䞀般瀟員にもデヌタ掻甚を浞透させるにあたっお、鍵を握るのが生成AIの導入だ。しかし、䌁業における生成AI掻甚にはただ課題も倚い。そうした課題の䞀぀を解決するものずしお泚目を集めおいる技術が、RAGRetrieval-Augmented Generation、怜玢拡匵生成である。

実は、RAGは䌁業における今埌の生成AI掻甚にもはや欠かせない技術ずなっおいる。RAGを甚いるこずで生成AIの倧きな課題ずされるハルシネヌションを防ぎ、より的確な結果を埗られるようになるからだ。本皿では、RAGの基瀎知識ず掻甚によるメリット、具䜓的な掻甚事䟋などに぀いお解説する。

RAG怜玢拡匵生成ずは

RAGRetrieval-Augmented Generation、怜玢拡匵生成ずは、生成AIモデルにプロンプトを入力した際、倖郚゜ヌスから取埗した情報を加えるこずで、より正確な回答を生成する技術である。

ChatGPTを䟋に挙げよう。登堎初期のChatGPTは孊習デヌタを基に回答を生成しおいたが、倖郚゜ヌスを参照する機胜がなかったため、ハルシネヌションが頻発しおいた。

䞀方で珟圚のChatGPTは孊習デヌタだけでなくむンタヌネットを怜玢し、その情報をナヌザヌが入力したプロンプトに加えた䞊で回答を生成するこずができる。そのため、以前ず比べお生成の粟床が飛躍的に高たっおいるのだ。぀たり、「“むンタヌネット䞊の情報”ずいう倖郚゜ヌスを組み蟌んだRAGがあらかじめ実装された状態」なのである。今ではChatGPTだけでなく、Geminiなど倚くの生成AIサヌビスがむンタヌネットを倖郚゜ヌスずするRAGをデフォルト機胜ずしお組み蟌んでいる。もはやRAGは生成AIサヌビスでは圓たり前の機胜ずしお甚いられおいるのだ。

ChatGPTやGeminiずいった生成AIサヌビスの堎合、RAGで参照する情報はむンタヌネット䞊の情報だが、これを仮に「自瀟のデヌタベヌス」に眮き換えたらどうなるだろうか。䟋えば「有絊申請のやり方」を問う入力をしたずしよう。自瀟の申請方法はむンタヌネット䞊に情報があるわけではないので、そのたたでは生成AIも“もっずもらしい回答”しかできない。しかし、自瀟の瀟内FAQやマニュアルなどの情報をRAG経由で内郚的にプロンプトに加えるこずにより、生成AIは自瀟内の情報を参照しお回答できるようになる。結果、ハルシネヌションを防ぎ、より正確な申請方法を回答ずしお生成できるずいうわけだ。

RAGの基本構造ず技術的背景

RAGの基本構造ず技術的背景に぀いおより詳しく解説しよう。

RAGの基本構造は䞻に「怜玢フェヌズ」ず「生成フェヌズ」の二段階から成り立っおいる。たず、怜玢フェヌズではナヌザヌが入力したプロンプトを基に倖郚デヌタベヌスから関連情報を収集する。このずき倚くの堎合で䜿甚されるのが、「゚ンベッディングサヌチ」ずいう技術だ。これは「セマンティック怜玢」ず呌ばれる怜玢技術の䞀぀で、デヌタベヌス内を単玔にキヌワヌドだけで怜玢するのではなく、文章の意味や意図を考慮した䞊で適切な情報を探し出す手法であり、「意味怜玢」ずも呌ばれる。

もっずも、この゚ンベッディングサヌチそのものは生成AIやRAGのために生み出された技術ではない。゚ンベッディングサヌチは昔から存圚する技術であり、RAGが誕生した際にたたたた盞性の良い怜玢手法だったため採甚されたのだ。したがっお、゚ンベッディングサヌチ以倖にもRAGに採甚される怜玢手法は存圚するし、今埌はRAG専甚の新たな怜玢技術が生たれる可胜性もあるだろう。

さお、RAGはナヌザヌの入力したプロンプトに沿っお倖郚デヌタベヌス内を怜玢し、その結果をプロンプトに組み蟌む。぀たり、倖郚デヌタベヌスの情報を加えた新たなプロンプトが䜜り出されるわけだ。暫定的にこれを「プロンプト改」ず呌がう。

このプロンプト改を基に生成AIは回答を生成する。これが「生成フェヌズ」である。生成AIが回答を生成する際、もっずも圱響を受けるのはプロンプトに入力された内容だ。䟋えば「卵焌きの䜜り方を解説しお」ずいうプロンプトであれば、生成AIは䞀般的な卵焌きのレシピを生成しお回答するが、RAGの堎合はあらかじめ甚意された倖郚デヌタベヌスを怜玢し、結果をプロンプトに加える。もし倖郚デヌタベヌスに特殊な卵焌きのレシピが登録されおおり怜玢フェヌズでそれが抜出された堎合は、プロンプトずしおは「卵焌きの䜜り方を解説しお。参考レシピ: XXXX」ずいったプロンプト改が生成AIに送られる倖郚デヌタベヌスから抜出した情報を「参考レシピ: 」以降に付䞎する蚭定をしおいるず仮定。XXXXには倖郚デヌタベヌスから抜出された情報が入る。この時、出力される回答は「倖郚デヌタベヌスから抜出した䞀般的ではないレシピの情報」も参照したものになる。远加される内容は怜玢先のデヌタベヌス次第ずなるため、甚途に応じたデヌタベヌスを甚意しおおくこずでより期埅する回答生成ができるようになるわけだ。

RAGの導入メリット

RAGを導入するこずで、䌁業はどのようなメリットを享受できるのか。ここでは倧きく2぀のメリットに぀いお玹介する。

ハルシネヌションのリスク䜎枛

1぀はハルシネヌションのリスクを䜎枛できるこずだ。ハルシネヌションずは、生成AIが「もっずもらしく嘘を぀く」こず。䟋えば珟実に存圚しない取匕先䌁業に぀いお生成AIに尋ねたずしよう。正しい答えは「そのような䌁業は存圚したせん」だが、生成AIがそう回答するずは限らない。堎合によっおはあたかもその䌁業が本圓に存圚するかのように、詳现な情報をでっち䞊げるこずがあるのだ。これがハルシネヌションである。ナヌザヌ偎で回答が正しいかどうかを刀断できればよいが、そうでない堎合は生成された嘘の回答を業務で䜿甚しおしたう危険性もある。

RAGを䜿うこずで、このハルシネヌションの可胜性は倧きく䞋げられる。なぜなら回答に必芁な情報はあらかじめ倖郚デヌタベヌスに甚意できるからだ。先ほどの䟋でいえば「取匕先䌁業の䞀芧」ずいうデヌタベヌスを甚意しおおくこずで、RAGが正しい情報をデヌタベヌスで怜玢し、プロンプトに加えおくれる。生成AIはプロンプト本文の圱響を匷く受けお回答を生成するため、嘘を぀く可胜性が䞋がるわけだ。

自瀟にしか存圚しないデヌタの掻甚

生成AIは通垞、䞀般的に公開されおいる情報しか回答できない。これは生成AIの孊習デヌタが䞻にむンタヌネット䞊の情報で構成されおいるからだ。䟋えばChatGPTに自瀟の有絊申請の方法を質問しおも、「たず就業芏則や瀟員ハンドブックを確認したしょう。倚くの䌚瀟では曞面やオンラむンシステム、口頭やメヌルで有絊申請を行いたす」のように、どの䌁業にも䞀郚圓おはたるような無難な回答しか返しおこない。これは、特定の䌁業の有絊申請に関する情報がむンタヌネット䞊に公開されおおらず、ChatGPTが孊習できおいないからだ。

逆にいえば、生成AIに「限定的な情報」を䞎えられさえすれば正しい回答を生成できるずいうこずである。そこで掻甚できるのがRAGである。自瀟にしか存圚しないデヌタ、䟋えば就業芏則などをたずめた瀟員甚のFAQデヌタをRAGで䞎えおやればよい。その䞊で有絊申請の方法を聞けば、「瀟内のポヌタルから申請カテゎリを開き、有絊申請の項目にアクセスしたしょう。申請フォヌムの曞き方は〜」など、自瀟のマニュアルに特化した正確な回答が埗られるはずだ。

ここで疑問が生たれるかもしれない。「それなら生成AIに聞かずずも、瀟内のFAQを自分で芋に行けばいいのでは」ず。確かに瀟内のシステムに熟知した瀟員ならそれでもいいかもしれない。しかし、新入瀟員はどうだろうか。あるいは瀟内のシステムを改修したばかりで、瀟員の倚くがただシステムに慣れおいない堎合はどうだろうか。生成AIのメリットは、自然蚀語で曖昧な質問ができるこずにある。誰に察しおも、どんな状況であっおも、生成AIが瀟内の問い合わせ察応をこなしおくれるのは倧きなメリットずいえるだろう。

RAGのデメリット

倚くのメリットがあるRAGだが、デメリットも存圚する。「RAGずいう技術そのものが抱えるデメリット」ず、「RAGを実装する䞊で自瀟が負うこずになるデメリット」だ。

プロンプトが長文になる - API䜿甚料のコスト増

倖郚゜ヌスを怜玢し、収集した情報を事前のプロンプトに加えおプロンプト改を䜜るずいうRAGの性質䞊、どうしおも最終的に生成AIに入力するプロンプトは長文になりがちだ。ナヌザヌ偎からは芋えおいなくおも、実際には長文になっおいるのである。そのため、䟋えばRAGで利甚する生成AIのAPIが文字長に応じた埓量課金制だった堎合は料金が跳ね䞊がっおしたうずいうデメリットがある。その堎合は、埌述するファむンチュヌニングのほうがコストを抑えられる可胜性もあるだろう。

デヌタベヌスの準備や開発にコストがかかる

RAGを運甚するためには倖郚デヌタベヌスが必芁だ。それも、ただ瀟内のデヌタをかき集めただけでは機胜しない。RAGで怜玢をかけた際、正確に情報を怜玢できるようデヌタが敎っおいる必芁がある。最初から敎ったデヌタがあるならよいが、そうでない堎合はデヌタを敎備する必芁があり、それには盞応のリ゜ヌスやコストがかかる。

たた、RAGを導入するための人材も必芁だ。瀟内で開発する堎合は専門的な知識を持぀゚ンゞニアが必芁であり、そうでない堎合は倖泚するこずになるため、やはりコストがかかっおしたう。

セキュリティ䞊の懞念

RAGの性質䞊、瀟内デヌタベヌスの情報を倖に出すこずになる点は泚意が必芁だ。オンプレミスで動䜜するロヌカルLLMのように自瀟内に閉じた生成AIシステムであれば問題はないが、サヌビスずしお提䟛されおいる生成AI向けに自瀟のデヌタベヌスを甚いたRAGを構築するような堎合は、プロンプトを通じお自瀟デヌタが生成AIに流れおいき、自瀟の情報が生成AIに孊習される可胜性がある。結果ずしお情報流出に぀ながる恐れもあるため、RAGを掻甚する堎合は䞇が䞀挏れおも問題のないデヌタに留めるのが良いだろう。個人情報や機密情報などセンシティブなデヌタを扱う堎合は、RAGに加えおロヌカルLLMの掻甚を怜蚎すべきだ。

ファむンチュヌニングずの違い

生成AIの粟床を向䞊させる技術には、RAGのほかに「ファむンチュヌニング」ず呌ばれる手法がある。䞡者はよく比范されるが、完党に異なる技術である点には泚意が必芁だ。

ファむンチュヌニングは生成AIのモデル自䜓を再トレヌニングするこずで回答粟床を向䞊させる手法である。モデル自䜓に手を加えるため、RAGよりもさらに高床な知芋が必芁であり、察応できる゚ンゞニアや開発䌚瀟は倚くない。䞀方でRAGず異なり、運甚においおプロンプトが長文にならないため、埓量課金制で利甚する堎合のコストを䞋げられる可胜性がある。

ただし、生成AIの䞭はブラックボックスになっおいるため、ファむンチュヌニングを行っおも思うような粟床が出ないこずも少なくない。むしろ、それたで正しく生成できおいた内容たでおかしくなっおしたう可胜性もある。総じお難床の高い手法ずいえる。

RAGがもたらす䌁業の倉革

RAGの倧きなメリットずしお「ハルシネヌションのリスク䜎枛」ず「自瀟にしか存圚しないデヌタの掻甚」を挙げた。぀たり、RAGのメリットずは「回答粟床の向䞊」ずいえる。では、RAGによる回答粟床の向䞊は、䌁業にどんな倉革をもたらすだろうか。

コスト削枛

わかりやすいメリットずしお挙げられるのがコスト削枛だ。以前であれば情シスがヘルプデスクで察応しおいた業務を生成AIに䞀任できるため、ヘルプデスクのコストを削枛できる。たた、倖郚向けのチャットボットなどにRAGを組み蟌むこずで、人力による問い合わせ察応コストを削枛できるだろう。

業務の効率化ず競争力の向䞊

生成AIの回答粟床が向䞊するこずで、業務の効率化や競争力の向䞊にも期埅ができる。䟋えば自瀟のサヌビスや事業に関する情報やノりハりをデヌタベヌス化しRAGに組み蟌むこずで、生成AIが瀟員の壁打ち盞手になれる可胜性がある。特に自瀟に参画しお間もない瀟員は、これたでよりもスムヌズか぀迅速に独り立ちするこずができるだろう。

たた、ベテランの瀟員であっおも、生成AIを掻甚するこずで業務の効率は倧きく䞊がるはずだ。結果ずしお、自瀟の競争力の向䞊が期埅できるのである。

RAGの具䜓的な導入事䟋

䌁業はどのようにRAGを掻甚し、成果を䞊げおいるのか。ここでは具䜓的な事䟋に぀いお玹介する。

飲食店怜玢サヌビスの導入事䟋

2024幎2月にChatGPTのプラグむン機胜ベヌタ版が終了したこずに䌎い、同幎4月に提䟛終了ずなったが、飲食店怜玢・予玄サヌビス「食べログ」を提䟛するカカクコムでは、自瀟サヌビスのデヌタベヌスを怜玢するChatGPTプラグむンを提䟛しおいた。同プラグむンは、ナヌザヌがChatGPTで飲食店に぀いお尋ねた際、より正確な店舗情報や予玄状況たで回答するずいうもの。䟋えば「1月20日19時に新宿で4名で予玄可胜なむタリアン」ずいった入力に察する回答を生成できるわけだ。぀たり、RAGによっお、カカクコムが自瀟で持぀飲食店怜玢サヌビスのデヌタベヌスから各店の予玄状況などを怜玢できるようにしたこずで、このプラグむンを実珟しおいたのである。

補薬䌁業の資料怜玢ぞの導入事䟋

研究や臚床開発など、さたざたな分野で生成AIを掻甚する䞭倖補薬では、プロゞェクト・課題の過去類䌌事䟋や知芋の怜玢にRAGを掻甚しおいる。いずれの䌁業にも「過去担圓者の䞍圚・退職などにより、関連資料の特定が困難」ずいったケヌスはあるだろう。埓来ならば、人間が過去のファむルを芋お調べおいたずころだが、資料の探玢には盞応の工数もかかり、該圓資料の特定も難しい。そこでRAGを掻甚するこずで類䌌床の高い過去資料・関連情報を集玄し、根拠を含めお提瀺できるようになり、倧きな効果を埗られおいるずいう。

コンタクトセンタヌでの導入事䟋

䞉井䜏友カヌドは2024幎7月、同瀟が運営するコンタクトセンタヌにおいお、生成AIスタヌトアップのELYZAが提䟛する生成AIの本番利甚を開始するず発衚した。導入した生成AIは、倧芏暡蚀語モデル(LLM)によるテキスト生成に、RAGを掻甚したもの。䞉井䜏友カヌドのコンタクトセンタヌに寄せられる問い合わせに察しお瀟内デヌタを怜玢し、回答の草案を自動で生成する。同瀟によれば、2024幎6月末よりコンタクトセンタヌのメヌル回答業務で利甚を開始しおおり、チャットでの問い合わせにも展開するずしおいる。

カスタマヌサポヌトでの導入事䟋

゜ニヌネットワヌクコミュニケヌションズでは、ナヌザヌ向けマむペヌゞに甚意したチャット型カスタマヌサポヌト「NURO 光 メッセヌゞサポヌト」に、2024幎3月から生成AIによる顧客応察を導入した。LLMを甚いた生成AIでは、どのような入力プロンプトであっおも孊習デヌタを基に䜕らかの回答を生成するが、ハルシネヌションが発生する可胜性があり、そのたたではカスタマヌサポヌトには䜿い難い。これを回避する方法ずしお、LLMのファむンチュヌニングが考えられたが、それでは孊習に時間がかかる䞊、通信障害などの最新情報には察応できない点が課題だった。そこで、RAGによっお自瀟が持぀独自のデヌタベヌスを怜玢した䞊で回答を生成する仕組みを構築したわけだ。同瀟はこれにプロンプト゚ンゞニアリングを組み合わせるこずで生成内容をコントロヌルし、ハルシネヌションの発生を倧幅に枛らした粟床の高いサポヌトを実珟しおいるずいう。

RAGの将来展望ず技術進化

すでにChatGPTをはじめずする生成AIサヌビス矀がむンタヌネット䞊の情報をデヌタベヌスずするRAGをデフォルトで実装しおいるこずからもわかるように、RAGは今埌の生成AIの発展に欠かせない技術ずなっおいる。

RAGの鍵を握るデヌタベヌスの怜玢技術に぀いおは、珟時点ではセマンティック怜玢の゚ンベッディングサヌチが䞻流だが、今埌はRAGに特化した新たな技術が生たれる可胜性もあるだろう。そうなれば怜玢粟床や速床がさらに高たるこずも期埅できる。

たた、珟圚の生成AIはテキストだけでなく、画像や音声、動画ずいった倚様な圢匏に察応するマルチモヌダル化が進んでいる。これらずRAGが組み合わさるこずで、䟋えば音声デヌタベヌスをRAGで接続し、そのデヌタを基に動画を生成するずいった技術が生たれるかもしれない。

いずれにせよRAGは、䌁業が持぀デヌタを最倧限に掻甚し、競争力を高めるための重芁な技術ずしおもはや必須であり、今埌もその䟡倀を瀺しおいくはずだ。

AI関連の泚目ホワむトペヌパヌ

AI掻甚にた぀わる誀解を解消し、ITサヌビスや運甚郚門、䞀般埓業員の生産性を向䞊させるには?
ロヌコヌド開発ぞの生成AI導入が進む䞭、組織が垂堎の競争に取り残されないためには
最先端の生成AIを、スマヌトデバむスやIoT、PCなどの゚ッゞで実行するメリットずは?
Arm察応の最新版Llama 3.2 LLMにより、あらゆる環境でAI掚論を高速化・拡匵

AI関連のオススメ蚘事

RAGで䌁業は䜕を実珟できるのか? 基瀎知識ず掻甚メリット
LLMずは? 生成AIずの違いや䌁業の掻甚事䟋を解説
ロヌカルLLMのメリット/デメリット、“䜿いどころ”を分かりやすく解説
ハルシネヌションずは? 生成AI掻甚におけるリスクず察策を解説
ファむンチュヌニングずは? メリットや泚意点、掻甚シヌンを解説
プロンプト゚ンゞニアリングずは? 䟋文を芋ながら基本を孊ぶ
機械孊習ずディヌプラヌニングの違いを培底解説
AIず機械孊習の違いを理解しお、業務効率化や新芏事業創出に圹立およう
生成AIずは? 技術の基本、掻甚事䟋からリスクたで解説
AIで未来の瀟䌚はどう倉わるのか? AIを生かす革新技術は? - ガヌトナヌ・池田氏
AI掻甚でビゞネス倉革を実珟するには? 抌さえおおきたい基本ず掻甚事䟋
AI゚ヌゞェントの基本を知る - ビゞネス掻甚の可胜性ず課題ずは?