富士通は5月17日、経済産業省が推進する国内の生成AIの開発力を強化するためのプロジェクト「GENIAC(Generative AI Accelerator Challenge)」の下で、新エネルギー・産業技術総合開発機構(NEDO)が公募した、「ポスト5G情報通信システム基盤強化研究開発事業 / ポスト5G情報通信システムの開発(助成)」に採択され、論理推論を可能とするLLM(Large Language Models:大規模言語モデル)の研究開発を開始することを発表した。

生成AI活用の課題

生成AIの業務活用における大きな課題として、さまざまな業務の要望に応じた性能と機能の提供が挙げられる。汎用LLMでは計算量やコスト、精度などが業務要件を満たさない場合には、業務特化型のLLMが有効だと考えられる。

また、信頼性の担保も課題だと考えられる。現行のLLMは、根拠に基づかないがもっともらしい誤りを回答してしまう幻覚(ハルシネーション)の発生に加えて、LLMが内部パラメータとして保有している知識を把握する手段がないため、信頼性が求められる業務へのLLM導入が進まないことが課題とされている。

ナレッジグラフの活用への期待

これに対し同社は、LLMに回答させる際に、必要な業務知識を自然言語ではなく知識処理技術の一つである「ナレッジグラフ」としてLLMに追加入力すると、業務知識に従って回答を出力できることに注目している。

同社はLLMがさらに高度な推論をナレッジグラフに従って進められるようにするために、ナレッジグラフとLLMを融合する技術の開発に着手し、2024年度中の業務活用の実現を目指すとのことだ。

論理推論を可能にするLLMの開発について

今回の助成事業においては、ナレッジグラフの生成と推論に特化したLLMを開発することで、自然言語の規制や規則から生成したナレッジグラフに従ってLLMに回答を論理推論させる技術の実現を目指すという。

最終的には、富士通が全社AI戦略として掲げ2024年度中の実現を目指している「出力の不安定性を解消し、条文が長く複雑な法規制や社内規則に準拠した正確な出力を保証する生成AIトラスト技術」の中核技術になるとのことだ。

具体的には、「自然言語文書をナレッジグラフに変換して形式知にするLLM(ナレッジグラフ生成LLM)」と、「与えられた質問に対してナレッジグラフ上で関連情報を探索し、論理的に集約し回答するLLM(ナレッジグラフ推論LLM)」の二つの特化型LLMを開発する。

まずは、2つの特化型LLMに共通的な事前学習済みLLMを開発。自然言語文書とナレッジグラフの双方を同等に扱う能力をLLMに獲得させるために、自然言語文書とナレッジグラフとの対訳コーパスを事前学習データに追加するという。その上で、一方にはナレッジグラフ生成向けの指示学習を、もう一方にはナレッジグラフ推論向けの指示学習をそれぞれ実施することで、各特化型LLMを同時並行で開発する。