富士通は6月4日、特にAI分野を中心とした研究戦略と社会実装に関する説明会を開催した。説明会の中で、企業が持つデータや法令に準拠する「エンタープライズ生成AIフレームワーク」を開発し、AIプラットフォーム「Fujitsu Kozuchi」のラインアップとして7月から提供を開始することが発表された。

富士通の生成AI戦略

米OpenAIのGPTシリーズに代表されるように、言語だけでなく映像や音声などマルチモーダルに対応する汎用的なLLM(Large Language Models:大規模言語モデル)への注目が高まっている。しかしその一方で、コンパクトなサイズで業務特化の支援を強みとする小・中規模の言語モデルの開発も進められている。

そうした中で富士通は、企業ニーズに対応する特化型のモデル開発に注力する。生成AIを企業で使用する際に課題となる、カスタマイズ性やガバナンスに対応可能な言語モデルの開発を目指しているという。

同社は企業における生成AI活用の課題を解決し、セキュリティの不安を払拭(ふっしょく)するようなAIを「エンタープライズ生成AIフレームワーク」として打ち出し、企業における生成AIの活用をけん引することを狙う。

  • 富士通の生成AI戦略

    富士通の生成AI戦略

同社はこれまで、グローバル12万4000人の従業員が生成AIを活用するための環境を整備して社内でのAI活用を進めてきた。また、Fujitsu Kozuchi上では企業向けの対話型生成AIを公開するなど、社外との共創も開始している。

5月には、スーパーコンピュータ「富岳」を用いて学習したLLM「Fugaku-LLM」を公開。このモデルは130憶パラメータのモデルを独自のデータで学習している。富士通は演算と通信の高速化、および事前学習と学習後のファインチューニングを担当した。

エンタープライズ生成AIフレームワークを支える3つの技術

特化型の生成AIの利用においては、企業で必要とされる大規模データの取り扱いが困難な点や、生成AIがコストや応答速度などの要件を満たせない点、企業規則や法令への準拠が求められる点などが、業務活用における障壁となっている。

こうした状況に対し、富士通は企業向けの特化型生成AIを強化し展開するため、企業が保有するデータの関係性をナレッジグラフでひも付けて生成AIへの入力データを高度化する「ナレッジグラフ拡張RAG」、入力タスクに応じて複数の特化型生成AIモデルから最も高い性能が期待できるモデルを選択、または複数組み合わせて自動生成する「生成AI混合技術」、法令や企業規則に準拠した説明が可能な出力を行う「生成AI監査技術」を開発した。

  • エンタープライズ生成AIフレームワークを構成する3技術

    エンタープライズ生成AIフレームワークを構成する3技術

今回発表したエンタープライズ生成AIフレームワークでは、これらの3技術を組み合わせて展開する。このフレームワークは、企業内のデータからナレッジグラフを準備するステップと、ユーザーのクエリに基づいて適切なモデルを選択または生成して出力を制御するステップの2つのステップで利用できる。

  • エンタープライズ生成AIフレームワークの概要図

    エンタープライズ生成AIフレームワークの概要図

ナレッジグラフ拡張RAG

RAG(Retrieval Augmented Generation)は、生成AIと外部のデータソースを組み合わせて能力を拡張し適切な出力を得るための技術として注目されている。しかし既存のRAG技術には、クエリの特徴量に似た断片的な情報しか処理できず、大規模データを正確に参照できない課題があった。

富士通は、法令や起業規則やマニュアルなどの膨大なデータを構造化するナレッジグラフを自動作成することで、1000万トークン以上のデータを処理可能なRAGを開発した。ナレッジグラフによって関係性を踏まえた知識を生成AIに与えられるようになり、論理推論や出力根拠も示せるのだという。

具体的には、ユーザーからのクエリに対して回答を導くために必要なスキーマを抽出し、ナレッジグラフから適切な情報のみを選択する仕組みとなっている。従来の平均的なRAG技術と比較して、生成AIに与える情報量は約4分の1まで削減できるそうだ。

  • ナレッジグラフ拡張RAG

    ナレッジグラフ拡張RAG

この技術は、複数ページにまたがる膨大な製品マニュアルを用いたQ&Aや、多量のネットワークログと過去の障害事例を参照したネットワークログ解析、映像データの集計による作業分析などに適用できるとのことだ。

  • ナレッジグラフ拡張RAGの技術概要

    ナレッジグラフ拡張RAGの技術概要

生成AI混合技術

生成AI混合技術は、入力したタスクに対して適切な特化型モデルや既存の機械学習モデルを選択する、もしくは、各モデルを部品のように組み合わせて独自の新たなモデルを自動生成する技術。

それぞれのモデルの向き・不向きから最も高い性能が期待できるモデルを選択・生成することで、企業の要望に対応する独自の特化型生成AIを短期間で構築可能な特徴を持つ。小中規模の軽量なモデルを採用できるため、電力と計算資源の消費抑制にもつなげられる。

  • 生成AI混合技術

    生成AI混合技術

同社の実証段階では、ソフトウェア契約書の順守チェックに特化したモデルを自動生成して約30%の工数を削減できたという。プロンプトエンジニアリングなどで業務知識を扱えるようにする作業は事前に実施していない。

その他にも、サポートデスク業務を適切な人員に割り振って効率化するために必要なモデルを自動生成した際には、作業効率が約25%向上したそうだ。ここでは、サービスデスクに寄せられた問い合わせ(インシデント)をスキルや経験に応じて5人の担当者に割り振った。

生成AI混合技術を用いて、多様な問い合わせに対して各問い合わせの対応完了時間を予測するAIと、最適なタスク割り振りを実施するAIを自動生成している。

  • デモの概要

    デモの概要

生成AI監査技術

生成AI監査技術は、生成AIによる出力が企業規則や法令などに準拠しているかを確認するための技術だ。生成AIの内部動作状態の解析から回答の根拠を提示する生成AI説明性技術と、回答に対する根拠の整合性を検証し提示するハルシネーション(生成AIがもっともらしい誤情報を出力する現象)判定技術によって構成される。生成AIが出力を導いた根拠を示すことで、ハルシネーションを防ぐ。

ナレッジグラフによって複雑な規則を論理表現に変換し、必要な条項を適切に抽出する。その上で、画像のどこに注目したのかや、どの規則を参照したのかをAIが説明できるようにすることで、生成AIによる回答の信頼性を高める。

  • 生成AI監査技術

    生成AI監査技術

以下では、自転車に乗っている人の画像について「道路交通法に違反する状況があるかを診断してください」と指示を出した際の挙動を例に、生成AI監査技術を紹介する。

まず、GPT-4oに質問をすると、「道路交通法第71条第6号の規定により、自転車運転中に片手で傘をさすことは禁止されています。画像では、女性が片手で傘をさしています」と出力される。しかし、自転車運転中の傘の使用に関しては道路交通法では禁止されておらず、引用された条文は無関係のものだそうだ。

また、「自転車に乗る際のヘルメットの着用は法律で義務付けられていないが、推奨されています。画像の女性と男性はヘルメットを着用していません」とも出力されるが、画像中の男性はヘルメットを着用しているため、この指摘は誤っている。

  • GPT-4oによる回答例

    GPT-4oによる回答例

一方、富士通の画像診断LLMは「第十七条の規定により、歩道の左側を通行しなければなりません。道路交通法で禁止されていませんが、傘をさしながらの自転車の運転は危険です」と出力する。

その根拠を質問すると、ハルシネーション判定LLMは画像の中でAIが注目した部分を赤で、そうでない部分を青で表示する。ここでは、傘をさしている女性にAIが注目していることが分かる。このことから、この診断結果が妥当だと考えられるのだという。

  • ハルシネーション判定LLMによる出力

    ハルシネーション判定LLMによる出力

同時に、画像診断LLMは「第六十三条の十一の規定により、ヘルメットをかぶらずに車道を通行する自転車は、ヘルメットをかぶるように努めなければなりません」とも出力する。このとき、ハルシネーション判定LLMはその根拠としてAIが注目した領域について、画像中央部の歩行者のあたりを赤く表示する。自転車に乗っている人には注目していないことから、この指摘は妥当性が低いと判断できる。

  • ハルシネーション判定LLMによる出力

    ハルシネーション判定LLMによる出力