生成AI時代のデータ基盤はどう設計すべきか、専門家対談からひも解く

2月6日に開催された「TECH+セミナー AI Infrastructure Shift 2026 Feb. クラウドの先へオンプレ回帰とデータ処理の最適解を探る」において、バンダイナムコネクサスビジネスプラットフォーム部データプロダクト課マネージャーの吉村武氏と、ギックス上級執行役員の岡大勝氏の対談が行われた。吉村氏はバンダイナムコグループにおいてデータマネジメントを推進する立場、そして岡氏はソフトウェアデザイン/チームデザインの専門家としての立場から、生成AI時代に求められるITインフラと組織ガバナンスの再設計について意見を交わした。

（左から）ギックス上級執行役員の岡大勝氏、バンダイナムコネクサスビジネスプラットフォーム部データプロダクト課マネージャーの吉村武氏

目的を考えてAI基盤を選ぶ

対談は、AI基盤をどう選択すべきかという話題からスタートした。AI基盤には、ChatGPT EnterpriseのようなSaaSのほか、オープンソースのLLMをクラウドのGPUノードに載せる方法や、オープンソースLLMをオンプレミスで導入する方法がある。どれが良いとは一概に言えない状況だが、岡氏は選び方の1つの基準を示した。

まず、“何でも知っている知恵袋”として使うなら、進化し続けてどんどん賢くなっていくSaaSだ。自然言語で業務システムを使えるため効率が良いし、コンパクトなLLMを使えばコストも軽減できる。ただしSaaSの生成AIは頻繁にバージョンアップして挙動も変わるため、業務システムの運用が日々変わってしまうこともあり得る。そのため一貫性を重視するなら、バージョンが固定されたオープンソースのLLMをクラウドGPUノードまたはオンプレミスで運用することを選ぶべきだろう。

オンプレミスとクラウドを比較すると、オンプレミスは初期費用が必要でメンテナンスの手間もかかるが、長期的に考えればクラウドよりもコストは安い。ただし変化の激しい世界なので、バージョンを固定したいのであればクラウドのGPUノードという選び方になる。

SaaSであれば、モデルがバージョンアップし、発展していくが、オンプレミスであれば、ユーザー側でモデルを制御できる。業務システムによっては、モデルの発展が必ずしもプラスに働くわけではない場合もあるため、目的に合わせて使い分けることが大切なのだ。

「例えば業務システムの中で、同じ回答が欲しいというケースではオンプレミスの環境をつくることで生成AIのモデルを固定することが必要であることもある一方で普段と同様に使いたいところではSaaSというように目的を考えて選ぶことが大事ですね」（吉村氏）

LLMは国語のAI、MLは算数のAI

生成AIが進化したことで、ML（機械学習）の重要性も増している。岡氏は、「生成AI（LLM）は国語の世界、MLは算数の世界のAI」だと表現する。MLの分析結果は数字で出力される。例えばそれが100万という数字だったとして、それだけでは多いか少ないか評価はできないが、それを国語の世界であるLLMに解釈させることで意味のある回答になる。

「ChatGPTやGeminiで質問をすると、数字を文字に換える、つまり算数を国語にして返している。おそらく裏でエージェントが動いているのでしょう」（岡氏）

「プラットフォームの内部で国語のAIと算数のAIが組み合わせられているので、両方できるように見えているんです。プラットフォーマーは公開していませんが、内部的に国語のAIエージェントと算数のAIエージェントが連携して動いています」（吉村氏）

「エージェントが全部やっていますね。エージェントが処理を切り替えて、Webを検索しに行ったり計算させたりして、その結果をLLMが要約して返す。だから、エージェントでSaaSのLLMを呼び出すようなことをすると、エージェントが入れ子になってコントロールが難しくなる。そこは少し気を付ける必要があります」（岡氏）

成果をフィードバックする構造を“データガバナンス”と考える

吉村氏は2026年を、社内のデータを組み合わせてAIを活用するフェーズの元年であると位置付ける。ただ、社内データと組み合わせるためのデータ基盤を構築するにあたっては、検討すべきこともある。それが権限設計、データ品質や整合性、スケーラビリティとコスト最適化などだ。

そしてその地盤としてデータガバナンスがある。吉村氏はデータマネジメントに関する知識体系をまとめた『DMBOK（Data Management Body of Knowledge、データマネジメント知識体系ガイド）』に記載されている「データマネジメントの11の知識領域」の考え方がそのまま適用できると説明した。これは11の知識領域をピラミッド型に配置して考えるもので、最下部の土台にはデータガバナンスが置かれている。

DMBOKにおけるデータマネジメントの11の知識領域（ピラミッド図）

DMBOKでは、この11の知識領域を4つのフェーズで表している。フェーズ1はデータ統合と相互運用性、データセキュリティ、データストレージとオペレーション、データモデリングとデザイン。フェーズ2はデータアーキテクチャ、データ品質、メタデータ。フェーズ3はDWHとBI、参照データとマスタデータ、ドキュメントとコンテンツ管理、データガバナンス。フェーズ4はアナリティクス、ビックデータの活用だ。

では、なぜ土台となっているデータガバナンスが初手ではないのだろうか。吉村氏はそれについて、「おそらく、最初から成果の出しにくいガバナンスに取り組むと挫折してしまうためではないか」と述べたうえで、「スモールスタートで安心安全に始めて、成果が上がり始めてからデータガバナンス、そこまでうまくいったらデータウェアハウスやBIという順で取り組むべき」だと話した。

データガバナンスというと、データプライバシーやデータセキュリティをイメージするが、DMBOKにおいてはそれだけでなく、活用まで含めて土台となるものだとされている。吉村氏は、スモールスタートで始めて経営陣や現場に成果をフィードバックする構造、そしてこうした取り組みを全社に拡大していく活動そのものをデータガバナンスと考えるべきだと話した。

「ガバナンスというと規約ありきみたいなイメージもあり、“守り”を意識しがちです」（岡氏）

「そこが誤解されるところです。例えば推進委員会を立ち上げて会則のドキュメントをつくったとして、会を立ち上げるのは会則を守るためではなく、生成AIを全社に普及して、ビジネスの変革と業務改善をするため。そこが重要なんです」（吉村氏）

バンダイナムコグループでは、データ提供組織とデータマネジメント組織、そして実際にデータ利活用を行う組織という3つの実務組織の上に、データガバナンス組織がある。この4つの組織は事業構造ごとに配置されていて、事業ごとにデータガバナンスが効くようにしている。ただしそれではサイロ化する懸念もあるため、さらにその上にグループ全体を統制する全社データガバナンス組織も置いている。

「ガバナンスを事業ごとにすると意思決定者が少ないのでうまく進みます。その一方で全社にするとスピードは出ないけれど統制はとりやすい。そこで、事業ごとにスピード感を持てるようにしたうえで、大事なところは全社マネジメント組織で受け持つ、ハイブリッド型オペレーティングモデルにしています」（吉村氏）

データ活用の取りかかりはデータカタログの整備から

吉村氏は、データ活用においてポイントとなるデータカタログの整備についても言及した。データ品質としてデータの欠損や揺らぎをなくすことも重要だが、それが何のデータであるか分からないと使えないため、どんなデータを持っていて、それが何に使えるのかを整備するデータカタログが重要なのだ。

「まずはデータを集めてラベルを付け、どのデータがどこにあり、何を表すのかを可視化するのが第一歩です。データの品質を整える前に、そもそもデータを使えるようにすることが必要なのです」（吉村氏）

「誰が管理監督しているデータなのかを明らかにしておかないと、品質が担保できません」（岡氏）

データ品質の向上のためにはデータクレンジングも必要だが、今後は生成AIによって手間が軽減され、品質も向上する可能性がある。日本語の揺らぎの統一や名寄せなどを、生成AIに類義語を登録することでAIが全て一意に解釈できるようにしようという実証実験も行われているそうだ。ただし、資料画像のような非構造データもあるため、AIが理解できるかたちで入力するようルールを定めることが重要だ。それが品質に直結する。

「AIがクエリの作成から実行まで行えるようになると、AIが使うことを前提としたデータもメタデータをきちんと管理していく必要があります。AIが読めるようなかたちでデータカタログを整備することが重要です」（吉村氏）

対談の最後に両氏は、生成AIは小さく始めることが重要だと改めて強調した。

「顧客にはいつも、1年がかりで大規模なかっこいいものをつくるのは絶対にやめてくださいと言っています。1年後にどうなっているか分かりません。いつでも捨てられる、いつでも入れ替えられる、路線変更できるくらいの小さいところから始めて、小ささを保ってシステムを組むことが重要です」（岡氏）

「まさしくそうですね。今の生成AIではデータ基盤もクラウドネイティブなものがあります。クラウドなら従量課金制で小さく始めやすいでしょう。データ活用もAI活用も、小さく始めて成功事例を出し、経営陣に成果を認識していただき、そこからより大きい投資に結び付けていくという活動が重要です」（吉村氏）