AIはもはや日常に欠かせないものとなり、ビジネスシーンでも分析や予測に広く活用されている。しかし、データサイエンティスト/チーフマーケティングプラニングディレクターで、博報堂 コマースデザイン事業ユニット/博報堂DYメディアパートナーズ AaaSビジネス戦略局/博報堂DYホールディングス マーケティング・テクノロジー・センターに所属する宮腰卓志氏は、「ビジネスの意思決定においてAIの分析や予測を鵜呑みにしてよいのか」と警鐘を鳴らす。

2月18日~20日に開催された「TECH+ EXPO 2025 Winter for データ活用 データを知恵へと昇華させるために」に同氏が登壇。計量経済学から発展したマーケティングミックスモデリング(MMM)の専門家としての立場から、AIを使った予測をビジネスで活用する際に必要になるリテラシーについて解説した。

予測モデルを使ううえで問題になることとは

宮腰氏が専門とするマーケティングミックスモデリング(MMM)は、集計データを使った回帰分析により、さまざまな施策の要因の効果を推定する手法を指す。MMMではまず、売上や販売数量といったビジネス成果となる指標を目的変数として定義し、広告出稿量や割引率、季節性、エリア特性など、目的変数に影響を及ぼすデータを集める。次にこのデータを回帰式に入れ、それぞれの効果を推定する。完成した数式が予測モデルとなり、マーケティング施策の効果を把握したり、売上を最大化する予算配分をシミュレートしたりすることができる。

  • マーケティングミックスモデリング(MMM)の概要

MMMに限らず、予測モデルを使ううえで一番の問題は、モデルの予測精度ではない。むしろ相関関係と因果関係の混同やデータの取得方法、判断基準の設定のほうが問題となる。それを表すのが、次の3つの問題だ。

1. ノーベル賞受賞者数が多い国はチョコレートの年間消費量が多いというデータから、チョコレートをもっと食べればノーベル賞受賞者が増えるかと言えるのだろうか?

2. 生還した爆撃機の被弾箇所のデータから、機体のどこを強化すれば生還率が高まるかを分析し、結論付けられるだろうか?

3. 外食する店を決めるときに、6回行って4回満足した店と、一度も行ったことのない店のどちらを選ぶほうが満足度が高いだろうか?

意思決定をするまでには、データを取得し、分析・モデル化を行い、何らかの判断をするという3つのプロセスがある。3つの問題は、この意思決定プロセスに対応しており、1は分析・モデル化、2はデータ取得、そして3は判断方法に関わるものである。

因果関係が反映されているか

1の問題は疑似相関と呼ばれるものだ。チョコレートの消費量とノーベル賞の受賞者数は相関している。しかし、実際に因果関係があるのだろうか。経済的に豊かな国だから研究開発への投資が多いということと、たまたま豊かさゆえにチョコレートを食べる量が多いことという別々の因果関係が存在するのかもしれない。このような共変量と呼ばれる要素が絡み合っているため、疑似相関が生まれるのだ。

これを因果効果から考えてみる。因果効果とは、処置の有無による結果の違いのことで、この例ではチョコレート消費量が多いかどうかという処置の有無により、結果である受賞者数にどのような違いが出るかということだ。例えばあるA国でチョコレート消費量が多ければ7件受賞、少なければ1件受賞する場合には、引き算して因果効果が6となる。全ての国でこれを算出して平均すれば、ATE(平均処置効果)を導き出すことができる。

しかしここには落とし穴がある。A国がそもそもチョコレート消費量の多い国であれば、少ない場合のデータはない。逆に消費量が少ない国では多い場合のデータを取ることはできない。反実仮想、つまり実際の処置とは異なる効果は計測できないため、この場合ATEは計算できないのだ。

そこで考慮するのが共変量だ。例えばGDPや教育への投資量、気温などの要素を共変量とし、受賞者数を予測するモデルをつくれば、チョコレート消費量の多い国で少なかった場合の受賞者数、少ない国で多かった場合の受賞者数を導き出せる。こうして反実仮想の予測値を得て、そこで初めてCATE(条件付き因果効果)を算出することができるのだ。

「相関関係があるようなデータを見たときには、その背景にある共変量をチェックし、因果関係が予測モデルに反映されているどうかをチェックする。こういったリテラシーが必要なのです」(宮腰氏)

データ取得時の偏りがないか

2は選択バイアスの問題だ。取得できているデータは生還した機体のものだけで、帰還しなかった機体のデータはない。つまり、どこが被弾すると致命的であるかは分からないのだ。母集団の中から、特定の標本集団である生還した機体の被弾箇所だけを見ているためである。ビジネスで言えば、成功事例だけを見て判断してしまうのと同じだ。ビジネスでは、母集団からサンプリングして標本集団をとり、それを介入群と対照群に分けてABテストをするといったことが行われる。しかし、標本集団を抽出する際や介入群と対照群を分ける際、つまりデータ取得の段階で偏りがあると、因果効果の推定を誤ってしまう。

「比較するデータを取得する方法をチェックすることが重要です。観測値を比較する段階でも、誘導的な説明文でないか、意図しない実験以外の何らかの外的要因により偏りが生じていないか、チェックが必要なのです」(宮腰氏)

意思決定するための判断基準を選ぶ

3は判断基準の問題で、「多腕バンディット問題」とも呼ばれるものだ。ここでは、将来の利益は現在の利益より不確実であるためその分を割り引くという、経済学の割引概念を導入して考える。次回の意思決定では利益が9割になるとすると、6回中4回満足した店の次回の満足度は0.69だが、未訪問の店は0.70になる。わずかに未訪問の店のほうが満足度が高い可能性があることになる。

ただし、重要なのはこの数字そのものではなく、意思決定のプロセスにおいてこういった判断方法をどう活用するかということだ。例えば3つの投資プランがある場合に、将来の経済状態の変化を考慮して2つの状態を想定すれば、6つの選択肢があることになるが、これをどう選べば正しい意思決定になるのかを考えなければならない。

意思決定の判断基準にはさまざまなものがある。その1つが楽観的な攻めの考えに基づくMaximax基準だ。これに従えば、選択肢の中で最大の利得が得られるものを選ぶことになる。これに対し、悲観的な攻めであるMaximin基準は、3つのプランそれぞれの最小利得の中で、最大利得になるものを選ぶ。また機会損失の最大値を計算することで、後悔を最小化できるものを選ぶMinimax Regret基準もある。この方法では、それぞれの状態の最大値から当該選択肢の利得を引き算し、後悔を算出する。つまり、これを選ばなかったときにどれだけ多くの利得が得られたかを数値化する。データ取得、分析・モデル化を行って予測モデルをつくり、予測シミュレーションを出したとしても、最終的にはこういった判断基準を選んで意思決定をしなければならないのだ。

「最後の判断基準というのは、意思決定者の価値観が反映されてくる箇所です。局面や、扱う商材の影響範囲や危険度などによって基準の選び方も変わります。モデル予測値を使った意思決定をする際に、我々自身が決めなければいけないのがこの判断基準なのです」(宮腰氏)

意思決定に必要な3つのリテラシー

このように、正しい意思決定のためには、データ取得の段階でデータの意味を理解し、分析・モデル化段階で予測モデルに因果関係が反映されているかを確認し、最後に状況に応じた判断基準を選ぶという3つのリテラシーが必要になる。ただ、AI予測をビジネスに活かそうとすると分析・モデル化の予測精度の高さばかりに注目しがちだが、その前後の段階のほうがより重要だと宮腰氏は指摘する。

「ビジネスにおける意思決定という現実世界に予測モデルを使う場合は、データの意味を理解することや、価値のある選択肢を選ぶための判断基準のほうが重要であり、そのリテラシーを鍛えることが必要なのです」(宮腰氏)

最後に宮腰氏は、ビジネスの意思決定では数字を鵜呑みにせず、意思決定の各プロセスの根拠を明確にすることが有効だと話した。

「データの意味を理解し、因果関係を確認し、価値ある選択肢を選べる判断基準を設定する。こうした意思決定の各プロセスの根拠を明確にして、きちんと言語化して共有していくことが必要になります」(宮腰氏)