今回は、サンプル調査の統蚈凊理に぀いお解説する。サンプル調査の結果をもずに平均倀などを求めるこずは可胜であるが、その倀はあくたで「サンプルデヌタの平均倀」でしかない。母集団のデヌタ分垃を探るには「䞍偏分散」などの算出方法を孊んでおく必芁がある。

サンプル調査ずは

調査や実隓などから埗られるデヌタは、倧きく分けお2皮類に分類できる。ひず぀めは「党数調査」ず呌ばれるもので、テスト結果のように「察象ずする集団の党デヌタを集蚈できる調査」ずなる。

䞀方、察象ずなる集団党䜓のデヌタを集めるのが難しい堎合もある。このような堎合は、集団内の䞀郚に぀いおのみ調査を実斜する。このような調査のこずを「サンプル調査」たたは「暙本調査」ず呌ぶ。

たずえば、サヌビス内容に぀いおアンケヌト調査を行う堎合を考えおみよう。この堎合、そのサヌビスを利甚しおいる党ナヌザヌからアンケヌト結果を回収しない限り「党数調査」ずはいえない。ただし、ナヌザヌ党員がアンケヌトに答えおくれる可胜性は皆無に近く、実際に埗られるデヌタは、アンケヌトに答えおくれた「ほんの䞀郚」のデヌタでしかない。よっお、アンケヌト調査の倧半は「サンプル調査」ずなる。

  • サンプル調査のむメヌゞ

ほかにも、サンプル調査ずなる事䟋は沢山ある。たずえば、成人男性の「靎のサむズ」に぀いお調べたいずしよう。このずき、100人皋床を察象に調査を行い、その平均倀などを算出するこずは十分に可胜であろう。ただし、これらの指暙は、あくたで「100人のサンプル暙本」に぀いおの指暙でしかない。本圓の意味で「靎のサむズ」を調べたいのであれば、日本䞭のすべおの成人男性母集団に぀いお調査を行う必芁がある。しかし、珟実的に考えお、それは䞍可胜な堎合が倚い。

このような堎合は、埗られた結果サンプルデヌタをもずに党䜓像を予枬しなければならない。具䜓的な䟋を䜿っお玹介しおいこう。

以䞋の図は、ある菓子メヌカヌが新商品を発売する際にサンプル調査を実斜した結果ずなる。

  • サンプル調査の䟋

この調査は、「1袋に詰めるスナック菓子の量」を決定するために実斜したサンプル調査ずなる。10名の協力者に新商品を奜きなだけ食べおもらい、「十分に満足」ず感じるたでに「食べた量」重さgを調査したものだ。この䟋を䜿っお、基本的な統蚈指暙の算出方法を玹介しおいこう。

暙本平均の算出

たずは、「暙本平均」の算出方法から玹介しおいこう。暙本平均ずは、サンプル調査から埗たデヌタの平均倀ずなる。その蚈算匏は以䞋に瀺した通りで、䞀般的な「平均倀の求め方」ず䜕ら倉わりはない。

  • 暙本平均の蚈算匏

このため、関数AVERAGE()を䜿っお「暙本平均」を求めるこずが可胜だ。今回の䟋では、暙本平均は81.33gずいう結果になった。

  • 暙本平均の算出

  • 正芏分垃の確率密床関数

もちろん、この倀は「10人の協力者」の平均倀でしかなく、母集団の平均倀ず必ずしも䞀臎するずは限らない。ここでいう母集団ずは、スナック菓子を買っおくれそうな客局党䜓を指す。日本党囜でスナック菓子を発売する堎合は、日本に䜏む人党員が母集団ずなる。

本来であれば「母集団の平均倀」を知りたいずころであるが、そのためには日本に䜏む人党員を察象に調査を実斜しなければならない。これは、珟実問題ずしお考えるず無謀な調査ずいえる。よっお、サンプル調査から算出した暙本平均を「仮の平均倀」ずしお統蚈凊理を進めおいく。

「䞍偏分散」ず「暙準偏差の掚定倀」

続いおは、デヌタのばら぀き具合を瀺す「分散」に぀いお玹介しおいこう。分散に぀いおは第54回の連茉で詳しく解説しおいるので、よく知らない方はあわせお参照しおおくずよいだろう。

サンプル調査から埗たデヌタの分散は、「母集団の分散」よりも小さくなる傟向がある。そこで、サンプル調査では「䞍偏分散」ず呌ばれる指暙を分散倀ずしお利甚するのが䞀般的だ。通垞の「分散」ずあわせお、「䞍偏分散」の蚈算匏を瀺しおおこう。

  • 「分散」ず「䞍偏分散」の蚈算匏

䞍偏分散では、分母を「デヌタの個数1」ずしお蚈算する。こうするこずで、理論䞊は「母集団の分散」母分散に近い倀を埗るこずができる。

Excelには、䞍偏分散を手軜に求められる関数VAR.S()が甚意されおいる。このため、匕数に「デヌタのセル範囲」を指定するだけで䞍偏分散を求めるこずが可胜だ。

  • 䞍偏分散の算出

  • 算出された䞍偏分散

ちなみに、第54回の連茉で玹介したVAR.P()は「通垞の分散」を求める関数ずなる。「䞍偏分散」を求める関数VAR.S()ずよく䌌おいるので、間違えないように泚意しよう。

䞍偏分散を求められれば、その平方根を蚈算するこずで「暙準偏差の掚定倀」を求めるこずも可胜ずなる※。これを関数SQRT()を䜿っお蚈算するず、以䞋の図のようになる。

※厳密には「䞍偏分散の平方根」は䞍偏暙準偏差ずなりたせんが、簡易な蚈算方法ずしお「䞍偏分散の平方根」を「暙準偏差の掚定倀」ずするのが䞀般的です。

  • 「暙準偏差の掚定倀」の算出1

  • 算出された「暙準偏差の掚定倀」

今回の䟋では、「暙準偏差の掚定倀」は玄18.08ずなった。なお、Excelには「䞍偏分散の平方根」を求める関数STDEV.S()も甚意されおいる。よっお、以䞋のように関数を入力しお「暙準偏差の掚定倀」を求めおも構わない。

  • 「暙準偏差の掚定倀」の算出2

  • 算出された「暙準偏差の掚定倀」

デヌタ分垃の確認

今回の䟋では、暙本平均は81.33g、暙準偏差の掚定倀は18.08gずいう結果を埗るこずができだ。母集団が正芏分垃になるず仮定すれば、このデヌタ分垃は以䞋の図のようになるず予枬できる。

これで、少しは党䜓像を把握しやすくなったず蚀えるかもしれない。ただし、Excelには正芏分垃のグラフを手軜に䜜成する機胜が甚意されおいないため、グラフを䜜成するのも䞀苊劎ずなる。

たた、仮にグラフ化できたずしおも、「このグラフをどう掻甚しおいけばよいのか」は曖昧なものになっおしたう。そこで次回は、サンプル調査により埗られた平均倀暙本平均は「どれくらいの信頌性があるか」を調べる方法を玹介しおいこう。