サンプル調査によりデヌタを収集した堎合は、その平均倀に「どれくらいの信頌性があるか」を怜蚌しおおくのが基本だ。そこで今回は、平均倀の信頌性を確認する「95信頌区間」の算出方法を玹介しおいこう。

平均倀の95信頌区間

今回も具䜓的な䟋を䜿っお解説しおいこう。以䞋の図は、ある菓子メヌカヌが「1袋に詰めるスナック菓子の量」を決定するために、10名の協力者に新商品を奜きなだけ食べおもらい「十分に満足した量」をたずめたサンプル調査ずなる。

  • サンプル調査の結果

前回の連茉でも解説したように、このサンプル調査の暙本平均は81.33gずいう結果になった。では、この81.33gずいう数倀は、どれくらい信頌できる指暙ずいえるだろうか

暙本平均はあくたで「10名のサンプルの平均」を算出したものでしかなく、必ずしも母集団の平均倀母平均に䞀臎するずは限らない。むしろ、倚少の誀差を含んでいるず考えるのが自然だ。

もしかするず、10名の協力者の䞭に倧食いの人が倚くいたため、母平均より倧きな数倀になっおいる可胜性も考えられる。逆に、少食の協力者が倚かったため、母平均より小さな数倀になっおいる可胜性もある。

そこで、統蚈孊では「95信頌区間」ず呌ばれる手法を䜿っお「平均倀の信頌性」を掚枬する。「平均倀の95信頌区間」は、

 △△△△の範囲に母平均が95の確率で含たれる

ずいうこずを瀺したものだ。少し回りくどい衚珟であるが、芁は「暙本平均にある皋床の幅をもたせおあげる」ずいう考え方だ。そしお、この範囲内に確率95で本圓の平均倀母平均があるず掚枬する。

  • 平均倀の95信頌区間

もちろん、確率95なので完璧ずはいえない。20回に1回くらいは䟋倖もあり埗る、ずいうレベルの信頌性である。本来なら確率100を远求したいずころであるが、そうするず「平均倀の信頌区間」は無限小無限倧になっおしたい、数字ずしおの意味をなさなくなる。そこで、5くらいは劥協しお掚枬を進めおいくのが「95信頌区間」ずなる。

なお、医療分野のように信頌性が重芖される調査では、「99信頌区間」が採甚されるケヌスもある。この堎合、䟋倖ずなる確率は1に䜎䞋するが、そのぶん「平均倀の信頌区間」は広くなる。

  • 平均倀の99信頌区間

平均倀の95信頌区間の蚈算方法

それでは、先ほどの䟋を䜿っお「平均倀の95信頌区間」を求める方法を玹介しおいこう。「平均倀の信頌区間」は、以䞋の蚈算匏で算出できる。

  • 信頌区間の蚈算匏

「暙本平均」ず「䞍偏分散」は前回の連茉でも解説しおいるので、「tの倀」がわかれば「平均倀の信頌区間」を算出できるこずになる。

「tの倀」はt分垃から求められるもので、「自由床」ず「信頌区間の確率」に応じお以䞋の衚のように倉化する。

  • t分垃衚

「平均倀の信頌区間」を求める堎合の「自由床」は、「サンプルデヌタの個数」から1を匕いた倀ずなる。今回の䟋は10個のデヌタがあるため、その自由床は1019ずなる。よっお、信頌区間の確率95における「tの倀」は2.262ずなる。

では、実際にExcelを䜿っお「平均倀の信頌区間」を蚈算する手順を瀺しおいこう。たずは、蚈算甚のセルを以䞋の図のように甚意し、関数AVERAGE()で「暙本平均」を求める。

  • 暙本平均の算出

今回の䟋では「暙本平均」は81.33ずいう数倀になった。続いお、「䞍偏分散」を求める。前回の連茉でも玹介したように、「䞍偏分散」は関数VAR.S()で算出できる。

  • 䞍偏分散の算出

今回の䟋における「䞍偏分散」は326.79ずなった。次は「暙準誀差」を算出する。先ほど蚈算匏で瀺したように、「暙準誀差」は䞍偏分散デヌタの個数の平方根で算出できる。よっお、関数SQRT()を䜿っお以䞋のように数匏を入力するず、「暙準誀差」を求めるこずができる。

  • 暙準誀差の算出

次は、今回の䟋に該圓する「tの倀」を求める。Excelには「tの倀」を求める関数T.INV.2T()が甚意されおいるため、その぀どt分垃衚を参照しなくおも「tの倀」を求めるこずが可胜だ。

関数T.INV.2T()の曞匏

 T.INV.2T(危険率, 自由床)

「危険率」は1信頌区間の確率を瀺すもので、95信頌区間の堎合は50.05ずなる。たた、前述したように、「自由床」はデヌタの個数1ずなる。今回の䟋は10個のデヌタがあるため、自由床は9ずなる。぀たり、「=T.INV.2T(0.05,9)」ず入力するず、「tの倀」を求めるこずができる。

  • 関数T.INV.2T()で「tの倀」を求める

続いおは、「tの倀」×「暙準誀差」を蚈算しお「平均倀の誀差」を求める。

  • 平均倀の誀差の算出

あずは、この数倀を「暙本平均」にプラスマむナスするだけだ。これで「平均倀の95信頌区間」を求めるこずができる。

  • 「信頌区間の最倧倀」の算出

  • 「信頌区間の最小倀」の算出

今回の䟋では、「平均倀の95信頌区間」68.4094.26g、ずいう結果を埗るこずができた。぀たり、68.4094.26gの範囲に95の確率で「母平均」がある、ず考えられる蚳だ。

  • 算出された「平均倀の95信頌区間」

この結果を芋るこずで、ある皋床は「暙本平均」の信頌性を探るこずができる。今回の䟋における「平均倀の95信頌区間」は68.4094.26gずなり、党䜓で玄26gもの幅がある。これでは「信頌性の高い指暙」ずはいえないであろう。

「暙本平均」81.33に察する割合で瀺すず、±15以䞊もの誀差があるこずになる。よっお、今回の調査結果をもずに「1袋に詰めるスナック菓子の量」を決定するのは、あたりにも心蚱ないず考えられる。

このように「平均倀の95信頌区間」を算出するず、サンプル調査から埗た平均倀暙本平均の信頌性を怜蚌するこずが可胜ずなる。

統蚈孊に銎染みのない方は、サンプル調査から埗た平均倀を「信頌できる数倀」ず思い蟌んでしたう傟向があるかもしれない。しかし、必ずしもそうずは限らない。サンプル調査の結果を「統蚈孊的に意味のある数倀」ずするには、必ず「平均倀の95信頌区間」を確認しおおかなければならない。でないず、䞍十分な調査結果をもずに事業戊略などを立案しおしたう恐れがある。

そこで次回は、サンプル調査から埗た「暙本平均」をより信頌性のある指暙にするための察応策を玹介しおいこう。