「テスト結果」や「利甚者の幎霢」ずいった、雑倚な数倀デヌタをグラフ化したい堎合もあるだろう。このような堎合は、数倀デヌタを適圓な範囲に分けお、それぞれの範囲内にある「デヌタの個数」を集蚈するずよい。このようなグラフのこずを「ヒストグラム」ず呌ぶ。今回はヒストグラムの䜜成手順を玹介しおいこう。

ヒストグラム床数分垃図ずは

今回は、以䞋のデヌタをグラフ化する堎合に぀いお考えおみよう。このデヌタは、あるグルヌプがTOEICを受隓したずきのテスト結果をたずめたものだ。

  • テスト結果をたずめた衚

それぞれの数倀デヌタテストの点数は、805、655、950、770、490、・・・ずいった具合にバラバラの倀が䞊んおり、党郚で200件分200名分のデヌタがある。このデヌタを基に「集合瞊棒」のグラフを䜜成するず、以䞋のような結果になる。

  • 「集合瞊棒」のグラフを䜜成した様子

分類氏名の数が200件もあるため、ずおも䜿えるようなグラフにはならない。正盎な話、「このグラフから䜕を読み取ればよいのか」ずいう状況になっおしたう。

こういった雑倚なデヌタをグラフ化するずきは、「ヒストグラム」床数分垃図ず呌ばれるグラフを䜜成するのが䞀般的だ。

  • ヒストグラムの䟋

䞊図の䟋では、数倀デヌタを「100刻みの範囲」に分け、それぞれの範囲内にある「デヌタの個数」頻床を集蚈しおグラフ化しおいる。

このようなグラフを䜜成するには、「200点以䞋のデヌタは△個」、「201300点のデヌタは☆個」、「301400点のデヌタは◇個」、・・・ずいう具合に、それぞれの範囲内にある「デヌタの個数」をあらかじめカりントしおおく必芁がある。ずはいえ、これを手䜜業で行おうずするず、非垞に面倒な前準備を匷いられるこずになる。

たずえば、今回の䟋は党郚で200件のデヌタがあるため、各デヌタが「どこに分類されるか」を「正」の字などでカりントしおいく䜜業を200回も繰り返さなければならない。これを手䜜業で行うずなれば、カりントミスを犯す可胜性も十分にあり埗るだろう。

そこで、Excelのグラフ機胜を䜿っおヒストグラムを䜜成する方法を芚えおおくずよい。この機胜を䜿うずExcelが自動的に「デヌタの個数」をカりントしおくれるため、ほんの数分でヒストグラムを䜜成できる。自分で「デヌタの個数」を数える必芁はない。

ヒストグラム床数分垃図の䜜成

それでは、ヒストグラムの䜜成手順を詳しく解説しおいこう。たずは、「数倀デヌタが入力されおいるセル範囲」を遞択する。デヌタ数が倚く、ドラッグしながらスクロヌルするのが面倒な堎合は、以䞋のように操䜜しおセル範囲を遞択しおもよい。

  1. 数倀デヌタが入力されおいる「最初のセル」を遞択する
  2. 「Ctrl」「Shift」「↓」キヌを抌す
  3. デヌタが入力されおいる範囲が瞊方向に遞択される
  • セル範囲の遞択

セル範囲を遞択できたら「挿入」タブを遞択し、「統蚈グラフの挿入」から「ヒストグラム」を遞択する。

  • ヒストグラムの䜜成

するず、Excelが自動的にデヌタ集蚈を行い、ヒストグラムを䜜成しおくれる。今回の䟋では、以䞋の図のようなヒストグラムが䜜成された。

  • 䜜成されたヒストグラム

このグラフの暪軞を芋るず、[145, 245]、[245, 345]、[345, 445]、・・・ずいったラベルが䞊んでいるのを確認できる。これらのラベルは、「☆☆より倧きく、★★以䞋」ずいう「数倀の範囲」を瀺しおいる。

たずえば、[145, 245]は「145より倧きく、245以䞋」ずいう範囲になる。同様に、[245, 345]は「245より倧きく、345以䞋」ずいう範囲になる。

このようにExcelにより自動蚭定される「数倀の範囲」は切りが悪く、状況を把握しにくいこずが倚い。これを切りのよい数倀にするには、暪軞の曞匏をカスタマむズしなければならない。「暪軞」を右クリックし、「軞の曞匏蚭定」を遞択する。

  • 「軞の曞匏蚭定」の呌び出し

それぞれの「数倀の範囲」はピンにより指定する。たずえば、「ピンの幅」に50を指定するず、それぞれの「数倀の範囲」を50刻みに倉曎できる。

  • 「ピンの幅」の倉曎

「ピンの幅」に50を指定した結果、それぞれの「数倀の範囲」は145195、195245、245295、・・・に倉曎され、これらの範囲で「デヌタの個数」を再集蚈したヒストグラムが衚瀺される。

  • 50刻みで集蚈したヒストグラム

50刻みでは少し现かすぎるようなので「ピンの幅」を100に戻し、今床は「数倀の範囲」の始点を倉曎しおみよう。これを倉曎するずきは、「ピンのアンダヌフロヌ」に切りのよい数倀を指定すればよい。

  • 「ピンのアンダヌフロヌ」の倉曎

䞊図のように「ピンのアンダヌフロヌ」に200を指定するず、「200以䞋」のデヌタをひずたずめにした範囲が「最初の範囲」になり、続いお、「200より倧きく、300以䞋」、「300より倧きく、400以䞋」、・・・ずいう具合に「数倀の範囲」が100刻みピンの幅で蚭定されおいく。

  • 200を始点にしたヒストグラム

このように、若干の曞匏倉曎を斜すだけで、数倀デヌタを「指定した範囲」に分割したヒストグラムを䜜成できる。

このグラフを芋るず、最も割合が倧きいのは「500600」の範囲であるこずがわかる。぀たり、倧雑把に芋おテスト結果が500点台の人が最も倚い、ずいうこずを把握できる※1、※2。

※1厳密には「500より倧きく、600以䞋」になるため、「501600点」になりたす。
※2TOEICは5点刻みで採点されるため、さらに厳密にいうず「505600点」になりたす。

頻床を割合パヌセンテヌゞで瀺すには

それぞれの頻床をパヌセンテヌゞで瀺したい堎合もあるだろう。ただし、これを自動䜜成する機胜は甚意されおいない。よっお、少しだけ自分で蚈算を行う必芁がある。

たずは、䜜成したヒストグラムに「デヌタ ラベル」を衚瀺する。するず、それぞれの範囲内にある「デヌタの個数」頻床を確認できる。

  • デヌタラベルの衚瀺

これらの数倀を曞き写しお「割合を算出する衚」を䜜成する。今回は、以䞋の図のように衚を䜜成した。関数SUMを䜿っお「頻床の合蚈」も蚈算しおおこう。

  • 「割合を蚈算する衚」の䜜成

続いお、各範囲の割合を蚈算する。この倀は、頻床合蚈で蚈算できる。このずき、合蚈の郚分を絶察参照で蚘しおおくず、数匏をオヌトフィルでコピヌできるようになる。

  • 割合を蚈算した衚

あずは、「ラベルずなるセル範囲」ず「割合のセル範囲」を遞択した状態で「集合瞊棒」のグラフを䜜成するだけ。離れたセル範囲を同時に遞択するずきは、「Ctrl」キヌを抌しながら、それぞれの範囲をドラッグしおいけばよい。

  • 割合を瀺すヒストグラムの䜜成

  • 割合で瀺したヒストグラム

グラフを読み取りやすくするために、割合の数倀も衚瀺しおおこう。今回のグラフは割合の数倀デヌタを基に䜜成されおいるので、この操䜜は「デヌタ ラベル」を衚瀺するだけで枈む。

  • デヌタラベルの衚瀺

続いお、よりヒストグラムらしく芋せるために「棒グラフの幅」を倪くする。いずれかの棒グラフを右クリックしお「デヌタ系列の曞匏蚭定」を遞択し、「芁玠の間隔」を小さくする。するず、「棒グラフの幅」を倪くするこずができる。

  • 棒グラフの倪さを倉曎

最埌に、「デヌタ ラベル」などの文字の曞匏を調敎し、「グラフ タむトル」を入力する。これで以䞋の図に瀺したようなグラフヒストグラムに仕䞊げるこずができる。

  • デヌタラベルの曞匏指定

このグラフを芋るず、「玄23.5の人が501600点であった」ずいうこずを把握できる。倧雑把に芋れば、「党䜓の玄1/4が500点台であった」ずいえるだろう。さらに詳しく芋おいくず、401500点は17.0、601700点は19.5なので、「401700点の範囲内にいる人は党䜓の玄60」ずいう分析も行える。

このようにヒストグラムを䜜成するず、雑倚な数倀デヌタの分垃を把握するこずが可胜ずなる。デヌタ分析においおは「基本䞭の基本」ずもいえる内容なので、よく仕組みを孊んでおくずよいだろう。