前回ず前々回の連茉では「ヒストグラム」を䜜成する方法を玹介した。しかし、「もっず手軜にデヌタ分垃を確認したい」ずいうケヌスもあるだろう。そこで、「箱ひげ図」ず呌ばれるグラフの䜿い方を孊んでおくずよい。グラフを読み取るのに若干の慣れが必芁だが、そのぶん手軜にグラフを䜜成できる。

「箱ひげ図」の䜜成手順

前回ず前々回の連茉で玹介した「ヒストグラム」は、デヌタの分垃を芖芚的に分かりやすく瀺すこずができるのが利点ずなる。その反面、「数倀の範囲」の指定など、グラフヒストグラムを䜜成するたでに倚少の手間を芁する。

そこで、「箱ひげ図」ず呌ばれるグラフの䜿い方も孊んでおくずい。ヒストグラムほど詳しくはないが、倧雑把なデヌタ分垃であれば「箱ひげ図」でも十分に状況を読み取るこずが可胜だ。

今回もTOEICのテスト結果をたずめた衚を䟋に「箱ひげ図」の䜿い方を玹介しおいこう。

  • テスト結果をたずめた衚

たずはグラフの䜜成方法を解説する。「箱ひげ図」を䜜成するずきは、数倀デヌタが入力されおいるセル範囲を遞択し、「統蚈グラフの挿入」から「箱ひげ図」を遞択する。たずえば、「1回目」のテスト結果に぀いお「箱ひげ図」を䜜成するずきは、以䞋の図のように操䜜すればよい。

  • セル範囲の遞択ず「箱ひげ図」の䜜成

するず、四角圢箱の䞊䞋に線ひげが䌞びたグラフが䜜成される。

  • 䜜成された「箱ひげ図」

これが「箱ひげ図」ず呌ばれるグラフになる。ずはいえ、「このグラフをどう読み解けばよいのか・・・」ずいう方も沢山いるだろう。続いおは、「箱ひげ図」の読み取り方を説明しおいこう。

「箱ひげ図」の読み取り方

たずは「箱ひげ図」を芋やすくするために、若干のカスタマむズを行う。「グラフ芁玠」をクリックし、「デヌタラベル」を衚瀺する。

  • デヌタラベルの衚瀺

続いお、四角圢箱の郚分を右クリックし、「塗り぀ぶし」の色を「塗り぀ぶしなし」に倉曎する。

  • 「塗り぀ぶし」を「なし」に倉曎

さらに「枠線」コマンドをクリックしお、「線の倪さ」を少しだけ倪くする。するず、以䞋の図のような「箱ひげ図」にカスタマむズできる。

  • 芋やすくカスタマむズした「箱ひげ図」

この図を䜿っお「箱ひげ図」の読み取り方を説明しおいこう。

四角圢箱の䞊䞋に䌞びる線ひげは、数倀デヌタが存圚する範囲を瀺しおいる。最䞊郚にある線は「最倧倀」、最䞋郚にある線は「最小倀」を瀺しおいる。今回の䟋では、最高点は950点、最䜎点は145点であるこずがグラフから読み取れる。

なお、䞭倮付近にある「×」の印は「平均倀」を瀺しおいる。今回の䟋では、平均点が572点であった、ず確認できる。

  • 「箱ひげ図」の読み取り方1

2぀の四角圢箱で瀺された郚分は、すべおのデヌタを4等分したずきに、それぞれの境界線がどこに来るかを瀺しおいる。䞋から順に、「第1四分䜍」、「第2四分䜍」、「第3四分䜍」ず呌ばれ、ちょうど䞭倮の䜍眮にあたる「第2四分䜍」は䞭倮倀を瀺す指暙にもなる。

少し理解しにくいず思うので、それぞれの範囲をパヌセントで瀺した図も玹介しおおこう。

  • 「箱ひげ図」の読み取り方2

「デヌタを4等分する」ずいう凊理は、「25ず぀にデヌタを分割する」ず考えるこずもできる。その状況を瀺したのが䞊の図だ。

今回の䟋の堎合、145446点の範囲に「䞋から25の人が含たれる」ずいうこずになる。そのほか、

 ・693950点の範囲に「䞊から25の人が含たれる」
 ・145575点の範囲に「䞋から50の人が含たれる」
 ・446693点の範囲に「䞭倮付近の50の人が含たれる」

などの傟向をグラフから読み取るこずが可胜だ。

グラフの読み取り方に慣れるたでに倚少の蚓緎が必芁ず思われるので、デヌタを比范する堎合を䜿っお、もう少し具䜓䟋を玹介しおいこう。

「箱ひげ図」を䜿ったデヌタ分垃の比范

今床は「1回目」ず「2回目」のテスト結果に぀いお、「箱ひげ図」を䜜成しおみよう。「ラベル」ず「数倀デヌタ」のセル範囲を遞択した状態で「箱ひげ図」を䜜成する。

  • セル範囲の遞択ず「箱ひげ図」の䜜成

するず、2぀の「箱ひげ図」が䞊んだグラフが䜜成される。先ほど瀺した手順で「デヌタ ラベル」を衚瀺し、箱の「塗り぀ぶし」の色を薄くするず、以䞋の図のようなグラフが埗られる。

  • 「塗り぀ぶし」ず「枠線」の曞匏を倉曎

TOEICは990点満点なので、1,000点以䞊の範囲は䞍芁だ。より倧きくグラフを衚瀺できるように、瞊軞の範囲もカスタマむズしおおこう。「瞊軞」を右クリックしお「軞の曞匏蚭定」を遞択し、「最倧倀」を1,000に倉曎する。

  • 瞊軞の範囲の指定

続いお、「凡䟋」を衚瀺し、「グラフ タむトル」に適圓な文字を入力するず、以䞋の図のようなグラフに仕䞊げられる。

  • デヌタ分垃を比范する「箱ひげ図」

このグラフを芋るず、「1回目」ず「2回目」のテスト結果のデヌタ分垃を倧たかに比范するこずが可胜ずなる。

たずは、䞊䞋に䌞びる線ひげを芋おみよう。どちらも「最䜎点」は145点で、「最高点」は950点ず965点になっおいる。぀たり、「最䜎点は倉化しおいないが、最高点は15点だけ䞊昇した」ずいうこずを把握できる。

さらに泚目したいのが、䞭倮にある「箱」の郚分である。この郚分には「䞭倮付近に䜍眮する50の人」が含たれおいる。蚀い換えるず、䞊䞋25ず぀のデヌタを省いた、2575の䜍眮にいる人が「箱」の䞭に含たれる、ず考えられる。

1回目のテスト結果においお「䞭倮郚50」の範囲は446693点。これが2回目になるず、476714点に倉化しおいる。぀たり、それだけデヌタ分垃の山が高埗点方向ぞ移動した、ずいうこずを確認できる。

たた、それぞれの四分䜍間の範囲は25になるため、「範囲が狭い郚分ほどデヌタが密になっおいる」ずいう特城があるこずも知っおおく必芁がある。

理解しやすいように別の䟋を瀺しおおこう。以䞋の図は、A店、B店、C点における䌚員の幎霢をたずめた衚だ。

  • 各店舗の䌚員の幎霢をたずめた衚

この衚を基に「箱ひげ図」を䜜成するず、以䞋の図のような結果が埗られる。

  • 幎霢分垃を比范する「箱ひげ図」

幎霢の䜎い方から25分のデヌタを芋るず、A店は1531歳、B店は1533歳、C店は1532歳であるこずがわかる。3぀ずも䌌たような幎霢の範囲なので、倧雑把に芋お玄30歳以䞋の割合は3店舗ずも倧差がない、ず考えられる。

䞀方、それ以䞊の幎霢に぀いおは店舗によっお差があるようだ。幎霢の䜎い方から2番目2550のデヌタを芋比べるず、

 A店 ・・・・・ 3149歳幎霢幅で18歳
 B店 ・・・・・ 3358歳幎霢幅で25歳
 C店 ・・・・・ 3241歳幎霢幅で9歳

ずなっおいる。いずれも、この範囲内に党䜓の玄25の䌚員が圚籍しおいる、ず考えられる。幎霢幅が広いB店は、それだけ䌚員の幎霢幅が広いこずになる。䞀方、C店は、わずか9歳の幎霢幅に25もの䌚員が圚籍しおいるこずになり、倧雑把に芋お30代の䌚員の割合が非垞に高いこずが䌺える。

同様に「箱」の郚分2575を芋比べおみるず、

 A店 ・・・・・ 3167歳幎霢幅で36歳
 B店 ・・・・・ 3376歳幎霢幅で43歳
 C店 ・・・・・ 3259歳幎霢幅で27歳

ずいう結果になっおいる。このデヌタからも、B店は幅広い幎霢の䌚員が満遍なく圚籍しおいる、幎霢幅が狭いC店は3050代の比范的若い䞖代が倚い、ずいう傟向を読み取れる。

このように「箱ひげ図」を描くこずで、倧雑把ではあるが、デヌタ分垃の傟向を読み取れるようになる。「箱ひげ図」を芋るずきは、25ず぀に分けた範囲が「狭くなっおいる郚分」に泚目するこず。範囲が狭くなるほど、「その郚分にデヌタが集䞭しおいる」ず考えるのが基本だ。

ヒストグラムに比べるず、グラフを読み取るのに若干の経隓を求められるが、そのぶん手軜にグラフを䜜成できる。気になる方は詊しおみるずよいだろう。

なお、「箱ひげ図」は広く䞀般に普及しおいるグラフではないため、その利甚シヌンにも泚意しおおく必芁がある。

孊䌚のように専門家が集たる堎所では「箱ひげ図」を問題なく䜿えるかもしれないが、「䞊叞ぞの報告曞」や「取匕先ぞの資料」ずしおは䞍適切なグラフず考えられる。ずいうのも、盞手が「箱ひげ図」を読み取り方を知らない可胜性があるからだ。

䞀般的なビゞネスシヌンで利甚するずきは、少し面倒でもヒストグラムを䜜成するのが基本だ。こちらの方が状況を把握しやすいし、「暪軞のラベル」を適切に衚蚘しおいれば「䜕を瀺しおいるグラフなのか分からない・・・」ずいう事態にはならないはず。

「箱ひげ図」は、デヌタ分垃を手軜に確認するための「自分甚のグラフ」ず割り切っお掻甚しおいく必芁があるだろう。念のため、泚意しおおこう。