「棒グラフ」や「折れ線グラフ」、「円グラフ」ほどメジャーではないものの、「散布図」もよく使われるグラフのひとつである。しかし、いざ自分で散布図を作成しようとすると、上手くいかずに困惑してしまう方も多いようだ。そこで今回は、通勤時間と睡眠時間の関連性を探りながら、「散布図」の作成方法を学んでいこう。
散布図の作成に使用するデータ
散布図は「縦軸」と「横軸」の両方を数値軸にして、点(マーカー)の位置で「2つの数値データ」を示していくグラフだ。データ分布を示す場合などによく使われているので、詳しく説明しなくてもグラフの大まかな概要は理解できるだろう。
ただし、実際に自分で散布図を作成しようとすると、予想外のトラブルに見舞われてしまうケースが多いようである。そこで今回は「通勤時間」と「睡眠時間」という2つの数値データを使って「散布図」の作り方を紹介していこう。
今回、例として使用するデータは、以下の図のようになっている。
このデータは、総務省統計局の「社会生活基本調査から分かる47都道府県ランキング」からデータを抜粋して作成したもので、「通勤時間」と「睡眠時間」の調査結果を47都道府県別にまとめてある。
平成28年(2016年)の調査結果なので少し古いデータになってしまうが、ここ1~2年はコロナ禍の影響でテレワークが増加し、「通勤時間」のデータを収集しにくくなっていることを考えると、むしろ妥当なデータといえるかもしれない。
一説には、「通勤時間」が長くなるほど「睡眠時間」は短くなる、という話もあるようで、両者にはある程度の関連性(相関関係)があると思われる。これを「散布図」で確認してみよう。
なお、参考までに「睡眠時間」のトップ5、ワースト5を紹介しておくと、以下のようになる。
◆睡眠時間 トップ5
1.秋田 8:02(通勤時間58分)
2.青森 7:59(通勤時間58分)
3.山形 7:56(通勤時間60分)
4.岩手 7:54(通勤時間61分)
5.島根 7:53(通勤時間58分)
◆睡眠時間 ワースト5
1.埼玉 7:31(通勤時間96分)
2.千葉 7:32(通勤時間102分)
3.神奈川 7:33(通勤時間105分)
4.東京 7:35(通勤時間94分)
4.愛知 7:35(通勤時間79分)
4.兵庫 7:35(通勤時間81分)
4.奈良 7:35(通勤時間93分)