今回は、「偏差値は何を表す数値なのか?」について紹介していこう。偏差値は受験などでよく耳にする言葉であるが、その意味を詳しく知っている方は少ないようである。この機会に、偏差値が意味する内容を大雑把にでも把握しておくとよい。

数式から読み取れる偏差値の意味

偏差値は、全データに対する相対的なポジションを示す指標となる。平均値と同じ値のデータは偏差値50.0となり、平均以上であれば偏差値は50.0以上、平均以下であれば偏差値は50.0以下になる。この程度の知識は誰でも知っているだろう。

これは偏差値を求める計算式からも確認できる。たとえば、平均値と同じ結果であった場合、(値-平均値)が0になるため最後の「+50」の部分だけが残り、偏差値は50.0となる。

  • 偏差値の計算式

もちろん、データが平均値から離れるほど、偏差値も高く(または低く)なる。ただし、偏差値の各数値がどの程度のポジションになるかは、曖昧な感覚しか持ち合わせていない方が多いだろう。一般的に「偏差値60は優秀」、「偏差値70ともなれば天才」といったイメージがあるかもしれないが、これは漠然としたイメージでしかない。

そこで、偏差値を求める計算式をもういちどよく見てみよう。

  • 偏差値の計算式

この計算式には「10/標準偏差」という部分がある。この部分は「標準偏差が10になるように補正する」という意味になる。つまり、偏差値は「平均値が50、標準偏差が10になるように補正した数値」と考えることができる。

「偏差値」と「全データに占める割合」の関係

前回の連載でも少し触れたように、一般的な統計学では「平均値」±「標準偏差」の範囲に約68%(厳密には約68.27%)のデータが含まれる、と考えることができる。

偏差値に換算した場合、平均値=50、標準偏差=10となるため、「平均値」±「標準偏差」の範囲は偏差値40~60となる。つまり、偏差値40~60の範囲に約68%のデータが含まれる、ということになる。

  • 偏差値40~60に含まれるデータの割合

同様に、「平均値」±「標準偏差×2」の範囲には約95%(厳密には約95.45%)のデータが含まれる、という法則もある。これを偏差値で考えると、偏差値30~70の範囲に約95%のデータが含まれる、となる。

  • 偏差値30~70に含まれるデータの割合

さらに、「平均値」±「標準偏差×3」の範囲には、約100%(厳密には約99.73%)のデータが含まれる、という法則もある。偏差値で考えると、偏差値20~80の範囲に約100%のデータが含まれる、となる。

  • 偏差値20~80に含まれるデータの割合

以上をまとめると、偏差値を以下のように理解することが可能となる。

◆偏差値40~60・・・・約68%のデータが含まれる(※1)
◆偏差値30~70・・・・約95%のデータが含まれる(※2)
◆偏差値20~80・・・・約100%のデータが含まれる(※3)

※厳密には、(※1)約68.27%、(※2)約95.45%、(※3)約99.73%。

偏差値70の意味は?

「偏差値40~60の範囲に約68.27%のデータが含まれる」ということは、「それ以外のデータは約31.73%ある」と考えられる。よって、偏差値60以上のデータは、その半分の約15.87%になる。

  • 偏差値60以上のデータの割合

つまり、偏差値60以上となるのは「100人中15.87人」といえる。もっと大雑把に考えると、偏差値60以上になるのは「6~7人に1人の割合」という計算になる。

同様に、偏差値70以上についても考えていこう。「偏差値30~70の範囲に約95.45%のデータが含まれる」ということは、「それ以外のデータは約4.55%ある」といえる。よって、偏差値70以上のデータは、その半分の約2.28%となる。

  • 偏差値70以上のデータの割合

約2.28%ということは、大雑把に見ると「約44人に1人」という計算になる。もっと具体的にいうと、学校のクラスに1人いるかどうか、というレベルである。これが「偏差値70以上」の感覚的な意味合いになる。

同様に計算していくと、偏差値80以上の割合は約0.135%になる。これは「約741人に1人」という突出した成績となる。

このように考えていくと、偏差値の意味を理解しやすくなると思われる。大雑把に考えて、偏差値には以下のような関係性があると覚えておくと、それぞれの偏差値が示すポジションを把握しやすくなるだろう。

◆偏差値60以上・・・・約15.87%(約6~7人に1人程度の割合)
◆偏差値70以上・・・・約2.28%(約44人に1人程度の割合)
◆偏差値80以上・・・・約0.135%(約741人に1人程度の割合)

東大の偏差値は低すぎないか?

続いては、東京大学(東大)の偏差値について考察してみよう。予備校などが公開している資料によると、東大の偏差値は67~70程度と示されている場合が多い。最も難関な理科三類(医学部)でも、その偏差値は72~73程度だ。

仮に偏差値70として考えると、「約44人に1人」という割合になる。優秀であることに変わりはないが、それほど突出した成績ではない、とも捉えられるだろう。「クラスに1人くらいは、いずれ東大に行く」といっても過言ではないレベルの話である。

しかし、実際には、そんなに東大生がゴロゴロいる訳ではない。進学校でもない限り、クラスに1人どころか、同学年に1人もいない、というケースも少なくないかもしれない。

このように現実から乖離した結果になってしまうのは、データの集計方法に原因があるといえる。予備校などが公開している偏差値は、模擬試験の結果に基づいて算出された偏差値であり、基本的には「模擬試験を受けた人」が分母となっている。

言い換えると、「その予備校の模擬試験を受けた人」、もっといえば「国公立大学向けの模擬試験を受けた人」の中で偏差値70くらいあれば東大に合格できそう・・・、という目安なのである。つまり、高校3年生(18歳)全員を対象にした偏差値ではない訳だ。

このように、一般公開されている統計データを見るときは、「その指標の分母は何か?」を見極めることも重要な要素となる。これは「偏差値」に限った話ではなく、さまざまな統計データに当てはまることだ。

東大に合格できる割合について、もっと現実的な数値を見たいのであれば、「偏差値」をよりも統計データを調べた方が確実だ。ここ数年のデータで見ると、日本の18歳人口は約120万人弱。一方、東大の合格者数は毎年3,000人くらいになる。これを単純に比較すると、「約400人に1人が東大に合格できる」という計算になる。もちろん、受験生が全員18歳とは限らないし、全員が東大を目指す訳でもないので、すごく大雑把な計算であることは否めない。

さらに言うと、今回紹介した偏差値の考え方は「一般的な統計学に基づいた場合」という仮定が加わることにも注意しなければならない。ここでいう一般的な統計学とは、「データのばらつき具合が正規分布になる場合」という意味である。これを理解するには、「正規分布とは何なのか?」を知っておく必要がある。そこで次回は「正規分布」について詳しく解説していこう。