偏差値

提供: miniwiki
移動先:案内検索
ファイル:The Normal Distribution.svg
正規分布曲線と偏差値の関係。T scoresが偏差値を示す。

偏差値(へんさち、: standard score)とは、ある数値がサンプルの中でどれくらいの位置にいるかを表した無次元数平均値が50、標準偏差が10となるように標本変数を規格化したものである。

概要

偏差値の利用価値が高いのは、サンプルの数値の分布が正規分布に近い状態の時である。分布のピークが2箇所ある場合など、正規分布と大きく異なる場合には適切な指標となりえない場合がある。

標本が正規分布する場合は、40から60の間に約68.3%、30から70の間に約95.4%、20から80の間に約99.73%、10から90の間に約99.9937%、0から100の間に約99.999953%が含まれる事が知られている[1]。つまり、

  • 偏差値60以上(あるいは40以下)は、全体の15.866%。
  • 偏差値70以上(あるいは30以下)は、全体の2.275%。
  • 偏差値80以上(あるいは20以下)は、全体の0.13499%。
  • 偏差値90以上(あるいは10以下)は、全体の0.00315%。
  • 偏差値100以上(あるいは0以下)は、全体の0.00002%。

例えば、全受験生が100万人いた学力試験で偏差値を求めると、偏差値80以上となる者は、ほぼ1350人となる。(日本の実際の統計では、10代における同じ年齢の人口はおおよそ110〜120万人程度。40代は180〜200万人程度)

平均値から大きく離れた場合は0から100の間に収まらないが、その割合は非常に低く、約0.000047%、つまり約200万分の1しかない。偏差値の上限値、下限値は元となる標本の分布によって決まるものであり、いかなる実数をもとりうる。

数式による解説

偏差値Ti は次の式で求まる。

[math]T_i=\frac{10(x_i-\mu_x)}{\sigma_x}+50[/math]

ただし、

[math]\begin{align} &\mu_x=\frac{1}{N}\sum_{i=1}^Nx_i\\ &\sigma_x=\sqrt{\frac{1}{N}{\sum_{i=1}^N(x_i-\mu_x)^2}}=\sqrt{\frac{1}{N}{\sum_{i=1}^Nx_i^2-\mu_x^2}}\\ \end{align}[/math]
N :サンプルの大きさ xi :個々の値(標本値) μx算術平均 σx標準偏差

である。なお分母σx標準偏差であり、分子xi - μx偏差である。偏差が 0 であるとき(ある標本値xi が平均値μx に等しいとき)は偏差値は 50 となる。また、全ての標本値xi が同じ値であるときは標準偏差σx = 0 となってしまうためこの式では偏差値は定義できないが、その場合は便宜上全ての標本値の偏差値を 50 と考えることがある。

応用例

脚注

関連項目