ケンドールの順位相関係数

提供: miniwiki
移動先:案内検索

ケンドールの順位相関係数(けんどーるのじゅんいそうかんけいすう、ケンドールのタウ係数)は、順位Ranking)間の相関計測に用いられ、相関の強さを表す。言い換えれば、それは複数のデータ間(cross tabulations)の関連性(association)の強さを表す。1938年モーリス・ケンドールMaurice Kendall)によって開発された。

順位相関を計測する別の方法としてはスピアマンの順位相関係数があるが、両者はほぼ同じ傾向を示す[1]

定義

順位データ x = (x1, …, xn) と y = (y1, …, yn) とのケンドールの順位相関係数 τ は次で定義される[2]

[math] \tau = (K - L) \Big/ \binom{n}{2} [/math]

ここで K(または L )は n 項目から2項目を選んだときに順位関係が一致(または不一致)する組の数、つまり

[math]\begin{align} K &= \#\left\{\, \{i, j\} \in \binom{[n]}{2} \mid x_i \lessgtr x_j,\ y_i \lessgtr y_j \,\right\} \\ L &= \#\left\{\, \{i, j\} \in \binom{[n]}{2} \mid \neg(x_i \lessgtr x_j,\ y_i \lessgtr y_j) \,\right\} \end{align}[/math]

であり[3]、分母は二項係数である。

特性

ケンドールの順位相関係数 τ は以下の特性を持つ。

  • 順位が完全に一致している(すなわち L = 0)ならば τ = +1 である。
  • 順位が完全に一致していない(すなわち K = 0)ならば τ = −1 である。
  • 他のすべての場合には係数の値は−1と+1の間にあり、値の増加は相関の増大を意味する。順位が完全に独立しているなら、係数の値は0である。

脚注

  1. 脇本 1973, p. 24.
  2. 脇本 1973, p. 23.
  3. ここで#は濃度 を表す。また [math][n] := \{1, \dotsc, n\}[/math] であり、集合 X自然数 k に対して [math]\binom{X}{k}[/math]Xk 個の元からなる部分集合全体を表す。[math]\lessgtr[/math] は < または > を表し(複号同順)、[math]\neg[/math] は否定を表す。

参考文献

  • 脇本和昌 『身近なデータによる統計解析入門森北出版、1973年。ISBN 4627090307。
  • Abdi, H. (2007) Kendall rank correlation. In N.J. Salkind (Ed.): Encyclopedia of Measurement and Statistics. Thousand Oaks (CA): Sage. [1]
  • Kendall, M. (1948) Rank Correlation Methods, Charles Griffin & Company Limited
  • Kendall, M. (1938) "A New Measure of Rank Correlation", Biometrika, 30, 81-89.

関連項目

外部リンク

de:Rangkorrelationskoeffizient#Kendalls Tau