actions

t分布


スチューデントのt分布
確率密度関数
325px
累積分布関数
325px
母数 [math]\nu \gt 0 [/math] 自由度 (実数)
[math]x \in (-\infty; +\infty)\![/math]
テンプレート:確率分布/リンク 密度 [math]\frac{\Gamma(\frac{\nu+1}{2})} {\sqrt{\nu\pi}\,\Gamma(\frac{\nu}{2})} \left(1+\frac{x^2}{\nu} \right)^{-(\frac{\nu+1}{2})}\![/math]
累積分布関数 [math]\begin{matrix} \frac{1}{2} + x \Gamma \left( \frac{\nu+1}{2} \right) \cdot\\[0.5em] \frac{\,_2F_1 \left( \frac{1}{2},\frac{\nu+1}{2};\frac{3}{2}; -\frac{x^2}{\nu} \right)} {\sqrt{\pi\nu}\,\Gamma (\frac{\nu}{2})} \end{matrix}[/math]
ここで、 2F1超幾何関数
期待値 [math]0[/math] (ただし、 [math]\nu\gt 1[/math])
中央値 [math]0[/math]
最頻値 [math]0[/math]
分散

[math]\nu\gt 2\![/math] の場合、[math]\frac{\nu}{\nu-2}[/math]

[math]1\lt \nu\le2\![/math] の場合、 [math]\infty[/math] (無限大)
歪度 [math]0[/math] (ただし、[math]\nu\gt 3[/math] の場合)
尖度 [math]\frac{6}{\nu-4}[/math] (ただし、 [math]\nu\gt 4\![/math] の場合)
エントロピー

[math]\begin{matrix} \frac{\nu+1}{2}\left[ \psi(\frac{1+\nu}{2}) - \psi(\frac{\nu}{2}) \right] \\[0.5em] + \log{\left[\sqrt{\nu}B(\frac{\nu}{2},\frac{1}{2})\right]} \end{matrix}[/math]

モーメント母関数 (Not defined)
特性関数

[math]\frac{K_{\nu/2}(\sqrt{\nu}|t|)(\sqrt{\nu}|t|)^{\nu/2}}{\Gamma(\nu/2)2^{\nu/2-1}}[/math]

テンプレートを表示


統計学および確率論において、t分布(ティーぶんぷ、またはスチューデントのt分布: Student's t-distribution)は、連続確率分布の一つであり、正規分布する母集団の平均と分散が未知で標本サイズが小さい場合に平均を推定する問題に利用される。また、 2つの平均値の差の統計的有意性を検討するt検定で利用される。t分布は、一般化双曲型分布の特別なケースである。

t分布は1908年にウィリアム・シーリー・ゴセットにより発表された。 当時の彼はビール醸造会社であるギネスビールに雇用されており、ギネスビールでは秘密保持のため従業員による科学論文の公表を禁止していたので、彼はこの問題を回避するため「スチューデント」というペンネームを使用して論文を発表した[2]

その後、ロナルド・フィッシャーがこの論文の重要性を見抜きスチューデントのt分布と呼んだため、このように呼ばれるようになった。

導出

X1, ..., Xn が、平均 μ分散 σ2正規分布に従う独立な確率変数であるとする。また標本平均を

[math]\overline{X}_n = \frac{X_1 + \cdots + X_n}{n}[/math]

とし、不偏分散を

[math]U_n^2 = \frac{1}{n-1}\sum_{i=1}^n ( X_i-\overline{X}_n )^2[/math]

とする。ここで次の変数

[math]T = \frac{\overline{X}_n-\mu}{U_n/\sqrt{n}}[/math]

を考えると、これは

[math]f(t) = \frac{\Gamma((\nu+1)/2)}{\sqrt{\nu\pi\,}\,\Gamma(\nu/2)} (1+t^2/\nu)^{-(\nu+1)/2}[/math]

(ただし ν = n − 1、Γ はガンマ関数)という確率密度関数に従うことが、ゴセットによって示された。ここでTの従う分布をt 分布(またはスチューデント分布)と呼ぶ。ν自由度と呼ばれる。この分布はνによるが、もとの正規分布の母数であるμσにはよらない。この性質から、標本値から母集団の平均値を統計的に推定する区間推定や、母集団の平均値の仮説検定に利用できる。

分布関数

累積分布関数は、正則不完全ベータ関数を用いて以下のように表される。

[math]\int_{-\infty}^t f(u)\,du = I_x\left(\frac{\nu}{2},\frac{\nu}{2}\right) = \frac{B\left(x;\frac{\nu}{2},\frac{\nu}{2}\right)}{B\left(\frac{\nu}{2},\frac{\nu}{2}\right)} [/math]

ただし、

[math]x = \frac{t+\sqrt{t^2+\nu}}{2\sqrt{t^2+\nu}}.[/math]

モーメント

t分布のモーメントは以下の式で表される。

  • [math]k\,[/math] が奇数の場合
[math]E(T^k)=\begin{cases} 0\; , &\quad 0\lt k\lt \nu\\ \mbox{NaN}\; , &\quad 0\lt \nu\leq k\\ \end{cases} [/math]
  • [math]k\,[/math] が偶数の場合
[math]E(T^k)=\begin{cases} \frac{\Gamma(\frac{k+1}{2})\Gamma(\frac{\nu-k}{2})\nu^{k/2}}{\sqrt{\pi}\Gamma(\frac{\nu}{2})}\; , &\quad 0\lt k\lt \nu\\ \infty\; , &\quad 0\lt \nu\leq k\\ \end{cases} [/math]

特別なケース

νの値により、簡単な形となる。

ν = 1 の場合

コーシー分布と一致する。

分布関数:

[math] F(x) = \frac{1}{2} + \frac{1}{\pi}\arctan(x).[/math]

確率密度関数:

[math] f(x) = \frac{1}{{\pi}(1+x^2)}.[/math]

ν = 2 の場合

分布関数:

[math] F(x) = \frac{1}{2}\left[1+\frac{x}{\sqrt{2+x^2}}\right].[/math]

確率密度関数:

[math] f(x) = \frac{1}{\left(2+x^2\right)^{3/2}}.[/math]

ν → ∞ の場合

自由度νが∞(無限大)に近づくにつれ、t分布は正規分布に近づく。

脚注

  1. Hurst, Simon, The Characteristic Function of the Student-t Distribution, Financial Mathematics Research Report No. FMRR006-95, Statistics Research Report No. SRR044-95
  2. Walpole, Ronald; Myers, Raymond; Ye, Keying. Probability and Statistics for Engineers and Scientists. Pearson Education, 2002, 7th edition, pg. 237

関連項目