|
|
(同じ利用者による、間の4版が非表示) |
1行目: |
1行目: |
− | {{確率分布|
| + | '''カイ二乗分布'''(カイにじょうぶんぷ、カイじじょうぶんぷ)、または'''χ<sup>2</sup>分布''' |
− | name =カイ二乗分布|
| |
− | type =密度|
| |
− | pdf_image =[[Image:chi-square_distributionPDF.png|325px|Probability density plots of gamma distributions]]|
| |
− | cdf_image =[[Image:chi-square_distributionCDF.png|325px|Cumulative distribution plots of gamma distributions]]|
| |
− | parameters =''k'' ∈ {1, 2, ...} = '''Z'''<sub>+</sub>|
| |
− | support =''x'' ∈ [0, ∞)|
| |
− | pdf =<math> \frac{x^{k/2-1}e^{-x/2}}{\,2^{k/2} \Gamma(k/2)}</math>|
| |
− | cdf =<math>\frac{\gamma(k/2, x/2)}{\Gamma(k/2)}</math>|
| |
− | mean =''k''|
| |
− | median =<math>\simeq k-\frac{2}{3}+\frac{4}{27k}-\frac{8}{729k^2}</math>|
| |
− | mode =0 for ''k'' < 2<br />''k'' - 2 for ''k'' ≥ 2|
| |
− | variance =2''k''|
| |
− | skewness =<math>\frac{2\sqrt{2}}{\sqrt{k}}</math>|
| |
− | kurtosis =12/''k''|
| |
− | entropy =''k''/2 + ln 2 + ln Γ(k/2)<br/>+ (1 - ''k''/2)ψ(k/2) |
| |
− | mgf =<math>\frac{1}{(1 - 2t)^{k/2}}\text{ for }t < 1/2</math>|
| |
− | char =<math>\frac{1}{(1 - 2i t)^{k/2}}</math>|
| |
− | }}
| |
| | | |
− | '''カイ二乗分布'''(カイにじょうぶんぷ、カイじじょうぶんぷ)、または'''χ<sup>2</sup>分布'''は[[確率分布]]の一種で、[[推計統計学]]で最も広く利用されるものである。[[フリードリヒ・ロベルト・ヘルメルト|ヘルメルト]]により発見され<ref>Helmert, F. R. (1875): ''Ueber die Berechnung des wahrscheinlichen Fehlers aus einer endlichen Anzahl wahrer Beobachtungsfehler'', Zeitschrift für Mathematik und Physik, '''20''', 300-303[http://www.archive.org/details/zeitschriftfrma29runggoog]</ref>、[[カール・ピアソン|ピアソン]]により命名された<ref>Pearson, K. (1900): ''On the Criterion that a Given System of Deviations from the Probable in the Case of a Correlated System of Variables is such that it Can Reasonably Be Supposed to have Arisen from Random Sampling'', Philosophical Magazine 5, '''50''', 157-175</ref>。
| + | <p class="meaning">正規分布から <i>n</i> 個の標本 <i>x</i><sub>1</sub>, …, <i>x</i><sub><i>n</i></sub> を抜き出したとき, 統計量</p><br> |
− | | + | [[ファイル:Chí–squàre distribùtion.gif|フレームなし|中央]] |
− | [[独立 (確率論)|独立]]に標準[[正規分布]]に従う ''k'' 個の[[確率変数]] ''X<sub>1</sub>, ..., X<sub>k</sub>'' をとる。
| + | <p class="meaning">の分布. ここで, <i>[[ファイル:700719.gif|フレームなし]]</i> は平均を表わす. この <i>S</i><sup>2</sup> のことを chi-square statistics という.</p> |
− | このとき、[[統計量]]
| |
− | {{Indent|<math>Z = \sum_{i = 1}^k X_i^2</math>}}
| |
− | の従う分布のことを自由度 ''k'' のカイ二乗分布と呼ぶ。この分布は自由度 ''k'' に応じて右図のような形をとる。
| |
− | 図を見ればわかるように、どの自由度 ''k'' でも、ある一定以上 ''Z'' が大きいならば、 ''Z'' が大きいほどその確率が低くなることがわかる。
| |
− | このことは、大まかに言えば、「正規分布でランダムで値をとったのだから、その値を用いて高々二乗和をとった程度の数値 ''Z'' がとてつもなく大きくなる確率は少ないはずだ」と解釈できる。統計的仮説検定にカイ二乗分布が用いられるのはこの性質のためである。例えば、「データが意味のないノイズ要素である可能性はたったの5%以下だから、このデータには意味があるはずだ」という解釈が行われる。
| |
− | | |
− | 普通はこれを
| |
− | {{Indent|<math>Z\sim\chi^2_k</math>}}
| |
− | と書く。カイ二乗分布は ''k'' という1個の[[母数]]をもつ。これは ''X<sub>i</sub>'' の[[自由度]]に等しい正の[[整数]]である(場合によっては非整数自由度のカイ二乗分布も用いられる)。カイ二乗分布は[[ガンマ分布]]の特殊な場合に当たる。
| |
− | | |
− | カイ二乗分布は[[カイ二乗検定]]と総称される多くの検定法のほか、[[フリードマン検定]]などにも利用される。
| |
− | | |
− | ==性質==
| |
− | カイ二乗分布の確率密度関数は
| |
− | | |
− | ''x'' ≥ 0 に対し
| |
− | {{Indent|<math>f(x;k)=\frac{1}{2^{k/2}\Gamma(k/2)} x^{k/2 - 1} e^{-x/2}</math>、}}
| |
− | 又 ''x'' ≤ 0 に対し ''f<sub>k</sub>''(''x'') = 0 という形をとる。ここで Γ は[[ガンマ関数]]である。
| |
− | | |
− | 累積分布関数は
| |
− | {{Indent|<math>F(x;k)=\frac{\gamma(k/2,x/2)}{\Gamma(k/2)}\ </math>}}
| |
− | (但し γ(''k'', ''z'') は[[不完全ガンマ関数]])である。
| |
− | | |
− | <math>Y = \frac{X_1 / \nu_1}{X_2 / \nu_2}</math> (但し <math>X_1 \sim \chi_{\nu_1}^2</math> と <math>X_2 \sim \chi_{\nu_2}^2</math> はカイ二乗分布に従う独立な確率変数)とすると、<math>Y \sim \mathrm{F}(\nu_1, \nu_2)</math>、つまり自由度で割って比をとると[[F分布]]に従う。 | |
− | | |
− | <math>X \sim \chi_2^2</math> (自由度2)ならば、''X'' は期待値2の[[指数分布]]に従う。
| |
− | | |
− | 自由度 ''k'' のカイ二乗分布に従う確率変数の[[期待値]]は ''k'' で、[[分散 (確率論)|分散]]は 2''k'' である。中央値は近似的に
| |
− | {{Indent|<math>k-\frac{2}{3}+\frac{4}{27k}-\frac{8}{729k^2}</math>}}
| |
− | となる。
| |
− | | |
− | カイ二乗分布は[[再生性]]を持つ。すなわち、<math>X \sim \chi_m^2, \ Y \sim \chi_n^2</math>ならば、<math>X + Y \sim \chi_{m+n}^2</math>となる。
| |
− | | |
− | ==正規分布による近似==
| |
− | <math>X\sim\chi^2_k</math> として、''k'' が無限大に近づくと ''X'' の分布は正規分布に近づくが、近づき方はゆっくりしている
| |
− | ([[歪度]]<math>\sqrt{8/k}</math>、[[尖度]]12/''k'')ため、''X'' 自体より速く正規分布に近づく次の2つの方法が普通用いられる。
| |
− | | |
− | *<math>\sqrt{2X}</math> は近似的に平均 <math>\sqrt{2k-1}</math>、分散1の正規分布に従う([[R.A.フィッシャー]])。
| |
− | *<math>\sqrt[3]{X/k}</math> は近似的に平均 1-2/9''k''、分散 2/9''k'' の正規分布に従う(ウィルソンとヒルファティ、[[1931年]])。
| |
| | | |
| == 脚注 == | | == 脚注 == |
| <references /> | | <references /> |
− |
| |
− | ==関連項目==
| |
− | *[[確率分布]]
| |
− | *[[カイ二乗検定]]
| |
− | *[[非心カイ二乗分布]]
| |
| | | |
| {{確率分布一覧|連続確率分布}} | | {{確率分布一覧|連続確率分布}} |
− | | + | {{テンプレート:20180815sk}} |
| {{DEFAULTSORT:かいししようふんふ}} | | {{DEFAULTSORT:かいししようふんふ}} |
| [[Category:確率分布]] | | [[Category:確率分布]] |
| [[Category:数学に関する記事]] | | [[Category:数学に関する記事]] |