多項分布

提供: miniwiki
移動先:案内検索
多項分布
確率質量関数
累積分布関数
母数 試行回数 [math]n \gt 0[/math] (整数)
各試行の確率 [math]p_1, \ldots, p_k[/math] ([math]\Sigma p_i = 1[/math])
[math]x_i \in \{0, \dots, n\}, \,\,\,\,i \in \{1,\dots,k\}[/math]
[math]\Sigma x_i = n\![/math]
確率質量関数 [math]\frac{n!}{x_1!\cdots x_k!} p_1^{x_1} \cdots p_k^{x_k}[/math]
期待値 [math]E\{X_i\} = np_i[/math]
分散 [math]\textstyle{\mathrm{Var}}(X_i) = n p_i (1-p_i)[/math]
[math]\textstyle {\mathrm{Cov}}(X_i,X_j) = - n p_i p_j~~(i\neq j)[/math]
モーメント母関数 [math]\biggl( \sum_{i=1}^k p_i e^{t_i} \biggr)^n[/math]
特性関数 [math] \left(\sum_{j=1}^k p_je^{it_j}\right)^n[/math] where [math]i^2= -1[/math]
テンプレートを表示

多項分布(たこうぶんぷ、: multinomial distribution)は、確率論において二項分布を一般化した確率分布である。

二項分布は、n 個の独立なベルヌーイ試行の「成功」の数の確率分布であり、各試行の「成功」確率は同じである。多項分布では、各試行の結果は固定の有限個(k個)の値をとり、それぞれの値をとる確率は p1,..., pk(すなわち、i = 1,..., k について pi ≥ 0 であり、[math]\sum_{i=1}^k p_i = 1[/math] が成り立つ)であり、n 回の独立した試行が行われる。確率変数 [math]X_i[/math]n回の試行で i という数が出る回数を示す。[math]X=(X_1,\dotsc,X_k)[/math]np をパラメータとする多項分布に従う。

確率質量関数

多項分布の確率質量関数は次の通りである。

[math]f(x_1,\dotsc,x_k; n,p_1,\dotsc,p_k) = \begin{cases} \dfrac{n!}{x_1!\dotsb x_k!} p_1^{x_1} \dotsb p_k^{x_k} & \text{when } \sum_{i=1}^k x_i=n \\[1ex] 0 & \text{otherwise.} \end{cases} [/math]

ここで、[math]x_1,\dotsc, x_k[/math] は負でない整数である。

属性

期待値は次の通り。

[math]\operatorname{E}(X_i) = n p_i.[/math]

共分散行列は次の通りである。対角線上のエントリは二項分布確率変数の分散であるから、次のようになる。

[math]\operatorname{var}(X_i)=np_i(1-p_i).[/math]

対角線以外のエントリは共分散であり、次のようになる。

[math]\operatorname{cov}(X_i,X_j)=-np_i p_j[/math]

ここで、ij は異なる値である。

共分散は全体として負となる。なぜなら、N が固定であるとき多項ベクトルで1つが増加すると他が減少するためである。

これは、k × k の非負値定符号行列であり、行列の階数k − 1 である。

対応する相関行列の対角線以外のエントリは以下のようになる。

[math]\rho(X_i,X_j) = -\sqrt{\frac{p_i p_j}{ (1-p_i)(1-p_j)}}.[/math]

この表現では標本サイズ n が出現しない点に注意されたい。

k個の要素それぞれは npii番目の要素に対応する確率)をパラメータとする二項分布となる。

多項分布のサポートは集合 [math]\{(n_1,\dotsc,n_k)\in \mathbb{N}^{k}| n_1+\dotsb+n_k=n\}[/math] である。その要素数は [math]{n+k-1 \choose k-1} = \left\langle \begin{matrix}n \\ k \end{matrix}\right\rangle[/math] である(重複組合せ)。

関連する分布

関連項目

外部リンク