ベイズの定理

提供: miniwiki
2018/8/19/ (日) 17:39時点におけるAdmin (トーク | 投稿記録)による版 (1版 をインポートしました)
(差分) ← 古い版 | 最新版 (差分) | 新しい版 → (差分)
移動先:案内検索

ベイズの定理(ベイズのていり、: Bayes' theorem)とは、条件付き確率に関して成り立つ定理で、

なおベイズ統計学においては基礎として利用され、いくつかの未観測要素を含む推論等に応用される。

ベイズの定理

一般に、確率および条件付き確率に関して、P(A) > 0 のとき次が成り立つ[1]

[math]P(B|A) = \frac{P(A|B)P(B)}{P(A)}[/math]

この定理はイギリスの牧師トーマス・ベイズc. 17011761[2])によって発見され、彼の死後にリチャード・プライスによって{{#invoke:Footnotes | harvard_citation }}で発表された。その後ピエール=シモン・ラプラスによって再発見・発展され、その存在が広く認識されるようになった。

確率および条件付き確率に関する定理であり、頻度主義統計学、ベイズ統計学のどちらでも成立する。

ベイズ推定

ベイズの定理と組み合わせて確率的推論を行う方法がラプラスによって始められ、現在言うところのベイズ統計学の端緒となった。事象の確率という考え方を採用する特徴がある。

現在は例えば、迷惑メールの発見・分類といった作業のコンピュータを用いた自動化(フィルタリング)等のふるい分けにも利用されている。

概要

事象Bのベイズ確率について、

  • P(B) = 事象 A が起きる前の、事象 B の確率(事前確率, prior probability)
  • P(B|A) = 事象 A が起きた後での、事象 B の確率(事後確率条件付き確率, posterior probability,conditional probability)

とする。 ベイズの定理を使えば、事後確率 P(B|A) は下記に従って計算される。

[math]P(B|A) = \frac{P(A|B)P(B)}{P(A)}[/math]

すなわち、事象Aに関するある結果(データ)が得られたとすると、それを反映し、尤度 P(A|B) の乗算によって、事象 B の確率は事前確率から事後確率へと更新される。なお事象 B の確率の観点からは、P(A) は規格化定数としての意味しかないため、しばしば省略される。つまり事後確率は事前確率と尤度の積に比例する:

[math]P(B|A) \propto P(A|B)P(B) = P(A, B).[/math]


ベイズ統計学(およびベイズ決定理論)は上記の手続きにその基礎をおき、名前の由来ともなっている。

批判

ベイズ統計学では、事象の確率という考え方を採用し、必ずしも頻度には基づかない確率を「確率」として見なす。

またベイズの定理を用い、事前確率及び尤度を仮定した下で事後確率を与える、という相対的なメカニズムを主張している。したがって事後確率の計算結果の信憑性や有用性は、事前分布と尤度の設定にかかっており、慎重を期すことが必要である。これはベイズ統計学が、不確実性を含む問題を人によって異なる確率を用いて定式化することを許容する主観確率 (subjective probability) という立場をとっていることによる。この立場はまだ解析対象となっていない新たな問題へのアプローチを可能にするという利点がある一方で、確率の決め方について客観性に欠けるという批判もある(客観確率)。

応用例

薬物検査

ファイル:Bayes theorem drugs example tree.svg
薬物検査の例を表す樹形図。記号U, Ū, +, − はそれぞれ使用者である、非使用者である、陽性である、陰性である事象を表す。

ある薬物の検査が感度99%かつ特異度99%だとしよう——つまり検査によって薬物の使用者のうち99%が陽性となり、非使用者のうち99%が陰性となると仮定する。さらに社会の0.5%が薬物使用者であるとする。無作為に選ばれた個人がこの検査で陽性だったとき、薬物使用者である確率はいくつか?ベイズの定理(と全確率の公式English版)から

[math] \begin{align} P(\text{U}|\text{+}) &= \frac{P(\text{+}|\text{U}) P(\text{U})}{P(+)} \\ &= \frac{P(\text{+}|\text{U}) P(\text{U})}{P(\text{+}|\text{U}) P(\text{U}) + P(\text{+}|\bar{\text{U}}) P(\bar{\text{U}})} \\ &= \frac{0.99 \times 0.005}{0.99 \times 0.005 + 0.01 \times 0.995} \\ &\approx 0.332 \end{align}[/math]

個人の検査が陽性であるときでさえ、非使用者である可能性が使用者である可能性よりも高い。(それでも検査結果が陽性であったという情報を反映して、事後確率 [math]P(\text{U}|\text{+}) \approx 0.332[/math] は事前確率 [math]P(\text{U}) = 0.005[/math] よりも大幅に上昇している。)つまり偽陽性の数は真陽性の数より多い。これは非使用者が使用者に比べて多いからである。たとえば、もし無作為に1000人が検査されるならば、995人の非使用者と5人の使用者がいると期待される。995人の非使用者からは0.01 × 995 ≈ 10 人の偽陽性が期待される。5人の使用者からは 0.99 × 5 ≈ 5人の真陽性が期待される。よって陽性であると期待される15人のうち、5人のみが薬物使用者である。

この例における特異度の重要性が次の計算からわかる。仮に感度が100%に上がり特異度が99%のままであれば陽性的中率は33.2%から33.4%に微増するに留まるが、感度が99%のままで特異度が99.5%に上がれば陽性的中率は49.9%に増加する。

脚注

参考文献

関連項目

外部リンク