« 3 積の法則 | トップページ | 5 期待値 »

2009年6月13日 (土)

4 情報と確率(ベイズの定理)

今回は、情報によって確率がどのように変わるかを説明しようと思う。

例として、次の問題について考えてみる。
「ある国では,男性が1000人に1人の確率である病気に感染している。ある検査薬を使えば、感染していれば0.98の確率で陽性反応が出て、感染していなければ0.01の確率で陽性反応が出る。このとき、1人の男性に陽性反応が出たとして、この男性が感染している確率はどれくらいか。」
つまり、感染している確率は本来1/1000であるが、「検査薬で陽性反応が出た。」という情報によって、その確率はどのように変わるかという話である。答えが1/1000より大きくなることが予想されるが,具体的にどれくらい大きくなるのだろうか。

ここで、この国の10万人の男子が検査を受けると仮定しよう。
このとき,感染していてかつ陽性反応が出る男子は、積の法則を使って、10万×0.001×0.98=98より、98人と予想できる。また、感染していなくてかつ陽性反応が出る男子は、同じ様に積の法則を使って、10万×0.999×0.01=999より、999人と予想できる。
よって,「感染していてかつ陽性反応が出た男子」の人数の「陽性反応が出た男子全員」の人数に対する割合は、98÷(98+999)=0.0893…≒0.089となる。求める確率はこれと等しく,約0.089である。

以上の話を一般化したのが、次のベイズの定理と呼ばれる定理である。


ベイズの定理

k個のことがらE1、E2、……、Ekがあって、このうちのどの2つも同時に起こることはなく、k個のうちのどれか1つが必ず起こるとする。 このとき、ことがらEに対して,

(Eが起こったときEiが起こる確率)=
(Eiが起こる確率)×(Eiが起こったときEが起こる確率)/∑j{(Ejが起こる確率)×(Ejが起こったときEが起こる確率)}
〔ここで、分母の∑jはj=1からj=kまで{ }の中を合計することを表している。〕

が成り立つ。


分かりにくいかもしれないので,この定理に先ほどの感染症の例をあてはめてみると,

2個のことがら(感染している)、(感染していない)があり,この2つは同時に起こることはなく,2つのうちどちらか1つは必ず起こる。
このとき,ことがら(陽性反応が出る)に対して,
陽性反応が出たとき感染している確率は,
分子が,

(感染している確率)×(感染していたとき陽性反応が出る確率)

で,分母が,

(感染している確率)×(感染していたとき陽性反応が出る確率)+(感染していない確率)×(感染していなかったとき陽性反応が出る確率)

の分数になる。
つまり,0.001×0.98/(0.001×0.98+0.999×0.01)=0.00098/0.01097≒0.089

となる。

この公式の意味は次のようになる。
分子の(Eiが起こる確率)×(Eiが起こったときEが起こる確率)は,積の法則そのままの形で,EiとEが両方起こる確率を表している。
また,分母の∑j{(Ejが起こる確率)×(Ejが起こったときEが起こる確率)}は,Eが起こる確率を表している。分かりにくいかもしれないが,

(感染している確率)×(感染していたとき陽性反応が出る確率)+(感染していない確率)×(感染していなかったとき陽性反応が出る確率)

と具体的なことがらに置き換えてみれば,これが陽性反応が出る確率を表しているのが分かると思う。
つまり,この式は,(EiとEが両方起こる確率)/ (Eが起こる確率)を表していて,これは,Eが起こった回数1回あたりさらにEiが何回起こるかを表している。これは,Eが起こったときのEiが起こる確率に他ならない。
または単純に,

積の法則:(EとEiが両方起こる確率)=(Eが起こる確率)×(Eが起こったときEiが起こる確率)

を変形しても,

(Eが起こったときEiが起こる確率)=(EとEiが両方起こる確率)/(Eが起こる確率)

を導くことができる。

ここで例題を出してみる。
(例題)3つのコインA,B,Cがある。Aは表裏とも白である。Bは表が白で裏が黒である。Cは表裏とも黒である。これらのコインからランダムに1つ選んで投げたところ,黒の面が上になった。このとき,投げたコインがBである確率はどれくらいか。
(解答)(1/3×1)÷(1/3×0+1/3×1+1/3×1/2)=1/3÷1/2=2/3

今度は麻雀の話を例にとろう。
他家が染め手っぽい捨て牌のとき本当に染め手である確率はどれくらいだろうか。ただし,他家が染め手を狙う確率を0.15,染め手のとき捨て牌が染め手っぽくなる確率を0.8,染め手でないとき捨て牌が染め手っぽくなる確率を0.1とする。
答えは,
0.15×0.8/(0.15×0.8+0.9×0.1)=0.12/(0.12+0.09)=0.12/0.21=0.571…≒0.57
より,約57%となる。これは,染め手の確率が捨て牌の情報によって15%から57%に上がったということである。
(ここで使った0.15や0.8という数字は仮のものであって厳密なものではない。よって,57%という結果も信用できるものではないが,ここでは,情報によって確率が変化するという雰囲気をつかんでほしい。)

※ ベイズの定理については,「モンティ・ホール問題」という有名な問題がある。なかなか面白い問題なので,興味がある人は検索してほしい。

« 3 積の法則 | トップページ | 5 期待値 »

確率論入門」カテゴリの記事

コメント

コメントを書く

コメントは記事投稿者が公開するまで表示されません。

(ウェブ上には掲載しません)

トラックバック

この記事のトラックバックURL:
http://app.f.cocolog-nifty.com/t/trackback/1224976/30078537

この記事へのトラックバック一覧です: 4 情報と確率(ベイズの定理):

« 3 積の法則 | トップページ | 5 期待値 »

最近のトラックバック

最近のコメント

2013年12月
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31        

リンク集

  • 四〇一号
    私のページです。
  • 現代麻雀技術論
    麻雀の戦術論ページです。同類のページはたくさんありますが、ここが№1だと思います。
無料ブログはココログ