ベイスの定理と応用
– 確率論 I– 参考資料
2009/01/08,
西岡1
ベイズの公式の応用例近年,条件付き確率 と ベイスの公式
(1) P[A/B]≡ P[A∩B]
P[B] (ベイズの公式)
が マーケッティング理論や人工知能などに適用され,確率論を社会現象へ応用する強力なツールとして,注 目を集めている. これは
‘条件付き確率P[A/H]’ と‘H の起こる確率[P[H]’
がデータとして得られる場合, ‘未知の確率P[A∩H]’ が ベイズの公式(1)から (2) P[A∩H] =P[H]·P[A/H]
として計算出来るからである.
1.1 ベイズの定理
定理1 (ベイズの定理). P[H]̸= 0, P[A]̸= 0 である事象H, Aにたいし,次の等式が成立する: (3) P[H/A] = P[H]·P[A/H]
P[H]·P[A/H] +P[Hc]·P[A/Hc]. ただし,P[Hc] = 0の場合,P[Hc]·P[A/Hc] = 0と約束する. ⋄
[証明] (2)という形で ベイズの公式を使う. P[A∩H] +P[A∩Hc] =P[A] になることに注意して,
(3)の右辺= P[A∩H]
P[A∩H] +P[A∩Hc]
= P[A∩H]
P[A] = (3)の左辺. 2 系2 (ベイズの定理2). 事象H1,· · · , Hmを
H1∪H2∪ · · · ∪Hm= Ω; i̸=j なら Hi∩Hj =∅ すべてのk= 1,· · · , mにたいし P[Hk]̸= 0,
とする. このときP[A]̸= 0である 事象Aにたいし,以下の等式が成立する: (4) P[H1/A] = P[H1]·P[A/H1]
P[H1]·P[A/H1] +· · ·+P[Hm]·P[A/Hm]. ⋄
• 下は ‘得られたデータ(赤玉が出た)’から ‘途中経過(どちらの箱から玉を出したか)’を推測する例であ る*1.
*1朝日新聞, 2007年11月24日
問題3. 箱aには 青玉10個 と 赤玉30個,箱b には 青玉20個 と 赤玉20個が入っている.
ランダムに箱を選んで1個の玉を取り出したら 赤 であった. この赤玉が 箱aから取り出された確率 及 び 箱b から取り出された確率を求めよ.
[解答] 事象A, B, W を次の通りとする.
A=箱aから玉を取り出す, B =箱bから玉を取り出す, D=箱から取り出した玉が赤.
計算すべき確率はP[A/D], P[B/D]である. ベイズの公式(1)より (5) P[A/D] =P[A∩D]
P[D] , P[B/D] = P[B∩D]
P[D]
となる. 分母, 分子の各項を計算しよう. a, bどちらの箱も選ぶ確率は1/2 だから, ベイズの公式を(2)の ように変形すると
P[A∩D] =P[A]·P[D/A] = 1 2· 30
40= 15 40, P[B∩D] =P[B]·P[D/B] = 1
2 ·20 40 = 10
40. ここで赤玉は必ず 箱aもしくは 箱b から取り出すので, D=(
A∩D)
∪( B∩D)
. しかも(
A∩D)
∩( B∩D)
=∅だから,確率の性質より
P[D] =P[(A∩D)∪(B∩D)] =P[A∩D] +P[B∩D] = 15 40+10
40 =25 40. 以上の計算結果を(5)に代入して,
P[A/D] = 15/40 25/40 = 3
5 = 0.6, P[B/D] = 10/40 25/40 = 2
5 = 0.4. 2
1.2 ベイズの定理の応用例
条件付き確率とベイズの定理は,数学クイズやパラドクスにも使われている.
問題4(王に姉妹はいるか?). 先王には子供が二人おり,その内の一人が新たに王として即位した. 新王に姉 妹がいる確率を求めよ. ただし,男女の比率は1 : 1とする. ⋄
[解答] B ≡子供が男, G≡子供が女 という記号を使う. 左の記号が年長者を表すとすると, 起こりえ る事象は
w1≡(B, B), w2≡(B, G), w3≡(G, B), w4≡(G, G) であるから,確率空間は
(6) Ω≡{
w1, w2, w3, w4}
, P[wk] = 1
4, k= 1,· · · ,4 となる. U ≡子供の一人が男=w1∪w2∪w3 ,
V ≡子供の一人が女=w2∪w3∪w4
という記号を使う. (6)を考慮して
P[王に姉妹がいる] =P[V /U] =P[V ∩U] P[U]
= P[w2∪w3]
P[w2∪w3∪w4] = 2/4 3/4 = 2
3. 2
問題 5(囚人のパラドクス). 3人の囚人a, b, cがおり, ‘そのうちの一人が死刑,残りの二人は釈放’との決 定がなされた. 囚人aが看守に「b, cのどちらが釈放か教えてくれ」と頼んだ. ところが看守は
今のままならばaが死刑になる確率は1/3 である. (7a)
b, cのどちらが釈放か教えるとaが死刑になる確率 (7b)
は1/2になる.
の理由により,「気の毒だから教えない」と答えた. いま 死刑になる確率はa, b, cそれぞれ 1/3, (8a)
死刑がaの場合,看守は1/2の確率で「bは保釈」という, (8b)
死刑がc の場合,看守は必ず「b は保釈」という, (8c)
看守は嘘をつかない, (8d)
としたとき,看守の主張する確率計算(7b)は正しいのか? [解答] Step 1. 事象A,· · · , Dを以下の通り定める:
A≡ {aが死刑}, B≡ {b が死刑}, C≡ {c が死刑}, D≡ {看守が「b は保釈」と言う}
看守が主張した(7b)は
P[A/D] = 1 2 と同値である. 果たしてこれが正しいか確かめよう.
Step 2. まず 確率データを整理する. ‘一人が死刑,残りの二人は釈放’ だから, Ωを全事象とすると
A∪B∪C= Ω.
また(8a), (8b), (8c)より
P[A] =P[B] =P[C] = 1
3, P[D/A] = 1
2, P[D/C] = 1.
A B C
色が D
Step 3. 以上と ベイスの公式(1)より
P[D∩A] =P[D/A]·P[A] = 1 2· 1
3 = 1 6, P[D∩C] =P[D/C]·P[C] = 1·1
3 =1 3. (ここで,安易に次の計算をしてはいけない: P[D∩A] =P[D]·P[A] = 1
2·1 3 = 1/6.
「最初の等号 つまりP[D] = 1/2」は証明がいる.) A∪B∪C= Ωだから, (8d)も考えると
P[D] =P[D∩A] +P[D∩B] +P[D∩C] = 1
6 + 0 +1 3 =1
2
つまり P[A/D] = P[D∩A]
P[D] = 1/6 1/2 = 1
3 となり,看守の主張 (7b)は間違っている. 2
• 電子メールの普及に伴い,多数送りつけられる迷惑メールの防止策が必要となった. 防止には 迷惑メール( Spam と呼ぶ)と通常のメール(Hamと呼ぶ)を分別する
フィルターを設置しなければならない. このフィルターの作動原理には‘ベイスの定理’が使われることが多 く,それらのフィルターは‘ベイジアン・フィルター’と呼ばれている.
問題6(ベイジアン・フィルター). 迷惑メールの防止フィルターを,件名に ‘援助交際’という言葉が含まれ ているか否かで設定する. 事象H, Aを
H ={迷惑メールである},
A={文中に ‘援助交際’の言葉が含まれる}, とおく. 過去の統計データによれば
(9) P[A/H] = 0.3, P[A/Hc] = 0.01, P[Hc] P[H] = 2 であった. この迷惑メールの判定フィルターの有効確率 P[H/A] を求めよ. ⋄ [解答] ベイズの定理 から
P[H/A] = P[H]·P[A/H]
P[H]·P[A/H] +P[Hc]·P[A/Hc]
= P[H/A]
P[H/A] +(
P[Hc]/P[H])
·P[A/Hc]. この右辺に統計データを代入して
P[H/A] = 0.3
0.3 + 2×0.01 ≅0.94.
なお,統計データ (9) を時間と共に更新することで,時間経過で進化する ‘学習型のベイジアン・フィル ター’が得られる. 2
• ベイズの定理は マーケッティングでのデータ解析にも利用されている.
問題 7. A, B, C 三つの店舗ではビールとワインを販売している. それぞれの店で, 「利用客100人辺りの
販売実績」を調べたところ,次の通りだった:
表1 店舗 A B C
ビールを購入 40人 30人 20人 ワインを購入 20人 30人 40人 どちらも買わない 60人 50人 60人
またA, B, C三店舗間での利用客の人数比率は
店舗A = 50 %, 店舗B = 30 %, 店舗C = 20 % である.
上記のデータが常に成立するとして,以下の問に答えよ.
(i) 表1 で,ビールとワインの両方を購入した客の数をA, B, Cの各店舗毎に計算せよ.
(ii) A, B, Cいずれか一つの店舗を利用した客xがビールを購入した. xが 店舗Aを利用した確率 qを 計算せよ.
(iii) A, B, Cいずれか一つの店舗を利用した客 y がビールとワインの両方を購入した. y が 店舗Cを利
用した確率rを計算せよ.
[解答] (i) ビールとワインの両方を購入した客の人数:
A 店: (40 + 20)−(100−60) = 20, B店: (30 + 30)−(100−50) = 10, C店: (20 + 40)−(100−60) = 20 (ii) 事象H1,H2 を
H1 =ビールを購入する, H2 =ワインを購入する とおき,UA, UB, UC をそれぞれ A店, B店, C店を利用する事象とする.
q=P[UA/H1] =P[UA∩H1]
P[H1] = P[H1∩UA]
P[H1∩UA] +P[H1∩UB] +P[H1∩UC]
= P[A]·P[H1/UA]
P[A]·P[H1/UA] +P[B]·P[H1/UB] +P[C]·P[H1/UC]
= 0.5·0.4
0.5·0.4 + 0.3·0.3 + 0.2·0.2 = 0.2 0.33 = 20
33. (iii) 上と同じ記号を使う.
r=P[UC/H1∩H2] = P[UC∩H1∩H2] P[H1∩H2]
= P[H1∩H2∩UC]
P[H1∩H2∩UA] +P[H1∩H2∩UB] +P[H1∩H2∩UC]
= P[C]·P[H1∩H2/UC]
P[A]·P[H1∩H2/UA] +P[B]·P[H1∩H2/UB] +P[C]·P[H1∩H2/UC]
= 0.2·0.2
0.5·0.2 + 0.3·0.1 + 0.2·0.2 =0.04 0.17 = 4
17. 2
2
新聞記事–
朝日新聞, 2007
年11
月24
日300 年後に脚光「ベイズの定理」
迷惑メール対策や人工知能・新薬開発
· · ·
迷惑メール判別フィルター、マーケティング蓮翰、気象予測、人工知能、新薬開発……。
最近、こうした分野で必ず聞く名前がある。「ベイズ」。18世紀の数学者トーマス・ベイズ のことだ。彼が提唱した確率論「ベイズの定理」は約300年後、応用され、情報処理の土 台になる理論として注目されている。 (中島鉄郎)
蘇る 18 世紀の確率論
迷惑メールの判別に「ベイズの定理」を応用した振り分け技術が役に立つ–。02年に米国で専門家が論考 を出して以来、ベイズの名前は一般にも知られるようになった。
日本で、この定理に基づく判別フィルターを最初に導入したのはニフティだ。担当した同社のチーフエン ジニア工藤隆久さん(37)は03年秋、役員会でのプレゼンテーションの反応を覚えている。
「この迷惑メール対策フィルターは、もともとは18世紀の数学者だったベイズという人が発見した確 率の理論ですと説明したら、役員たちから『ぼおー』という感嘆の声が上がったんです」
トーマス・ベイズは1702年ごろにロンドンで生まれた。詳細な履歴は不明だが、長老派教会の牧師で、
アマチュアの数学者。死後に出された確率論の論文をもとに、後の学者がベイズの定理を完成させ、それを もとにべイズ統計学が生まれた。
統計学の歴史で、ベイズは長く異端とされてきた。ベイズ統計に詳しい上智大の松原望教授(65)は言う。
「例えば、土星の質量. 普通の統計学では、 それはデータがないから扱えない。だが、ベイズの統計 学では、さまざまな経験や見通しを交え、 確率分布で『このくらいから、このくらいの重さ』とだい たいのことを言う.
現実には一通りしかないものに確率分布があるのはおかしい、科学的態度ではないと批判されて きた」
出生予測など、未確定な情報が多い現実社会の問題予測にこの考え方は役立ってきた。経験や勘をもと に、とりあえず「援助交際」という文字列があれば85%迷惑メール、と考えてみる方法だ。
現在、ベイズの定理の応用が最も注目されているのが情報工学の最先端分野だ。統計数理研究所の樋口知 之・副所長(46)によると、とりわけITメガ企業がベイズ研究に力を入れているという。
「アメリカでは、学者の通常のベイズ研究会にマイクロソフトなど企業の担当者が参加し、優秀な研 究者たちを高給でヘッドハントしていくことも珍しくない」
この数年、IT企業などがベイズ理論に注目してきた背景には二つの変化がある。
一つはコンピューターのCPU(演算処理装置)の能力が飛躍的に向上したこと。もう一つはネット上な どに膨大なデータが蓄積されたこと。大量のデータを瞬時にモデル化して確率計算をし、予測する作業が可 能になったのだ。
· · · ·