統計学 第3週 確率
担当者: 高木 真吾
質問等は, [email protected] までお願いします.
URL: http://sites.google.com/site/hustat2017/
October 13, 2017
なぜ確率か?
2
なぜ確率か?
. . . 3
集合と事象
4
集合. . . 5
集合の演算
. . . 7
確率
12
事象. . . 13
公理による確率
. . . 16
確率の性質
. . . 18
問題
. . . 20
条件付き確率
21
条件付確率. . . 22
問題
. . . 24
事象の独立性
. . . 25
事象の独立と排反
. . . 26
ベイズの定理
. . . 27
ベイズの定理の解釈
. . . 29
演習問題
. . . 30
なぜ確率か? 2 / 30
なぜ確率か?
■ 統計学の講義で確率を使うのは?
◆ データを整理(記述統計)する観点からは確率は不要.
◆ データ(標本)からデータが出てきた背景(母集団)を推測するには両者に何らかの関係が必要
■ 「無作為」に対象を抜き出す(すべての対象が等しく選ばれる)
■ このとき,出てくるであろう値が何になるかを抜き出す前に考える
◆ どの値がどういう出やすさで選ばれるかを考える
■ 必然的に確率変数の考え方が必要とされる
◆ 確率および確率変数という道具がその関係を記述する上で重要
◆ したがって統計学(推測統計)では確率を最初に学ぶ
■ 確率はそれ自体も重要
◆ 結果に不確実性を伴う現象をモデル化するための重要な道具
◆ 例)金融現象,人の反応などなど
統計学 第3週
– 3 / 30
集合と事象 4 / 30
集合
■ 集合:いくつかの要素の集まり
◆ 確率論では,「起きうる可能な事柄」をひとつのまとまり=集合とみなす
■ 抽象的に,二つの集合A,Bを考える
◆ 空集合:∅(含まれる要素がなにもないあつまり)
◆ A ⊆ B:Aに含まれる要素は常にBにも含まれる
◆ A = B:A ⊆ B かつB ⊆ A が成り立つ
◆ 補集合:A¯(集合A には含まれない要素の集まり,A
c
と書くこともある)
◆ 和集合:A ∪ B(集合AまたはBに含まれる要素の集まり)
◆ 積集合:A ∩ B(集合AかつB に含まれる要素の集まり)
◆ 差集合:A \ B(集合Aには含まれるが,Bには含まれない要素の集まり)
◆ 排反:A ∩ B = ∅
統計学 第3週
– 5 / 30
図解(ベン図, Venn diagram, Venn’s diagram)
A
集合:
A
(全体はΩ
)Ω
A
A
補集合:
A (= Ω \ A)
Ω
A B
和集合:
A ∪ B
Ω
A B
積集合:
A ∩ B
Ω
A B
Ω
差集合:A \ B (= A ∩ B)
A B
排反:
A ∩ B = ∅
Ω
統計学 第3週
– 6 / 30
集合の演算1
■ 分配則:問題)下の二つの関係式をベン図を用いて確認してください.
◆ (A ∪ B) ∩ C = (A ∩ C) ∪ (B ∩ C)
◆ (A ∩ B) ∪ C = (A ∪ C) ∩ (B ∪ C)
■ {Bi}ni=1 とΩという集合を考え,A, {Bi}ni=1⊆ Ωとする.Ω =Sni=1Bi を満たしているとすると
◆ A =Sni=1(A ∩ Bi)
◆ 問題)上の関係をベン図を用いて確認してください.
統計学 第3週
– 7 / 30
図解
A
B C
(A ∩ B) ∪ C = (A ∪ C) ∩ (B ∪ C)
A
B C
(A ∩ B) ∪ C = (A ∪ C) ∩ (B ∪ C)
A
B C
(A ∪ B) ∩ C = (A ∩ C) ∪ (B ∩ C)
A
B C
(A ∪ B) ∩ C = (A ∩ C) ∪ (B ∩ C)
統計学 第3週
– 8 / 30
図解
B
1B
2B
3B
4B
5Ω
A
A ∩ B
2A ∩ B
3A ∩ B
4B
1B
2B
3B
4B
5Ω
統計学 第3週
– 9 / 30
集合の演算2
■ de Morganの法則
◆ (A ∪ B) = ¯A ∩ ¯B
◆ (A ∩ B) = ¯A ∪ ¯B
◆ 問題)上の二つをベン図を用いて確認してください
■ de Morganの法則の一般化:集合列{Ai}ni=1について,
◆ (Sni=1Ai) =T n i=1A¯i
◆ (Tni=1Ai) =S n i=1A¯i
統計学 第3週
– 10 / 30
証明
■ (A ∪ B) ∩ C = (A ∩ C) ∪ (B ∩ C)の証明
◆ (A ∪ B) ∩ C ⊂ (A ∩ C) ∪ (B ∩ C)を示す
■ ある要素xについて,x ∈ (A ∪ B) ∩ C とすると,x ∈ (A ∪ B)かつx ∈ C が成り立つ(xは (A ∪ B)に含まれており,同時にCには必ず含まれている)
■ 前者から,xはAかBの少なくとも一方に含まれている
■ 上二つを合わせると,xは「Aと同時にCに含まれる(x ∈ (A ∩ C))」か「Bと同時にCに含ま れる(x ∈ (B ∩ C))」の少なくとも一方が成り立っている
■ 以上より,x ∈ (A ∪ B) ∩ Cならばx ∈ (A ∩ C) ∪ (B ∩ C)なので (A ∪ B) ∩ C ⊂ (A ∩ C) ∪ (B ∩ C)
◆ (A ∪ B) ∩ C ⊃ (A ∩ C) ∪ (B ∩ C)を示す
■ 本日の演習問題参照
◆ 以上,両方の結果を踏まえ,(A ∪ B) ∩ C = (A ∩ C) ∪ (B ∩ C)が成り立つ.
◆ (A ∩ B) ∪ C = (A ∪ C) ∩ (B ∪ C)については,上の結果と下のド・モルガンの法則を合わせれば証明 可能.
■ de Morganの法則(A ∪ B) = ¯A ∩ ¯Bの証明
◆ (A ∪ B) ⊂ ¯A ∩ ¯B を示す
■ x ∈ ¯A ∩ ¯B のとき,xは Aに含まれておらず,かつBにも含まれていない
■ したがって,x ∈ ¯A ∩ ¯B
◆ (A ∪ B) ⊃ ¯A ∩ ¯B を示す
■ x ∈ (A ∪ B)のとき,xはAに含まれておらず,かつBにも含まれていない
■ 言い換えると,A かB の範囲(A ∪ B)には決して含まれていない
■ したがってx 6∈ (A ∪ B),あるいはx ∈ (A ∪ B)
統計学 第3週
– 11 / 30
確率 12 / 30
確率への応用:事象
■ 標本点:起こりうる個々の結果
■ 標本空間:すべての標本点の集まり(起こりうる結果全体)
■ 事象:標本空間の一部(部分集合)
■ 全事象:標本空間(通常
Ω
で表現する)統計学 第3週
– 13 / 30
事象
■ 例1)(区別できる)さいころを2つ投げたときの目の数
◆ 標本点:
(1, 1) (1, 2), . . ., (6, 6)
の36
個の各点◆ 標本空間=全事象:
36
個の点の集合◆ 事象:
1.
両方とも偶数の目2.
二個目のさいころが3
の目3. (3, 5)
の目4.
両方とも0以上◆ 事象は,全事象の部分集合なので標本空間全体や標本点の1点,あるいは標本点のいくつか といったものがすべて考えられる.
統計学 第3週
– 14 / 30
事象
■ 例2)明日の最高気温
◆ 標本空間=全事象:
Ω = { x | x ∈ [−50, 50] }
◆ 標本点:上の区間のどこか
◆ 事象:
■ 最高気温が氷点下
A = { x | x ∈ [−50, 0) }
■ 最高気温が
10
度以上20
度未満B = { x | x ∈ [10, 20) }
統計学 第3週
– 15 / 30
確率:公理による確率の定義
■ 以下の関係を満たす
Pr[•]
を確率と呼ぶ 公理1
任意の事象A
について,Pr[A] ≥ 0
公理2
全事象Ω
について,Pr[Ω] = 1
公理
3
任意の(i, j)
についてA
i∩ A
j= ∅
であるとき,Pr
"
∞[
i=1
A
i#
=
∞
X
i=1
Pr [ A
i]
■ 逆に言うと上の関係を満たしさえすればどんなものでも「確率」と考えることができる
■ 他にも「頻度による確率の定義」「主観確率による確率の定義」「等価性原理」
統計学 第3週
– 16 / 30
確率:公理による確率の定義
■ 例)サイコロ
◆ それぞれの目の数の出る確率に
1/6
を割り当てる◆ 標本空間:
{1
の目, 2
の目, 3
の目, 4
の目, 5
の目, 6
の目}
◆ 事象
A
の要素数を#A
で表現し,Pr[A] = #A · (1/6)
とする.◆ このとき,上の1,2は満たされる.3についても排反な事象の要素数を足してから6で割 るか,個々の要素数を同じ6で割ったものを足しているかだけ.
統計学 第3週
– 17 / 30
確率の性質
■ 上の公理から以下の関係が成り立つ 1. Pr[∅] = 0
2. AとBが排反のとき,Pr[A ∪ B] = Pr[A] + Pr[B]
3. 任意の事象Aについて,Pr[A] + Pr[ ¯A] = 1(Pr[ ¯A] = 1 − Pr[A]) 4. 加法定理
◆ Pr[A ∪ B] = Pr[A] + Pr[B] − Pr[A ∩ B]
◆ Pr[A ∪ B ∪ C] = Pr[A] + Pr[B] + Pr[C] − Pr[A ∩ B] − Pr[A ∩ C] − Pr[B ∩ C] + Pr[A ∩ B ∩ C] 5. 劣加法性
Pr [ A ∪ B] ≤ Pr [ A] + Pr [ B]
統計学 第3週
– 18 / 30
図解
A B
Ω A
B C
統計学 第3週
– 19 / 30
問題
■ Pr[A] = 0.24, Pr[B] = 0.52, Pr[A ∩ B] = 0.12のとき,
◆ Pr[ ¯A], Pr[ ¯B], Pr[A ∪ B], Pr[ ¯A ∪ ¯B], Pr[ ¯A ∩ ¯B], Pr[A \ B]をそれぞれ求めよ.
統計学 第3週
– 20 / 30
条件付き確率 21 / 30
条件付確率
■
Pr[A] > 0
なる事象A
を考える.このA
が生起したうえに 事象B
も生起する確率を次のような条件付確率によって定義する.
Pr[B|A] = Pr[A ∩ B]
Pr[A] · · · ·
1◆
A
が生起したことは 条件 として与えられた下で,事象B
が生起する確率を考えている■ 乗法公式:条件付き確率から次の関係が成立することもわかる(
Pr[A] · Pr[B] 6= 0
)Pr[A ∩ B] = Pr[A|B] · Pr[B] = Pr[B|A] · Pr[A] · · · ·
2統計学 第3週
– 22 / 30
図解
A A ∩ B B
A ∩ B
条件付き確率:事象
A
の下で,同時にB
が生起Ω
統計学 第3週
– 23 / 30
問題
文系(A) 理系(B) 職員(C) 合計 男性(D) 350 550 700 1600 女性(E) 150 150 100 400
合計 500 700 800 2000
■ 偶然出会った人が,理系の女性である確率
■ 偶然出会った人が,学生である確率
■ 偶然出会った人が,文系か女性のいずれかである確率
■ 偶然出会った人が,女性であったとき,その人が職員である確率
出会う人が,文系という事象をA,理系をB,職員をCとすると,これらは互いに排反.また男性ならD, 女性ならEとすると,DとEは互いに排反.
■ 理系の女性である確率:Pr[ ] =
=
■ 学生である確率:Pr[ ] = Pr[ ] + Pr[ ] = + =
■ 文系か女性のいずれかである確率:
Pr[ ] = Pr[ ] + Pr[ ] − Pr[ ] = =
■ 女性であったとき,その人が職員である確率:Pr[ ] =
Pr[ ] Pr[ ]
=
=
統計学 第3週
– 24 / 30
事象の独立性
■ 二つの事象
A
,B
が独立であるとは以下の関係が成り立つこと■ 定義:(
A
,B
どちらか一方の事象の生起確率が0の場合も含む)Pr[A ∩ B] = Pr[A] · Pr[B] · · · ·
3■ 条件付確率から考えると理解しやすい(ただし一方の事象の生起確率が0の場合を除く):
Pr[B|A] = Pr[A ∩ B]
Pr[A] = Pr[B] · · · ·
4■ 事象
A
の生起に対して,事象B
はなんら関係を持たないことを示している.■ 問)事象
A
,B
が独立であり,Pr[A] · Pr[B] 6= 0
なら,Pr[B|A] = Pr[B]
かつPr[A|B] = Pr[A]
が成り立つことを示せ.統計学 第3週
– 25 / 30
事象の独立と排反
■ 独立:二つの事象の生起が,互いに無関係
■ 排反:二つの事象の同時には起きない
◆ 一方が起きるときは必ず他方は実現しないという関係を持つ可能性もあり,無関係とは限らない
■ 例)52枚のトランプ(ジョーカーを除外)から一枚を無作為に抜き出す.
◆ 事象A:引いたカードがスペード柄
◆ 事象B:引いたカードが絵札(J,Q,K,A)
◆ 事象C:引いたカードがハート
◆ 事象D:引いたカードが黒色カード(スペードかクラブ)
◆ 事象E:引いたカードがジョーカー
■ このとき,
◆ Pr[A],...,Pr[E],Pr[A ∩ B],...,Pr[A ∩ E]は?
◆ 事象Aと事象Bは排反か,公平なトランプを用いるとき事象Aと事象Bの生起は独立か?
◆ 事象Aと事象Cは排反か,公平なトランプを用いるとき事象Aと事象Cの生起は独立か?
◆ 事象Aと事象Dは排反か,公平なトランプを用いるとき事象Aと事象Dの生起は独立か?
◆ 事象Aと事象Eは排反か,公平なトランプを用いるとき事象Aと事象Eの生起は独立か?
統計学 第3週
– 26 / 30
ベイズの定理
■
Pr[A] Pr[B] > 0
なる二つの事象A,B
を考える.■ 条件付確率:
Pr[B|A] = Pr[A ∩ B]/ Pr[A]
■ 乗法公式:
Pr[A ∩ B] = Pr[B|A] Pr[A] = Pr[A|B] Pr[B]
■
Ω = S
ni=1B
i なる{B
i}
ni=1を考えるとPr[A] =
n
X
i=1
Pr[A ∩ B
i] =
n
X
i=1
Pr[B
i] Pr[A|B
i] · · · ·
5■ ベイズの定理:
Pr[B
i|A] = Pr[B
i∩ A]
Pr[A] =
Pr[B
i] · Pr[A|B
i]
P
nk=1
Pr[B
k] · Pr[A|B
k]
· · · ·
6統計学 第3週
– 27 / 30
ベイズの定理
■ ある製品の部品を工場1,2,3 から入荷(割合は5:3:2)
◆ 同じ規格で製作しており,見かけ上の区別はない
■ 不良品率:工場1(1%),工場2(2%),工場3(5%)
■ その製品を無作為に選んだところ,部品に不備があった.どこの工場のものと考えられるか?
無作為に選んだ製品に工場1の部品が含まれているという事象をB1とし,工場2ならばB2,工場3ならば B3とする.また,製品が故障しているという事象をAとすると
Pr[B1] =
, Pr[A|B1] =
, Pr[B2] =
, Pr[A|B2] =
, Pr[B3] =
, Pr[A|B3] = ベイズの定理から
Pr[B1|A] = Pr[
] · Pr[ |
]
Pr[ ] · Pr[ |
] + Pr[
] · Pr[
|
] + Pr[
] · Pr[
|
]
=
×
× + × + ×
≈
つまり,無作為に選んだ製品が故障していたとき,これが工場1のものである確率は .
■ 同じく,工場2については
■ 同じく,工場3については
統計学 第3週
– 28 / 30
ベイズの定理の解釈
■
A
観測される事柄■
B
i 原因のひとつ(n
個のうちのi
番目)■ ベイズの定理:
A
が観測されたとき,その原因の要因i
である確率は?■ 解釈:先見的に
B
iである確率はPr[B
i]
であるが,A
という観測事実を用いた上でB
iである確 率はどのように更新されるか.A
A ∩ B
3観測結果
A
/原因B
3B
1B
2B
3B
4B
5Ω
統計学 第3週
– 29 / 30
演習問題
宿題は5,6番のみ.A4用紙に記載して,次週水曜日13時までに提出して下さい. 1 ド・モルガンの法則をベン図を用いて確認してください
2 集合演算に関する分配則の証明を完成させてください(ページ5参照)
3 次の二つの意見のおかしさを指摘し,正しい確率計算に基づいて正しい文章に直してください.
◆ 「勝率1/5のくじを3回引いて,一回でも当たりが出れば自分の勝ち」というゲームよりも「勝率 1/25のくじを16回引いて,一回でも当たりが出れば自分の勝ち」というゲームの方が勝率が高そうだ
◆ 「1つのサイコロを4回投げて、6の目が一度でも出れば自分の勝ち」というゲームを何回もしたと きは、自分が勝つことが多かったかかわらず,「2つのサイコロを24回投げて、両方とも6の目が一 度でも出れば自分の勝ち」というゲームを何回もしたときは、自分が負けることが多かったのは不思 議だ.
4 トランプの例を用いて,独立と排反に関係がないことを確認してください(ページ10参照) 5 Pr[A] = 0.4, Pr[B|A] = 0.3, Pr[ ¯B| ¯A] = 0.2 のとき,
◆ Pr[ ¯A], Pr[B| ¯A], Pr[ ¯B|A], Pr[A ∩ B], Pr[B], Pr[A|B]をそれぞれ求めよ.
6 AB型は,知的に優れているが,変人である傾向も強い,と血液型診断でよく言われる.血液型別の変人 と普通の人の分布が以下のように与えられるとするなら,「変人」と思われる人を見たとき,その人がAB 型であると考えることは合理的と言えるか.ただし,それぞれの血液型ごとの変人である確率は
Pr[変人|A型] = 0.375,Pr[変人|B型] = 0.5,Pr[変人|O型] = 0.5,Pr[変人|AB型] = 0.8(確かにAB 型に変人が多く,A型に普通の人が多い)であり,血液型の比率は4:3:2:1である.
統計学 第3週