• 検索結果がありません。

数理統計学Iノート

N/A
N/A
Protected

Academic year: 2021

シェア "数理統計学Iノート"

Copied!
126
0
0

読み込み中.... (全文を見る)

全文

(1)

数理統計学

I

ノート

安部公輔

ver. 01/Apr/2018

作成を始めてから日が浅く,誤植や内容の誤りは軽微なものから重大なものまで多々あると思われる.講義をやりながら加筆・修 正はしていく.特に推定・検定パートはかなりの加筆・修正が必要と考えている.

このノートの作成方針など

講義の参考資料として作成しているものではあるが,講義内容と完全に一致するものではない*1.数 学科以外の学生を対象とした基礎科目なので,数学的難易度は控え目にしているつもりだが,それでも 平均的な学生にとっては難しいかもしれない.数学が苦手なら数式を全て追い掛ける必要はないので, 考え方に集中して欲しい. 推測統計学(inferential statistics)の初歩を以下の方針で解説する*2 推定と検定の基礎を理解することが目標. そのため,確率論から始めはするが,確率論に時間をかけ過ぎていつまでも推定・検定の話に入 らない,という標準的教科書でありがちな状況は回避する.(その意思表示として,このノート では「代表的な確率分布」と「標本分布」を敢えて付録A, B節に配置している*3.) 前半の確率論パートの到達目標は中心極限定理に基づく母平均の区間推定(例5.19参照)であ り,それに向けて最短の理論展開を目指す*4 検定のパートでは考え方の理解を重視する.代表的なパターンを列記はするが,暗記に陥らない よう注意する. 普遍的な教科書を作成するつもりはないし,上記の方針もあるため,標準的な数理統計学の教科書と 比べると内容に偏りがある.例えば,多くの教科書で扱われている「同時(結合)確率分布」や「積率 (モーメント)母関数」は,このノートの構成には今のところ必要ないので完全に無視している*5 なお,演習問題が全く足りていないので,各自適当な本([6]など)で補って貰いたい.

参考文献

[1] 高橋信,トレンドプロ. マンガでわかる統計学. オーム社, 7 2004. [2] 小針晛宏. 確率・統計入門. 岩波書店, 1973. [3] 奥村晴彦. Rで楽しむ統計(Wonderful R 1). 共立出版, 9 2016. [4] 東京大学教養学部統計学教室(編). 統計学入門(基礎統計学Ⅰ). 東京大学出版会, 7 1991. [5] 東京大学教養学部統計学教室(編). 自然科学の統計学(基礎統計学). 東京大学出版会, 8 1992. [6] 村上正康,安田正実. 統計学演習. 培風館, 1 1989. [7] 永田靖. 統計的方法のしくみ -正しく理解するための30の急所. 日科技連出版社, 10 1996. [4]と[5]は定番中の定番であり,この二冊を勉強すれば学部レベルの知識としては十分だろう.この ノートが読めればこれら二冊も読めるようなレベルには設定しているつもりである.[2]も古いが定評 *1講義では扱う時間がないであろう補足なども含めている.半期で全て消化しようとするのは無謀だろう. *2記述統計学 (descriptive statistics) については別途解説するのでこのノートには含めない. *3一般的な順番では, 4 節の後くらいに A 節, 5 節の後に B 節が来るだろう. *4という志はあるがまだ実現はできていない. *5検定試験などを受けようという人は知らないでは困るだろうから各自で補って貰いたい.

(2)

2 目次 のある本で,証明などはかなり詳しく書いてある.[1]は「マンガなんて…」と思うかもしれないが評判 は良いので,絵柄に生理的拒否反応を示さなければざっと読むのもいいかもしれない. 演習書としては[6]が定番の一つ.著者のwebページから問題解答以外のページはPDFファイルで 入手可能(例題だけでも勉強にはなる). 実際に統計を使うとなるとPCソフトの利用は必須である.代表的なものにはSAS, SPSS, Rなど があるが,特に近年はRの利用者が増えており,統計の講義をRで行う例も増えている.[3] はその ような本の一つである. 記号リスト 主立ったものを気付いた範囲で簡単に列挙しておく.(整理されてはいない.) • AAの補集合.(英語でcomplementなのでAcと書く流儀もある.) • ♯Aは集合Aの元の個数.(高校の教科書などではn(A)と書くことも多い.) 大文字のPP (A)は事象Aの確率.小文字のppX(x)は確率変数X の確率密度関数(定義4.7). • P (A | B)は事象B の下でのAの条件付き確率(定義2.1).(PB(A)などと書く流儀もある.) • E[X], V [X] は確率変数 X の期待値(平均値)と分散.(定義 4.11, 定義4.15.)特に断わらなければ µ = E[X], σ =V [X], σ2= V [X]とする. • N(µ, σ2) はこのノートでは平均 µ, 分散 σ2 (標準偏差 σ)の正規分布とする(定義A.13).例えば N (1, 4)と書けば平均は1で分散は4である.(本やソフトウェアによってはN (1, 4)で標準偏差4の場合 もあるので注意する.) 確率変数X の分布が ○○ であることを X∼○○ と書く(定義A.4など参照). • i.i.d. は独立同分布(定義5.8)の略記. 確率変数列X1, X2, . . . , Xn に対してXn を標本平均(定義5.12),u2nを不偏分散(定義6.9)とする. 証明や解答末尾の\(^o^)/はただの区切りで息抜きのつもりだがふざけるなと苦情が多ければ普通にな どに変更する.

目次

1 確率の定義と基本的性質 5 1.1 古典的確率論. . . 5 1.2 現代の公理的確率論の枠組み . . . 6 1.3 発展—確率の連続性 . . . 17 2 条件付き確率と事象の独立性 18 2.1 条件付き確率(conditional probability) . . . 18 2.2 独立性(independence) . . . 20 2.3 発展—条件付き独立性 . . . 24 2.4 発展—ボレル・カンテリの補題 . . . 25 3 Bayes(ベイズ)の定理 27 3.1 基本的な使い方 . . . 27 3.2 事前確率と事後確率に関する注意 . . . 31 3.3 発展—迷惑メールのフィルタリング . . . 32 4 確率変数・確率分布と期待値・分散 35 4.1 確率変数の定義 . . . 35 4.2 確率変数に関する事象とその確率 . . . 36 4.3 分布関数と密度関数 . . . 36 4.4 期待値(平均)と分散 . . . 39

(3)

目次 3 5 独立同分布確率変数列と二つの極限定理 48 5.1 確率変数の独立性 . . . 48 5.2 独立同分布確率変数列 . . . 50 5.3 大数の法則 . . . 51 5.4 中心極限定理. . . 52 6 点推定 56 6.1 母集団と標本. . . 56 6.2 i.i.d. による定式化. . . 58 6.3 母数(parameter) . . . 58 6.4 推定量(estimator) . . . 59 6.5 不偏性(unbiasedness) . . . 60 6.6 一致性(consistency) . . . 61 6.7 有効性(efficiency) . . . 62 6.8 補足—有限母集団修正 . . . 63 7 区間推定 66 7.1 準備—パーセント点 . . . 67 7.2 母分散既知な正規母集団の母平均の区間推定 . . . 67 7.3 母分散未知な正規母集団の母平均の区間推定 . . . 69 7.4 正規母集団ではないが大標本の場合の母平均の区間推定 . . . 70 7.5 正規母集団の母分散の区間推定 . . . 71 7.6 補足—正規母集団以外の場合の区間推定 . . . 72 8 統計的仮説検定 73 8.0 本題に入る前に . . . 73 8.1 予備的だが本質的でもある考察 . . . 73 8.2 検定論の初歩. . . 75 8.3 単一の正規母集団に関する検定 . . . 81 8.4 正規母集団の比較(2標本検定) . . . 86 8.5 いわゆるχ2 検定の代表例. . . . 88 8.6 区間推定との関係 . . . 93 8.7 その他の検定. . . 93 8.8 多重検定に関する注意 . . . 93 8.9 補足—検定力・効果量の見積りとサンプルサイズの決定 . . . 93 A 代表的な確率分布 94 A.1 ベルヌーイ(Bernoulli)分布. . . 94

A.2 二項分布(binomial distribution) . . . 94

A.3 正規分布(normal distribution) . . . 97

A.4 Poisson(ポアソン)分布 . . . 102

A.5 幾何分布(geometric distribution) . . . 107

A.6 指数分布(exponential distribution) . . . 110

A.7 超幾何分布(hypergeometric distribution) . . . 111

B 標本分布(χ2 分布・t 分布・F 分布) 113 B.1 カイ二乗2)分布 . . . 113

(4)

4 目次

B.2 t分布 . . . 115 B.3 F 分布 . . . 117 B.4 補足—いくつかの性質の証明の概略. . . 118

(5)

5

1

確率の定義と基本的性質

前半のかなりの部分は高校の教科書にも書いてある*6が,それでは足りない部分もあるので補強して おこう.

1.1

古典的確率論

「サイコロを1回投げるとき1の目が出る確率はいくらか」と問われれば,多くの人が 1 6 と答える だろう.理由も問われれば「サイコロを投げれば1が出るか2が出るか…6が出るかの6通りの場合 があって,1が出るのはそのうちの1通りだから」とでも答えるだろうか.このように場合の数の比に よって確率を最初に定義したのはラプラス(Laplace)らしい. 定義 1.1 (確率の古典的定義). ある試行(同じ条件下で繰り返し行うことのできる実験や観測) で起こりうる全ての結果がそれぞれ同様に確からしいとき,ある事象が起こる確率は その事象が起こる場合の数 起こりうる全ての場合の数 で与えられる. これは,後述する現代の公理的枠組みでは P (A) = ♯A ♯Ω という確率測度を考えていることになる. この定義はサイコロ振りのような簡単な現象に対してはそれなりに自然に思えるが,考察の対象をよ り複雑な現象にも広げていくに従って,次第に次のような問題が認識されるようになる. (1) 「同様な確からしさ」とは何か.「確率」とは何か.次のような突っ込みが入るのは当然だろう. 「サイコロを振るときに出る目は1から6の6通りだとしても,それぞれの面は少しずつ違 うのだから全て同じ確率のはずがない.」至極真っ当な突っ込みだが,これに対しては多項分 布など「確率分布」を考えることで対応はできる. 「確率を定義するために『確からしさ』などという確率抜きに定義できない言葉を用いるのは けしからん.」「そもそも確率的(ランダム)であるとはどういうことか*7」これも真っ当な 意見だろう.これに対しては数学では今のところ公理的立場(このノートで解説する理論体 系)をとることにしている. (2) 極限を扱うときの問題.現代数学は極限を扱うのに随分苦労して発展してきたが,確率論でもや はり苦労している. 「コインを何度も何度も,仮に永遠に投げ続けるとして,いつまでたっても表が出ない確率は いくらか?」直感的に 1通り 無限通り = 0と答える人はいるだろうか.気持ちはわからなくもな いが,もし問題が「表が有限回で打ち止めになることなく何度も出続ける確率はいくらか?」 ならどうだろう.素朴に考えると 無限通り 無限通り という不定形になり,場合の数の比で考えるこ とには限界がありそうである. 区間[0, 1] ={x ∈ R | 0 ≤ x ≤ 1}からランダムに点を一つ選ぶとする.ある1点aを選ぶ 場合の数は1通りだが[0, 1]は無限個の点を含むので,古典的定義に従うなら点aが選ばれ *6数学 I「データの分析」に加えて数学 A「場合の数と確率」および数学 B「確率分布と統計的な推測」でかなりの範囲を含 む. *7この方面に興味があれば,例えば杉田洋著「確率と乱数」(数学書房)は示唆に富んでいる.

(6)

6 1 確率の定義と基本的性質 る確率は 1 + = 0だろうか.しかしそうすると,[0, 1] から1点を選ぶときそれが[0, 1 2] に含まれる確率は0になってしまう.なぜなら[0,12]のどの点 aもそれが選ばれる確率は0 であり,0をいくら足し合わせても0だから.しかし一方で,直感的には [0, 1]からランダ ムに点を選んでそれが[0,1 2]に含まれる確率は 1 2 などではないのか? このように考え出すと,個数比に基づく古典的定義では太刀打ちできなくなる.それを克服するために 導入されたのが公理的枠組みである.

1.2

現代の公理的確率論の枠組み

確率を公理的に定義することで確率論に数学的基盤を与えたのはコルモゴロフ (Kolmogorov)であ る.公理的方法では「確率(ランダム)とは何か?」という哲学的な問は考えず,特定の条件(公理)を 満たしていて矛盾なく計算ができるならそれは確率(確率測度)と呼ぶことにしてそこから導かれる性 質を考察する.この立場に納得できない人も少くはなく批判もあるだろうが,とりあえず現行の数学で はそうやっているということで「そんなもんか∼」くらいで付き合ってみよう. 数学的に確率を扱うにはまず,考察する現象の範囲を明確にすることが重要である. 定義 1.2 (標本空間(sample space)). 試行の結果として起こり得る現象を全て集めた集合を Ω (オメガ)で表すことにして標本空間(sample space) という. 1.3. コインを1回投げる場合,自然なのはΩ ={,}だろうが,便宜上1 で表,0 で裏を表すことにして Ω ={0, 1}とすることが多い. コインが直立する可能性も含めるなら Ω ={,,},カラスが来て咥えて持って行く可 能性も考えるならΩ ={,,,カラス} とでもすればいい. コインを 2回投げる場合は 1 回目の結果と 2 回目の結果の組合せを全て集めて Ω = {(0, 0), (0, 1), (1, 0), (1, 1)}とする. サイコロ振りならΩ ={1, 2, 3, 4, 5, 6}とするのが自然. 出る目が偶数か奇数かしか問わないのであれば Ω = { 偶数,奇数 } としてもいいだ ろう.4 面サイコロや 12面サイコロ,20 面サイコロならそれぞれ Ω = {1, 2, 3, 4}, Ω ={1, 2, · · · , 12}, Ω = {1, 2, · · · , 20}になるだろう. コインを n 回投げるうち何回表が出るかを問題にする場合 Ω ={0, 1, . . . , n} でいいだ ろう. 一定期間に発生する事故の件数などを考える場合はΩ ={0, 1, 2, . . . }(非負整数全て)と する. 次に事故が発生するまでの間隔を問題にするのであれば Ω = [0,∞) = {x ∈ R | 0 ≤ x < +∞}. コインを何度も投げ続ける場合はΩ ={(a1, a2, a3,· · · , an,· · · ) | an = 0 or 1}(0, 1のみ からなる数列全ての集合)と設定することが多い. 4 節以降で確率変数を用いるようになると,Ωは理論を展開するのに十分な大きさを持つ集合とだ け思うことにして,具体的にイメージすることは少なくなる.しかしそうだとしても,最初に何か一つ 標本空間が設定されていてその中で一貫して議論が展開されなくては確率論にならないことを認識 しておくことは大事である. 全体の枠を定めたら次に考えるのは想定の範囲内で起こりうる現象の表現法だが,それには部分集合 を用いる.

(7)

1.2 現代の公理的確率論の枠組み 7 定義 1.4 (事象(event)). 標本空間Ωの部分集合A⊂ Ωを事象 (event) という. 標本空間の単一元ω ∈ Ωのみからなる集合{ω}は試行により起こる結果の最小単位と考える ことができ根元事象という. あまり堅苦しく考えず,根元事象が集まってより複雑な事象を形成すると思っておけばいい.集合論 では任意の集合はそれ自身を部分集合として含むとするのでΩ⊂ Ωであり,標本空間Ω自身もまた事 象である.(その意味でΩを全事象とも言う.)また,集合論では空集合 は任意の集合の部分集合に なるのでこれも事象の一つである.これを空事象と呼ぶ.後述するように空事象の確率は0なので,確 率論的には無視できる(無視する)現象を表現するものだと思っておけばよい.(A∪ ∅ = A, A ∩ ∅ = ∅ なので数字の0のようなものという捉え方もよくされる.) 1.5. コイン投げの例で Ω = {0, 1} とする.事象 {1} ⊂ Ω は「表が出る」を表し {0} ⊂ Ωは「裏が出る」を表し,{0, 1} = Ω ⊂ Ωは「表か裏が出る」=「想定の範囲内で何 か起こる」という現象を表す. コインを2回投げる例では,事象{(0, 1)}は「1回目に裏,2回目に表が出る」という現象, {(1, 0), (1, 1)}は「1回目に表が出る」という現象を表わす. 一般にある事象(部分集合) A を表現・規定する文章や条件は複数存在するだろうが,表現が異っ ていても集合が同じであればそれは少なくとも確率論的には同じ現象である.これは事象を部分集合に よって定義する利点の一つだろう. 問題 1.6. サイコロ投げで標本空間は Ω ={1, 2, 3, 4, 5, 6} とする.次の現象を事象(集合)で 表せ. (1)偶数の目が出る. (2)奇数または3以下の目が出る. (3)素数の目が出る. 【解説】 (1){2, 4, 6} (2) {1, 2, 3, 5} (3) {2, 3, 5} \(^o^)/ 集合に対しては和集合や積集合(共通部分)などを考えることができる.事象は集合だと定式化した ので形式的に集合演算することはできるが,それを次のように解釈する. 定義 1.7. Ωを標本空間とし,事象A, B⊂ Ωを考える. 集合AB の積集合A∩ B を積事象 (intersection)という. A B が両方起こる」「A の条件と B の条件が両方満たされる」などを表す. 集合AB の和集合A∪ B を和事象 (union) という. A B の少くとも一方は起こる」「A の条件と B の条件の少なくとも一方は満たされ る」などを表す.A∩ B ⊂ A ∪ B なので両方起こる場合も含むことに注意する. • Aの補集合A を余事象 (complement)という.(補事象と書いてある本もある.) A は起こらない」「A 以外の何か」などを表す. 積事象を用いて次の用語も定義しておく.

定義 1.8. A∩ B = ∅のとき,AB は互いに排反 (disjoint / mutually exclusive) であ

るという.

(8)

8 1 確率の定義と基本的性質 また,演算ではないが集合の包含関係の解釈についても言及しておこう*8.二つの事象 A, B A⊂ B を満たすとき,これは論理的には「AならばB」なので,(因果関係はともかく)A が起これ B も起こるなどと解釈できる.あるいは Aの方がB より条件が厳しいということである.積事象 は条件をandで適用し和事象はorで適用するので,A∩ B ⊂ A ⊂ A ∪ B, A ∩ B ⊂ B ⊂ A ∪ Bは当 然である. 補足1.9. 積事象と和事象は三つ以上の事象に対しても同様に考えることができる: A1, A2, . . . を 事象の列とすれば i=1 AiA1, A2, . . . の全てが起こるという事象を表し i=1 AiA1, A2, . . . の少なくとも一つは起こるという事象を表す. 注1.10. 集合演算によって,単純な事象を組み合わせて複雑な事象を表現できるのが眼目である. 例えば先程の問題1.6(2)の事象は「奇数」={1, 3, 5}と「3以下」={1, 2, 3}から和事象をとる ことで{1, 3, 5} ∪ {1, 2, 3} = {1, 2, 3, 5}として得られるが,これは文の表現そのものではないか. ここで,確率論では最初に標本空間を明確にしなければならない理由として 余事象 A は標本空間を指定しないと決まらない ことに注意する. 例えばサイコロで A = {1} (1が出る)の余事象 A (1が出ない)を考えるとき,6 面サイコ ロ Ω = {1, 2, 3, 4, 5, 6} なら A = {2, 3, 4, 5, 6} (2から6のどれかが出る)だが,4面のサイコロ Ω ={1, 2, 3, 4}ならA ={2, 3, 4}(2から4が出る)である. 単純な事象を組み合せて複雑な事象を表現するのに,次の命題は基本的である.

命題1.11 (ド・モルガンの法則 (de Morgan’s laws)).

(1) (A∩ B) = A ∪ B: 「『A, B 両方が起こる』ことはない」=「AB のどちらかは起こら ない」 (2) (A∪ B) = A ∩ B: 「『A, B の一方は起こる』ことはない」=「AB も起こらない」 論理の基本であって数学的に証明するほどのものではないと思うが,ベン図でどうなっているかくらい は考えておくといいだろう. 補足 1.12. ド・モルガンの法則も,三つ以上の事象に対しても成り立つ.一般に事象の族{Ai} に対して i Ai= ∪ i Ai (積事象の余事象=個々の余事象の和事象) i Ai= ∩ i Ai (和事象の余事象=個々の余事象の積事象) が成り立つ. *8このへんのことは高校数学 I「集合と命題」で学習しているはず.

(9)

1.2 現代の公理的確率論の枠組み 9 1.13 (酔っ払いは家に帰ることができるか?). Ai を「時刻iに家に着く」という事象とする (ここでは標本空間は気にしない)と,「いつかは家に着く」は∪iAi と表せる.その否定である 余事象「いつまでも家に着かない」はド・モルガンの法則から(∪iAi) = ∩ iAi だが,右辺は全て の時刻i で家に着いていないことを意味する. ようやく確率を定義できる.事象の生起確率などというものがあるとして,それが数学的に計算処理 できるためにはどれだけの性質があればいいか.それを整理したのが確率測度の定義である*9 定義1.14 (確率測度(probability measure)). 事象A⊂ Ωに実数を対応させる関数(集合関数と

いう)P (A)が以下の三つの性質を満たすとき,P をΩ上の確率測度(probability measure)

といい, P (A)を事象 A の確率という.(このノートでは確率測度も略して単に確率と書くこ とがある.)また,標本空間Ωと確率測度 P をセットにして(Ω, P )を確率空間(probability space) という. (1) 任意のA⊂ Ωに対して 0≤ P (A). (事象の発生確率だから負にならない.) (2) P (Ω) = 1. (全事象は必ず起こる.) (3) 事象の族A1, A2,· · · が互いに排反(i̸= j =⇒ Ai∩ Aj =∅)ならば P ( n=1 An ) = n=1 P (An) (1.1) が成り立つ. 条件(1), (2)はある意味当然の要請なので重要な条件は(3)のみと言ってよいが,(3)が成り立てば 特に (3)’ 二つの事象 A, B⊂ Ωが互いに排反ならば P (A∪ B) = P (A) + P (B) (3)”三つの事象A, B, C⊂ Ωが互いに排反ならばP (A∪ B ∪ C) = P (A) + P (B) + P (C) なども成り立つことや,このノートでは無限個の事象を考えることがあまりないことから当面は(3)’, (3)”を定義と思っておいても差し支えない*10 確率「測度」という言葉を使うのは,実は数学的には確率も面積・体積や質量なども全て「測度」の 概念を用いて定式化される*11からである.そのため確率と面積は多くの部分で同じ性質をもち,例えば 定義の(3)の性質も面積と同じである.このことを知っていると確率の性質や計算のいくつかはイメー ジしやすくなる. 命題1.15 (確率の基本的性質). (1) P (A) = 1− P (A). 特にP (∅) = 0. (2) A⊂ B =⇒ P (B ∩ A) = P (B) − P (A). (3) A⊂ B =⇒ P (A) ≤ P (B). 従って任意の事象Aに対して 0≤ P (A) ≤ 1.

(4)(加法定理)P (A∪B) = P (A)+P (B)−P (A∩B), P (A∩B) = P (A)+P (B)−P (A∪B).

(命題1.23も参照せよ.)

*9この定義はかなり簡略化していて,数学的重要ポイントを割愛しているので本格的な確率論の議論には不十分であること

を断っておく.

*10例 1.13 のような問題を考えるときは (3) の形が必要になる. *11全体を P (Ω) = 1 とする点は確率論特有である.

(10)

10 1 確率の定義と基本的性質 面積と同じだと思ってべん図を描いてみれば簡単に解るものばかりだが,式での計算もしておこう.慣 れないうちは完全にフォローできる必要はないかもしれないが,確率の性質は全て,公理に書かれた たった三つの性質から導出できることは認識しよう. 証明. A∩ B = ∅ のときは和集合A∪ B A⊔ B と書くことにする. (1)一般に A∩ A = ∅, Ω = A ⊔ A だから,1 = P (Ω) = P (A⊔ A) = P (A) + P (A) から従う. (2),(3) 一般にA∩ A = ∅, Ω = A ⊔ AだからA∩ (B ∩ A) = ∅. A ⊂ B のときB = A⊔ (B ∩ A)

のでP (B) = P (A⊔ (B ∩ A)) = P (A) + P (B ∩ A) ≥ P (A) (∵ 0 ≤ P (B ∩ A)). 特にA⊂ Ωなので

P (A)≤ P (Ω) = 1. (4) P (A∪ B) = P (A ⊔ (B ∩ (A ∩ B))) = P (A) + P (B ∩ (A ∩ B)) = P (A) + P (B) − P (A ∩ B). (最後の部分は(A∩ B) ⊂ B なので(3)を適用できる.) \(^o^)/ 1.16. 加法定理を見ればわかるように一般にはP (A∪ B) = P (A) + P (B) − P (A ∩ B) ≤ P (A) + P (B)であり,A, B が排反のときはそれが P (A∪ B) = P (A) + P (B)になるというの が定義の条件(3)である.何の条件もなしに式(1.1)がいつも成り立つわけではない(だからこそ の定義である)ので勘違いしないように.なお,劣加法性 (subadditivity) と呼ばれる不等式 P (n=1 An ) n=1 P (An) (1.2) は常に成り立つ. 具体的な確率測度として,冒頭の 定義 1.1 に相当するのは次の例である.その他の重要な例につい ては改めてまとめて紹介する. 1.17. ♯Aで集合Aの元の個数を表すことにする.標本空間 Ωが有限集合(♯Ω <∞)である とき,A⊂ Ωに対して P (A) = ♯A ♯Ω と定めると確率測度になる.これが定義 1.14の条件を全て満たすことは, A∩ B = ∅ =⇒ ♯(A∪ B) = ♯A + ♯B などより直ちに従う.このノートでは,標本空間が有限集合で確率測度 について特に仮定を書かなければ上の確率測度で考えているものとする. 問題1.18. サイコロを2個同時に投げるとき,次のものを求めよ(定めよ).ただしどの目が出る 確率も同様に確からしいとする. (1)標本空間Ω (2)同じ目が出る確率 (3)目の和が6以下になる確率 (4) (2)か(3)が起こる確率 【解説】 (1)それぞれのサイコロの出目の全組合せだから Ω ={(1, 1), (1, 2), (1, 3), (1, 4), (1, 5), (1, 6), (2, 1), (2, 2), (2, 3), (2, 4), (2, 5), (2, 6), (3, 1), (3, 2), (3, 3), (3, 4), (3, 5), (3, 6), (4, 1), (4, 2), (4, 3), (4, 4), (4, 5), (4, 6), (5, 1), (5, 2), (5, 3), (5, 4), (5, 5), (5, 6), (6, 1), (6, 2), (6, 3), (6, 4), (6, 5), (6, 6)} で計36通り.これを全て書くのは面倒だし書き漏らす危険もあるので,次のような書き方をする 事が多い. Ω ={(i, j) | 1 ≤ i, j ≤ 6}

(11)

1.2 現代の公理的確率論の枠組み 11 (1≤ i, j ≤ 6は正確を期すなら1≤ i ≤ 6, 1 ≤ j ≤ 6と書く.) (2), (3)同じ目が出るという事象をA,目の和が6以下になるという事象をB とすると A ={(1, 1), (2, 2), (3, 3), (4, 4), (5, 5), (6, 6)} B ={(1, 1), (1, 2), (2, 1), (1, 3), (2, 2), (3, 1), (1, 4), (2, 3), (3, 2), (4, 1) (1, 5), (2, 4), (3, 3), (4, 2), (5, 1)} でそれぞれの場合の数は♯A = 6, ♯B = 15なのでP (A) = 6 36 = 1 6, P (B) = 15 36 = 5 12. (4) A∩B = {(1, 1), (2, 2), (3, 3)}P (A∪B) = P (A)+P (B)−P (A∩B) = 6 36+ 15 36 3 36 = 1 2. \(^o^)/ 補足1.19. 加法定理については次のような見方もできる.二つの事象A, B があるとき,基本的に A∪Bは条件が曖昧になるのに対してA∩Bは条件が厳しくなるのでこちらの方が要素を把握・限 定しやすい.従って,A∪ Bを直接計算するより,相対的に簡単なはずのP (A), P (B), P (A∩ B) を求めて加減算する方が見通しよくミスも減ると期待できる. 次の問題は形式的過ぎて何の意味があるのかと思うかもしれないが,意味を気にせず形式的に計算で きることもそれはそれで重要である. 問題1.20. P (A) = 1 2, P (B) = 1 3, P (A∩ B) = 1 4 のとき,次の事象の確率を求めよ. (1) A∪ B (2) A∩ B (3) A∩ B (4) A∪ B 【解説】 (3), (4)は式だけで分かりにくければベン図を描こう. (1) P (A∪ B) = P (A ∩ B) = 1 − P (A ∩ B) = 1 − 1 4 = 3 4

(2) P (A∩B) = P (A ∪ B) = 1−P (A∪B) = 1−{P (A)+P (B)−P (A∩B)} = 1−1 2 1 3+ 1 4 = 5 12 (3) P (A∩ B) = P (B ∩ (A ∩ B)) = P (B) − P (A ∩ B) = 1 12 (4) P (A∪ B) = P (A ∪ (A ∩ B)) = P (A) + P (A ∩ B) = 3 4 \(^o^)/ 問題1.21. N 人の人がいるとき,その中に誕生日の同じペアがいる確率はいくらか.ただし簡単 のため閏年は考えないことにする. 【解説】 余事象は「同じ誕生日のペアは存在しない」=「全員の誕生日が異なる」であり,この 確率を求めるのは難しくない.実際, N 人の誕生日の全パターン 365N 通りのうち,誕生日が 全て異なる場合の数は 365PN なのでその確率は 365PN 365N . 従って同じ誕生日の人がいる確率は 1365PN 365N . これはもちろんN について単調増加だが,具体的なN で計算してみると,N = 23 で確率が50%を越え,N = 35 で80%越え,N = 57では99%を越える. ちなみに,自分と同じ誕生日の人がいる確率は1 ( 364 365 )N だが,これはかなりゆっくりとし か増加しない. \(^o^)/

(12)

12 1 確率の定義と基本的性質 0 10 20 30 40 50 60 0 0.2 0.4 0.6 0.8 1 人数 同じ誕生日の人がいる確率 ペアが一組 自分と同じ この例のように,ある事象Aの確率を直接計算するより余事象 Aの確率から 1− P (A) で求める方が 簡単なことはよくある.常套手段なので押さえておこう. 問題 1.22. 上の例で,同じ誕生日の人がいる確率が90%以上になるのはN が何人以上からか求 めよ. 【解説】 N = 41. (ちゃんと自分で計算できるだろうか?) \(^o^)/ 加法定理(命題 1.15(4))で事象の数を一般化したものもよく用いられる.特に事象の数が3の場合 は各種試験などでも頻出なので知っておこう. 命題1.23. 3つの事象A, B, Cに対して次式が成り立つ. P (A∪ B ∪ C) =P (A) + P (B) + P (C) − P (A ∩ B) − P (B ∩ C) − P (C ∩ A) + P (A∩ B ∩ C) 証明. ベン図を描いて理解することもできるが,ここでは式計算で確認する.加法定理P (A∪ B) = P (A) + P (B)− P (A ∩ B)B の部分にB∪ C を代入すると P (A∪ B ∪ C) = P (A) + P (B ∪ C) ::::::::− P (A ∩ (B ∪ C)) (第2項に加法定理) = P (A) + P (B) + P (C)− P (B ∩ C) :::::::::::::::::::::: − P (A ∩ (B ∪ C)). ここでA∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C), (A ∩ B) ∩ (A ∩ C) = A ∩ B ∩ C なので P (A∩ (B ∪ C)) = P (A ∩ B) + P (A ∩ C) − P (A ∩ B ∩ C). 以上を合わせて結論を得る. \(^o^)/ 補足1.24. 参考として,事象の数を4つ以上に一般化した式も書いておくと, P (A1∪ A2∪ · · · ∪ An) = nk=1 (−1)k−1×   ∑

1≤i1<i2<···<ik≤n

P (Ai1∩ Ai2∩ · · · ∩ Aik)   が成り立つ.(証明は帰納法でできるが省略する.)念のためn = 4までを書き下しておこう.(苦 手な人は飛ばしてもよいが,こういう地道な修行をしなければ苦手なままであろうから,脱却した いなら辛抱強く食らい付くこともときに必要だろう.)

(13)

1.2 現代の公理的確率論の枠組み 13 n = 1の場合,外側の和はk = 1 のみで内側の和も1≤ i1≤ n = 1となるのはi1= 1 だけな のでP (A1) = (−1)1−1P (A1) = P (A1)という自明な式になっている. n = 2の場合,外側の和で k = 1 に対して内側は1 ≤ i1≤ n = 2を満たすのが i1 = 1, 2 な ので(−1)0× (P (A 1) + P (A2)). k = 2に対して内側の和は1≤ i1< i2≤ n = 2 を満たすのは (i1, i2) = (1, 2)のみなので(−1)2−1P (A1∩ A2) =−P (A1∩ A2)となって,合わせれば確かに加 法定理と一致する. n = 3 の場合は, k = 2 に対して今度は 1 ≤ i1 < i2 ≤ n = 3 を満たすのが (i1, i2) = (1, 2), (1, 3), (2, 3)の3つなので (−1)2−1× (P (A 1∩ A2) + P (A1∩ A3) + P (A2∩ A3))となり, k = 3に対する項はP (A1∩ A2∩ A3)の1項のみとなる. n = 4の場合も同様にすれば P (A1∪ A2∪ A3∪ A4) =P (A1) + P (A2) + P (A3) + P (A4) − (P (A1∩ A2) + P (A1∩ A3) + P (A1∩ A4) + P (A2∩ A3) + P (A2∩ A4) + P (A3∩ A4)) + (P (A1∩ A2∩ A3) + P (A1∩ A2∩ A4) + P (A1∩ A3∩ A4) + P (A2∩ A3∩ A4)) − P (A1∩ A2∩ A3∩ A4) 問題 1.25 (H27アクチュアリー会資格試験). 1つのサイコロを振る試行を4回繰り返す.1回 目と4回目の試行でともに1の目が出る事象を A, 1回目と2回目の試行でともに3以下の目が 出る事象をB, 3回目と4回目の試行でともに奇数の目が出る事象を C とする.このとき,事象 A, B, C のいずれかが発生する確率を求めよ.

【解説】 P (A∪B∪C) = P (A)+P (B)+P (C)−P (A∩B)−P (B∩C)−P (C ∩A)+P (A∩B∩C)

に必要な項を計算すればよい.まずP (A) = 1 6× 6 6× 6 6× 1 6 = 1 36, P (B) = 3 6× 3 6× 6 6× 6 6 = 1 4, P (C) = 6 6 × 6 6 × 3 6 × 3 6 = 1 4 であり,さらにP (A∩ B) = 1 6 × 3 6× 6 6 × 1 6 = 1 72, P (B∩ C) = 3 6× 3 6× 3 6× 3 6 = 1 16, P (C∩ A) = 1 6× 6 6× 3 6× 1 6 = 1 72, P (A∩ B ∩ C) = 1 6× 3 6× 3 6× 1 6 = 1 144 なのでP (A∪ B ∪ C) = 4 9. \(^o^)/ 問題 1.26 (H24アクチュアリー会資格試験). 正20面体の各面に1から6までの数字のうちの1 つを書いてサイコロを作った.その内訳は,1が1面,2が2面,3が3面,4が4面,5が5面, 6が5面であった.このサイコロを2回投げたとき,1回目と2回目に出た数字の和が3で割り切 れない確率を求めよ.なお,このサイコロの各面の出る確率は等しいものとする. 【解説】(6 の面は 5 個なのでイージーミスに注意.)1 回目と 2 回目の数字の和が k とな る 事 象 を Ak と す れ ば , k が 3 で割 り 切 れ る 事 象 は A3, A6, A9, A12 な の で ,求 め る 確 率 は 1− P (A3 ∪ A6 ∪ A9∪ A12). それぞれの事象は具体的にはA3 = {(1, 2), (2, 1)}, A6 = {(1, 5), (2, 4), (3, 3), (4, 2), (5, 1)}, A9 ={(3, 6), (4, 5), (5, 4), (6, 3)}, A12 ={(6, 6)} で,互いに 排反である.それぞれの確率は P (A3) = 1 400(1× 2 + 2 × 1) = 4 400 P (A6) = 1 400(1× 5 + 2 × 4 + 3 × 3 + 4 × 2 + 5 × 1) = 35 400 P (A9) = 1 400(3× 5 + 4 × 5 + 5 × 4 + 5 × 3) = 70 400 P (A12) = 1 400(5× 5) = 25 400

(14)

14 1 確率の定義と基本的性質 なので,求める確率は 1− P (A3∪ A6∪ A9∪ A12) = 1 ( 4 400+ 35 400+ 70 400 + 25 400 ) = 133 200 \(^o^)/ 問題1.27 (H26アクチュアリー会資格試験). A, B, Cの3人がこの順番(ABCABC· · · )で2つ のサイコロを同時に投げる試行を繰り返し,最初に2つのサイコロの目の合計が7となった者を 勝ちと定める.このとき,B の勝つ確率を求めよ. 【解説】 目の和が7となる組み合わせは (1, 6), (2, 5), (3, 4), (4, 3), (5, 2), (6, 1) の6通りでその 確率は 6 36 = 1 6. 1巡目でB が勝つ確率は 5 6× 1 6, 2巡目で勝つ確率は ( 5 6 )4 ×1 6 で,n巡目で は 1 6 ( 5 6 )3(n−1)+1 なので,求める確率は n=1 1 6 ( 5 6 )3(n−1)+1 =5 6 × 1 6 × n=1 ( 5 6 )3(n−1) =5 6 × 1 6 × 1 1− (5/6)3 = 30 91 \(^o^)/ 確率の計算では漸化式をたてるとうまくいくことも多い.例をいくつか(本質的には1種類だが)挙 げておこう*12.レベルは少し高いかもしれないので難しいと感じるなら一旦飛ばすのが賢明だろう. 問題1.28 ([2]から引用). K先生は大へん休講が好きで,1回講義をすると次の講義を休講にする 確率は0.5であり, 1度休講すると,さすがに気が引けるのか,その次の週が休講になる確率は0.2 であるという.長い間には彼はどれくらい休講するであろうか.ただし,《長い間に》とは,第n 回目が休講である確率をpn とすろとき,その平均 lim n→∞ 1 n nk=1 pk のこととする. 【解説】 n回目が休講になるかどうかは前の回に依存して決まるのでpnpn = 0.5(1− pn−1) | {z } 前回講義があった + 0.2pn−1 | {z } 前回休講だった = 0.5− 0.3pn−1 という漸化式を満たす.これは標準的な方法(pn− 5/13 = −0.3(pn−1− 5/13)と変形すれば等比 数列になる)で解くことができて,(1回目の休講確率は不明でも) pn = ( 3 10 )n−1( p1 5 13 ) + 5 13 5 13 (n→ ∞) *12ここで紹介するのはマルコフ (Markov) 連鎖と呼ばれるものの簡単な例にもなっている.マルコフ連鎖はこのノートより 上級の学習をする際には必要になる可能性が高く,また検定 1 級レベル以上では必須知識だろう.

(15)

1.2 現代の公理的確率論の枠組み 15 が成り立つ.ゆえに,下記の補題から lim n→∞ 1 n nk=1 pk = 5 13. 半期で 5 回程度の頻度である. \(^o^)/ 補題 1.29. 数列{an}がlimn→∞an= α を満たすとき, lim n→∞ 1 n nk=1 ak = α が成り立つ. 証明の概略. 極端な場合としてan= α (n = 1, 2, . . . )のときは 1 n nk=1 ak= 1 n× nα = αなので,極限 が存在するとしたら候補は αしかない.(これは感覚的にわかって欲しい.)問題は本当に収束するか どうかである. きちんと証明しようとすると悪名高い ε-δ論法が必要になるのだが,最近は数学科でもない限り理工 系でも微積でε-δ 論法を教えないので, εなどの言葉は使わないで(しかし本質は外さず)説明して おく. limn→∞an ということは,最初のうちはともかく,nが非常に大きいところではan≈ αというこ とである.その境目を適当に定数N で区切って,n > N =⇒ an ≈ α(区別がつかない)が成り立つと しておく.そうしたとき,∑n k=1 を添字の範囲によって二つに分けると,(N は定数なので) 1 n nk=1 ak = 1 n Nk=1 ak | {z } 定数 +1 n nk=N +1 ak | {z } ak≈α 定数 n + 1 n nk=N +1 α | {z } N−n個の和 = 定数 n + n− N n α→ α (n → ∞) となって結論が従う. \(^o^)/ 問題1.30. 一人暮らしのA君が毎日の夕食を自炊にするか外食にするかは,前日がどうであった かに応じて次の確率で決まるらしい. 自炊した翌日は確率0.7でまた自炊し,0.3で外食する. 外食した翌日は確率0.2でまた外食し,0.8で自炊する. (連日の外食は経済的に厳しいのか健康を気にしているのか….)長期的にみて,彼はどれくらいの 頻度で外食していることになるか. 【解説】 ある日に自炊する確率と外食する確率をそれぞれan, bn とすれば,前日の状況に応じて { an= 0.7an−1+ 0.8bn−1 bn = 0.3an−1+ 0.2bn−1 (☆) となる.もし lim n→∞an, limn→∞bn が存在するならば,それが外食頻度が安定した状態と言えるだろ う.上の漸化式は行列を用いると ( an bn ) | {z } pnとおく = ( 0.7 0.8 0.3 0.2 ) | {z } Aとおく ( an−1 bn−1 )

(16)

16 1 確率の定義と基本的性質 だからpn= Apn−1 と書くことができる.(マルコフ連鎖の文脈では行列Aを推移行列という.) pn = Apn−1 = A2pn−2 =· · · = Anp0 より lim n→∞pn = limn→∞A n p0 なので lim n→∞A n を計算でき ればよい.An の計算は対角化の典型的な応用であり線型代数学で勉強するはずのことなので詳細 は省いて結論だけ書く.λ =−1 10 とおけば|λ| < 1なので An= 1 11 ( 8 + 3λn 8− 8λn 3− 3λn 3 + 8λn ) 1 11 ( 8 8 3 3 ) (n→ ∞) 初日(n = 0)が外食かどうかはわからないがa0+ b0= 1には違いない(食事抜きは考えない)の で,結局 lim n→∞pn = 1 11 ( 8 8 3 3 ) ( a0 b0 ) = 1 11 ( 8 3 ) が求める値である.(25%強,4日に1日は外食という頻度.) \(^o^)/ (補足) 極限値の当たりを付けるだけなら式(☆)でan= an−1= α, bn = bn−1= β とおいて, α + β = 1と合わせて解けばα = 8/11, β = 3/11 と求まる.実は,マルコフ連鎖の一般論を知っ ていればこの例の場合確率が収束するのは明らかなので極限値を求めるだけでいい. 状態が二つならそれほど難しくないのだが,状態が3つ以上になると考え方は同じでも計算は煩雑に なる.計算力試しにもう1問挙げておく.(一般論を勉強すればかなり楽になるが,それはこのノート の本題からあまりに逸脱するので割愛する.) 問題1.31. 三角形ABC の頂点を下記の規則でステップ毎に粒子が移動する.ステップnで粒子 が頂点A, B, C にいる確率をそれぞれan, bn, cn とする.n→ ∞で各数列は収束するか.収束 するなら極限値を求めよ. 初期値が頂点A, B, Cである確率はそれぞれa0, b0, c0とする.(もちろんa0+b0+c0= 1.) ステップ nで頂点 Aにいるとき,次のステップでは確率 2 3 でB に, 1 3 でC に移動す る.同様に,B からは確率 1 2 でA に, 1 2 でC に,C からは確率 2 3 でA に, 1 3 でB に移動する. 【解説】 先ほどの例と同様に漸化式をたてれば pn=  abnn cn   =  2/30 1/20 2/31/3 1/3 1/2 0    abnn−1−1 cn−1 = Apn−1. An の計算はやはり対角化でできるが,この問題ではA の固有値は1,−3 ± i 6 で複素固有値を 含むので全て正直にやるとかなり煩雑.しかし −3 ± i 6 < 1 なのでn→ ∞ではどうせ消えてし まうことがわかっていればある程度は見通しよく計算できるだろう.結果は lim n→∞A n=  15/4114/41 15/4114/41 15/4114/41 12/41 12/41 12/41   となるので,a0+ b0+ c0= 1 も合わせると lim n→∞pn = limn→∞A np 0=  15/4114/41 15/4114/41 15/4114/41 12/41 12/41 12/41    ab00 c0   = 1 41  1514 12   が結論である. \(^o^)/

(17)

1.3 発展—確率の連続性 17

1.3

発展

確率の連続性

このノートで使うことはないが,確率測度に対する次の性質もよく知られているので証明抜きで紹介 しておく.三つまとめて確率の連続性などというが,理由は(3)を見ればわかるだろうか. 命題1.32 (確率の連続性). (1) A1⊂ A2⊂ A3⊂ · · · ならば lim n→∞P (An) = P (n=1 An ) . (2) A1⊃ A2⊃ A3⊃ · · · ならば lim n→∞P (An) = P (n=1 An ) . (3) A = lim n→∞An ならばnlim→∞P (An) = P (A) ( = P ( lim n→∞An )) . ただし集合列A1, A2, . . . の極限 lim n→∞An は次のように定義される. • lim sup n→∞ An= n=1 k=n Ak, lim inf n→∞ An= n=1 k=n Ak と定め,それぞれ上極限 (limit superior) ,下極限 (limit inferior) という. • lim sup n→∞ An= lim inf n→∞ An が成り立つときAn は収束するといいnlim→∞An と書く. 初見では意味が解らないかもしれないが,次のような事象になっている. 上極限=「(全てではないが)無限個の nについて An が起こる」(理由: Bn= k=n Ak とおく とBn=「An, An+1, An+2, . . . のどれかは起こる」でlim sup n→∞ An = n=1 Bn は「全てのBn が起 こる」だから…,と考えればわかる.) 下極限=「有限個の例外を除く全てのn について An が起こる」 例1.33. サイコロを何度も振るときAn=「n回目に1が出る」とすると,上極限は「何度でも1 が出る」という事象,下極限は「最初の数回を除くとある回から先は1しか出ない」という事象に なる. 直感的にはP ( lim sup n→∞ An ) = 1, P ( lim inf n→∞ An ) = 0だが証明は必ずしも明らかではなく,次 節で紹介するボレル・カンテリの補題による(例2.26参照).

(18)

18 2 条件付き確率と事象の独立性

2

条件付き確率と事象の独立性

2.1

条件付き確率

(conditional probability)

以下(Ω, P )は何らかの確率空間とする.さっそく定義から始めよう. 定義 2.1 (条件付き確率). P (B)̸= 0なる事象B と任意の事象A⊂ Ωに対して P (A| B) = P (A∩ B) P (B) (2.1) と定め, B の下でのAの条件付き確率という. 使い道は多岐にわたるが,例えば次のようなものを考えることができる. • B =「晴れ」, A =「暑い」ならP (A| B)は晴れた上で暑くなる確率.(暑くなるだけなら雨でも 暑くなることはある.) • B =「平地」, A =「住宅地」とすればP (A| B)は平地の住宅地利用率. • B =「健康診断で異常所見が出る」, A =「病気にかかっている」なら P (A| B)は精密検査で病 気と診断される確率だろうか(例3.7参照). 補足2.2. P (E) > 0なる事象Eを一つ固定して集合関数PE(A) = P (A| E)を考えると,PEも 定義1.14の条件を全て満たすので確率測度である.実際,条件(1)はPE(A) = P (A∩ E) P (E) > 0, (2) は PE(Ω) = P (Ω∩ E) P (E) = P (E) P (E) = 1 であり,(3)についても一般に (A∪ B) ∩ E = (A∩ E) ∪ (B ∩ E) であることとA∩ B = ∅ のときは(A∩ E) ∩ (B ∩ E) = ∅であることから PE(A∪ B) = P ((A∪ B) ∩ E) P (E) = P (A∩ E) + P (B ∩ E) P (E) = PE(A) + PE(B)が従う. ところで,任意の事象A⊂ Ωに対してA∩Ω = AなのでP(A) = P (A∩ Ω) P (Ω) = P (A) 1 = P (A) が成り立つ.つまり,通常の確率測度は全事象 Ωの下での条件付き確率測度と考えることもで きる. 次の例は人工的過ぎる気もするが,定番なので挙げておく. 2.3. コイン2枚を同時に投げる.「片方は表」という情報が得られたとき,他方も表(つまり 両方表)である確率はいくらか. 【解説】 Ω = {(0, 0), (0, 1), (1, 0), (1, 1)}, P (A) = ♯A/♯Ω で 考 え る の が 自 然 だ ろ う .A = {(1, 1)} =「両方表」, B ={(0, 1), (1, 0), (1, 1)} =「少なくとも一方は表」とすると P (A| B) = P (A∩ B) P (B) = 1/4 3/4 = 1 3. 従って,コインを 2 枚同時に投げて一方が表だとわかれば他方は裏である確率の方が高い. \(^o^)/ 注2.4. この例で大事なのはどちらのコインが表なのかはわからないところである.コインを2回 独立に投げる場合,1回目に表が出たとして2回目に表の出る確率は相変わらず 1/2である.

(19)

2.1 条件付き確率(conditional probability) 19 似て非なる例をもう一つ挙げておこう. 2.5. 3枚のカードがあり,1枚は両面赤色,1枚は両面白色,もう1枚は片面赤色でもう片面 が白色である.3枚から1枚引いて机上に置いたら上面は赤色だった.裏も赤色である確率はいく らか. 【解説】 3 枚 の カ ー ド を X (両 面 赤), Y (両 面 白), Z (赤 白) と す る と 最 初 の カ ー ド の 置 き 方 は Ω = {XR1, XR2, Y W 1, Y W 2, ZR, ZW } の 6 通 り .上 面 が 赤 に な る 事 象 を A = {XR1, XR2, ZR}, 裏面も赤(そうなるのは両面赤のカードのどちらかの面を上に置く場合だか ら)をB ={XR1, XR2}とすれば求める確率はP (B| A) = P (A∩ B) P (A) = 2/6 3/6 = 2 3. \(^o^)/ 次の問題は形式的なものだが,問題1.20と同様で,意味を考えることなく形式的に計算できることも それはそれで重要である. 問題2.6. P (A) = 1 2, P (B) = 1 3, P (A∩ B) = 1 4 のとき次の値を求めよ. (1) P (A∪ B) (2) P (A| B) (3) P (B| A) (4) P (A| B) 【解説】 (1) P (A∪ B) = P (A) + P (B) − P (A ∩ B) = 7 12 (2) P (A| B) = P (A∩ B) P (B) = 1/4 1/3 = 3 4 (3) P (B | A) = P (A∩ B) P (A) = 1/4 1/2 = 1 2 (4) P (A| B) = 1 − P (A | B) = 1 4 \(^o^)/ 条件付き確率を用いた計算の基本テクニックを挙げておく.まず,条件付き確率の定義式(2.1)の分 母を払えばP (A∩ B) = P (A | B)P (B) となるが,A∩ BA, B に関して対称(A∩ B = B ∩ A) なので P (A∩ B) = P (B ∩ A) であり, A, B を入れ換えた P (B∩ A) = P (B | A)P (A) も成り 立つ. 定理 2.7 (乗法定理). P (A), P (B)̸= 0 のとき次が成り立つ. P (A∩ B) = P (A | B)P (B) = P (B | A)P (A) こんなものを定理というのは大袈裟だが,乗法定理と書いてある本が多いのでそれに倣っておく. P (A∩ B)AB が共に起こる確率(同時確率あるいは結合確率 (joint probability)と言う) で,それはまずB が起こってからさらに Aも起こる確率P (A| B)P (B),あるいはAB の順を変 えてP (B| A)P (A)でも計算できる,ということである. 次もよく使う計算テクニックだが,これは要するに場合分けである.(確率論とは関係なく)一般に 集合A, B に対して A = (A∩ B) ∪ (A ∩ B), (A ∩ B) ∩ (A ∩ B) = ∅ が成り立つので,確率の性質と乗法定理から P (A) = P (A∩ B) + P (A ∩ B) = P (A| B)P (B) + P (A | B)P (B) が成り立つ.A が起こるのは,B が起こってさらに Aも起こるか, B は起こらないがA は起こる か,のどちらかである.これを一般化して次のことが言える.(これもほとんど当り前の性質なので個 人的には定理とも公式とも言いたくはない.「全確率の公式」などと呼ぶ場合もあるが,それよりは「場 合分け公式」とか「分割定理」などの方が適していると思う.)

(20)

20 2 条件付き確率と事象の独立性 定理 2.8. S1, S2, . . . , Sn は互いに排反でΩ = ni=1 Si を満たすとする.(このような{Si}ni=1 を Ωの分割と呼ぶことにする.)このとき P (A) = ni=1 P (A| Si)P (Si) が成り立つ. 2.9 (くじ引きに順番は関係ないのか). N 本中r 本当りのくじがあり,これを二人が順番に1 本ずつ引くとする.次の条件で,一人目が当たる確率と二人目が当たる確率を求めよ. (1)一人目が引いたくじを元に戻す(復元抽出) (2)一人目が引いたくじは戻さない(非復 元抽出) 【解説】 A =「一人目が当たる」, B =「二人目が当たる」とする. (1)一人目が引いたくじを戻すのだから条件は同じでP (A) = P (B) = r N. (2)一人目は同じくP (A) = r N であり,P (A) = 1− P (A) = N− r N . 二人目は,一人目が当 たるかどうかで場合分けすることができて

P (B) = P (B| A)P (A) + P (B | A)P (A)

= r− 1 N− 1 r N + r N− 1 N− r N = r(N− 1) N (N− 1) = r N となるので,やはりP (A) = P (B) = r N である. \(^o^)/ (2)の答に納得しない人は多いが,当たる確率だけなら先に引こうが後に引こうが同じである. どうしても納得できない人は 例2.15を見ればよいだろう. 2.10 (答えにくいアンケートに素直に答えてもらうには). 有名な例.アンケートでいきなり 「貴方は違法行為をしてしまったことがありますか」と聞いて全員が素直に回答してくれるとは思 えないので次のように聞いた結果「はい」が30%,「いいえ」が70%だった.実際に経験がある 人は何%か? 最初にコインを(見えないところで)1回投げて表が出たら正直に答えて下さい. 裏だった時はもう一度コインを投げて表なら「はい」裏なら「いいえ」と回答して下さい. これであなたの回答が本当か嘘かは私には断定できません. 【解説】 実際の経験率をθ,コインの表裏の確率は 1/2とすれば,P (はい|) = θ, P (いいえ| 表) = 1− θ, P (はい|) = P (いいえ|) = 1/2ということなので P (はい) = P (はい|)P () + P (はい|)P (裏) = θ·1 2 + 1 2· 1 2 = θ 2 + 1 4. ゆえにθ = 2P (はい)− 1/2 = 1/10で10%. (ついでに,θ < 1/2のときθ < P (はい), θ > 1/2 のときP (はい) < θであることもわかる.) \(^o^)/

2.2

独立性

(independence)

(21)

2.2 独立性(independence) 21 定義 2.11 (事象の独立性). 二つの事象A, B ⊂ Ωが以下の条件を満たすとき,独立 (indepen-dent) であるという. P (A∩ B) = P (A)P (B) この定義だけでは意味を掴み難いので,以下の同値な条件や例を通して理解していく. 定理 2.12 (独立性と同値な条件). A, B ⊂ Ωが独立であることと,以下の各条件は互いに同値で ある. (1) P (A| B) = P (A). (2) P (B| A) = P (B). (3) P (A| B) = P (A | B). (4) A, B が独立. 各条件の意味を考えよう.(1)ではB の発生という条件がA の生起確率に影響していない.(2)では 逆にAの発生が B の生起確率に影響していない.そして(3)ではB が起こるか起こらないかがA生起確率に影響していない.総合すると,生起確率の値に影響を与えるか否かという意味でA B 互いに無干渉,つまり独立という定義になっている.(4)はおまけだが,当然の性質として確認してお こう. 証明. “独立”⇐⇒(1),(2): P (A ∩ B) = P (A)P (B) な ら ば 両 辺 を P (B) で 割 れ ば P (A | B) = P (A∩ B) P (B) = P (A). 逆に P (A | B) = P (A) ならば乗法定理から P (A∩ B) = P (A | B)P (B) = P (A)P (B)となり独立.独立の定義はAB について対称なので,(1)でAB を入れ換えた(2) とも同値である. (1)⇐⇒(3): (1)が成り立つときP (A| B) = P (A)の右辺を“場合分け”すると P (A| B) = P (A) = P (A | B)P (B) + P (A | B)P (B) だが,右辺第1項を移項すると P (A| B)(1 − P (B)) = P (A | B)P (B) = P (A | B)P (B) なのでP (B)で割れば(3)を得る.逆に(3)のとき P (A) = P (A| B)P (B) + P (A | B)P (B) = P (A | B)P (B) + P (A | B)P (B) = P (A| B)(P (B) + P (B)) = P (A | B) で(1)が従う.ゆえに(1)⇐⇒(3) “独立”⇐⇒(4): P (A ∩ B) = P (A)P (B) との同値性を確認するために,両辺をそれぞれ計算す ると左辺は P (A∩ B) = P (A ∪ B) = 1 − P (A ∪ B) = 1 − (P (A) + P (B) − P (A ∩ B)), 右辺は

P (A)P (B) = (1−P (A))(1−P (B)) = 1−P (A)−P (B)+P (A)P (B)なので,P (A∩B) = P (A)P (B)

P (A∩ B) = P (A)P (B)は同値である.

以上より,各条件それぞれが独立性と同値であることが示された. \(^o^)/

2.13. トランプ(ジョーカーなし)を1枚引くことを考える.

標本空間はΩ ={S(スペード)A, S2, S3,· · · , SK, · · · , C(クローバー)K},確率測度はP (A) =

♯A/♯Ωとする.

(22)

22 2 条件付き確率と事象の独立性 「ハートを引く」という事象を考えると P (A∩ H) = 1 52, P (A)P (H) = 4 52 × 13 52 = 1 52 と なりP (A∩ H) = P (A)P (H)なのでAH は独立である. 注2.14. この例が当たり前でつまらないと思う人はジョーカーが入るとどうなるか考えてみよう. ジョーカーが1枚入れば♯Ω = 53 となるからP (A) = 4 53, P (H) = 13 53, P (A∩ H) = 1 53 となり P (A∩ H) ̸= P (A)P (H)だからA, H は独立ではない.実はかなりデリケートなのである. 例2.15.2.9で,(1)の場合ABは独立だが,(2)の場合はP (B| A) = r− 1 N− 1 ̸= r N = P (B) だから独立ではない.当たりが1本しかない場合,一人目に引かれてしまったらもう二人目に可能 性はないのだから当然である. 例2.9 の解答に違和感を感じる人もこれで納得するのではないだ ろうか. ところで,もしN が非常に大きければ, r N r− 1 N− 1 だから近似的には P (B) = P (B| A)が 成り立って,AB は独立と見做せるだろう.後ほど解説する標本調査の理論では,母集団が大 きければ非復元抽出も復元抽出も変わらないとして,復元抽出でしか成り立たない独立性を仮定し i.i.d. を用いて話を進める(6.1節参照)が,そうしても構わないとする根拠の一つはここにある. 2.16. 独立と排反は全く異なる概念(性質)なのだが,違いがわかっていない人もいるらしい ので注意しておこう.ネットを検索すると「独立は試行に対して使う言葉で排反は事象に対して使 う言葉だ」などという変な解説も出てくるがa,そんなことはない. 排反というのは事象(集合)として被りがなく同時に起こることはないということでわかりやす いと思うが,独立性は実際にはかなり難しい概念である. なお,次のことは成り立つので,異なる概念だが無関係ではない.(こんなことを書くから混乱 するんだ,とか言われそうだが.)正の確率をもつ二つの事象A, B が排反ならば P (A∩ B) = P (∅) = 0P (A)P (B)̸= 0と一致しないので,排反なら独立ではないし,対偶をとれば独立な ら排反ではない.(例2.13でも確かに,AH は独立だが排反ではない.) a原因の一つは「独立 排反」でググると出てくる某大手通信教育講座の解説ページだろう.高校と大学で用語や定義 が違うことはよくあるし,生徒にはそういう方がわかりやすいこともあろうから全否定はしないが,しかし困ったも のである. 問題2.17. P (A) = 1 3, P (A∪ B) = 1 2 とする.次の各場合に P (B)を求めよ. (1) A, B は独立 (2) A, B は排反 (3) P (A| B) = 1 4 (4) P (B| A) = 1 5 【解説】 (1)加法定理と独立性から P (A∪ B) = P (A) + P (B) − P (A ∩ B) = P (A) + P (B) − P (A)P (B)なのでP (B) について解くとP (B) = 1 4. (2)排反ならP (A∩ B) = 0なのでP (B) = P (A∪ B) − P (A) =1 6. (3) 乗法定理から P (A∩ B) = P (A | B)P (B) = P (B) 4 . 一方,加法定理から P (A∩ B) = P (A) + P (B)− P (A ∪ B). これらが等しいと置いてP (B) について解けばP (B) = 2 9. (4)は(3)と同様にすればP (B) = 7 30. \(^o^)/ このノートで次の定義を明確に使うことはないが,理論的には大事なことなので言及はしてお こう.

(23)

2.2 独立性(independence) 23 定義 2.18 (三つ以上の事象の独立性). n個の事象A1, A2, . . . , Anは以下の条件を満たすとき独 立であるという: 1, 2, . . . , nの任意の部分列1≤ i1< i2<· · · < ik ≤ nに対して P (Ai1∩ Ai2∩ · · · ∩ Aik) = P (Ai1)P (Ai2)× · · · × P (Aik) 複雑な定義になっているだけあって,三つ以上の事象の独立性については注意点が多い.一般に二つの 事象が独立であることより三つの事象が独立であることの方が強い条件であり,三つより四つ,四つよ り五つ…と数が増えるだけ強くなるのは,現実社会でも関係者が増えるだけ話が複雑になるのに似てい るような気もする.単純なものではないようだ,ということを知るだけでもとりあえずはいいだろう. 統計の教科書で世論調査などを考えるとき,調査対象者の回答は全て独立だと仮定して理論を組み立 てる.しかしその仮定の妥当性は別途検証すべき問題であることを忘れてはいけない.あまり難しく考 えても進まないので普段は気にしなくてよいが,しかし確率論の独立性はかなり強い条件であることは 知っておこう. 2.19. Ω ={1, 2, 3, 4}, P (A) = ♯A/♯Ωとする.A ={1, 2}, B = {1, 3}, C = {2, 3} とすると P (A) = P (B) = P (C) =1 2. P (A∩ B) = P ({1}) = 1 4 = 1 2× 1 2 = P (A)P (B) P (A∩ C) = P ({2}) = 1 4 = 1 2× 1 2 = P (A)P (C) P (B∩ C) = P ({3}) = 1 4 = 1 2× 1 2 = P (B)P (C) なので,ABAC はそして BC はそれぞれ独立である.(これをペアごとに独立 (independent pairwisely) という.)しかし P (A∩ B ∩ C) = P (∅) = 0 P (A)P (B)P (C) = 1 2 × 1 2 × 1 2 = 1 8 よりP (A∩ B ∩ C) ̸= P (A)P (B)P (C) なので,A, B, C は独立ではない.つまりペアごとに独 立でも全体が独立とは限らない. 2.20. 定義の「任意の部分列…」は分かり難く,「二つのときがP (A∩ B) = P (A)P (B)だっ たら三つのときはP (A∩ B ∩ C) = P (A)P (B)P (C)を定義にすればいいじゃないか」と思うかも しれないが,残念ながらそうはいかない.P (A∩ B ∩ C) = P (A)P (B)P (C)であっても A, B, C がペアごとに独立であるとは限らない.(従って独立であるとも限らない.) これも人工的な例だが Ω = {1, 2, 3, 4}, P ({1}) = 1 2 1 4, P ({2}) = 3 4 1 2, P ({3}) = P ({4}) = 1 4 を考え(歪んだ4 面サイコロだと思えばいい), A = {1, 2}, B = {2, 3}, C = {2, 4}とすると P (A) = 1 2, P (B) = P (C) = 1− 1 2. P (A∩ B ∩ C) = P ({2}) = 3 4 1 2, P (A)P (B)P (C) = 1 2 ( 1−√1 2 )2 = 3 4 1 2 なのでP (A∩ B ∩ C) = P (A)P (B)P (C). しかし P (A∩ B) ̸= P (A)P (B), P (A ∩ C) ̸= P (A)P (C), P (B ∩ C) ̸= P (B)P (C)でありどの二つの組 み合わせも独立ではない. 補足2.21. 上の例は次のように作っている.P ({1}) = P ({2}) = P ({3}) = P ({4}) = 1 4 から少

参照

関連したドキュメント

[r]

【A2】 ROV 北回りル ートから ペデスタ

【A2】 ROV 北回りル ートから ペデスタ

【A2】 ROV 北回りル ートから ペデスタ

【A2】 ROV 北回りル ートから ペデスタ

添付資料 2.7.3 解析コード及び解析条件の不確かさの影響評価について (インターフェイスシステム LOCA).. 添付資料 2.7.4

自動車の走行に伴う道路交通騒音(L Aeq )の予測手順は、図 6.4-9に示す手順に従って 行った。. 図 6.4-9 道路交通の騒音レベルの予測手順

- 復水移送ポンプ フィルタ装置 よう素フィルタ ラプチャーディスク ドレン移送ポンプ ドレンタンク 遠隔手動弁操作設備 フィルタベント遮蔽壁 配管遮蔽 復水貯蔵槽