X1, X2, . . . , Xk, . . . はベルヌーイ過程とする.新たに Sn=
∑n k=1
Xk (A.1)
という確率変数を考えよう.コイン投げを想定するなら n 回中表が出る回数を表す確率変数で ある.
A.2 二項分布(binomial distribution) 95
定義 A.4 (二項分布). Sn が従う確率分布を二項分布 (binomial distribution) といい,
B(n, θ) で表すことにする.また,確率変数X がB(n, θ)に従うことをX ∼B(n, θ)と書くこ とにする.(定義から明らかに, B(1, θ)はベルヌーイ分布である.)
高校数学では二項分布は最も重要な確率分布という位置付けだっただろう.大学で進んだ内容を勉強 すると他にも重要な分布が登場し,二項分布が最重要とまでは言えなくなるが,それでもかなり重要な ものであることには違いない.「たかがコイン投げの確率が?」と思うかもしれないが,たかがコイン 投げには現代確率論のエッセンスが相当に詰まっている.
早速だが質量関数を求めよう.
定理 A.5. B(n, θ)の質量関数は
p(k) = {
nCkθk(1−θ)n−k k= 0,1, . . . , n−1, n
0 それ以外
(A.2)
ここでnCk は二項係数 nCk= n!
k! (n−k)! であり,n個のものの中から重複せず k個のものを 選ぶ組合わせの数,である.
証明. 0≤Xk≤1 より0≤Sn ≤nだからk <0, n+ 1< kなるk に対してP(Sn=k) = 0 なのは 明らかであり,
P(Sn =k) =nCkθk(1−θ)n−k k= 0,1, . . . , n−1, n を確認すればよい.
Xk は0 か1 の値しかとらないので,Sn =kはX1, X2, . . . , Xn のうち丁度k個が1 をとるとい う事象である.これは,ik= 0,1 でk 回目にどちらが出るかを表すことにすれば,
X1=i1, X2=i2, . . . , Xn=in (ただしi1+· · ·+in=k) と書けるので*45,
P(Sn=k) = ∑
i1+···+in=k
P(X1=i1, . . . , Xn =in)
(i1+· · ·+in=kとなる全組合せについての和)
= ∑
i1+···+in=k
P(X1=i1)× · · · ×P(Xn =in) (独立性から)
= ∑
i1+···+in=k
θi1(1−θ)1−i1× · · · ×θin(1−θ)1−in
= ∑
i1+···+in=k
θi1+···+in(1−θ)n−(i1+···+in) (指数を整理)
= ∑
i1+···+in=k
θk(1−θ)n−k (和の範囲でi1+· · ·+in=kは定数)
=nCkθk(1−θ)n−k (i1+· · ·+in=kとなる組合せはnCk 通り)
\(^o^)/
期待値と分散は次のとおり.
*45すぐには解らなければ,例えばn= 3, k= 1ではi1, i2, i3にどんな組合せがあり,k= 2ではどうなるか,などを具体 的に考えてみるとよい.
96 A 代表的な確率分布
命題A.6. X ∼B(n, θ)のとき E[X] =nθ, V[X] =nθ(1−θ).
証明. E[Sn] と V[Sn] を計算すればよい.期待値の性質 E[X +Y] = E[X] +E[Y] (定理 4.14) と,独立な確率変数X, Y に対しては V[X+Y] =V[X] +V[Y] が成り立つこと(定理5.4)から,
E[Xk] =θ, V[Xk] =θ(1−θ)と合わせると E[X] =E[Sn] =E[∑
Xk ]
=∑
E[Xk] =nθ V[X] =V[Sn] =V [∑
Xk ]
=∑
V[Xk] =nθ(1−θ) \(^o^)/
次の問は計算訓練用の自習課題とする.
問題A.7. B(n, θ)の期待値と分散をSn からではなく,質量関数(A.2)と期待値・分散の定義か ら直接計算して求めよ.
次の性質も大事である.
命題A.8(二項分布の再生性). X ∼B(m, θ),Y ∼B(n, θ)が独立ならばX+Y ∼B(m+n, θ).
この性質を分布の再生性 (reproductivity) という.
解釈. ベルヌーイ過程 {Xk} から m 個取り出して足したものの分布が B(m, θ), 別の n個を取り出 して足したものの分布が B(n, θ) なので,合算したものは m+n 個足したことになりその分布は
B(m+n, θ)である. \(^o^)/
分布に関係なく, X, Y が独立であればE[X+Y] =E[X] +E[Y],V[X+Y] =V[X] +V[Y] は 成り立つが,再生性を持つ場合は分布の形までも保存するということである.再生性はどんな分布に対 しても成り立つわけではなく(当然である),二項分布以外では正規分布,Poisson分布,ガンマ分布,
Cauchy分布などはこの性質を持つ.(正規分布やPoisson分布は二項分布の極限としても得られるの
で再生性を持つことにも納得しやすい.)
典型的な例題をいくつかみておこう.
問題 A.9. 当り確率1%のルーレットを10回まわすとき,(1)丁度2回当る(2)当りは高々1回
である(3) 3回以上当る確率をそれぞれ求めよ.
【解説】 当り回数をX とするとX ∼B(10,0.01)なので (1)P[X= 2] =p(2) =10C2(0.01)2(0.95)8≈0.004152351.
(2)P[X≤1] =p(0) +p(1) = (0.99)10+ 10(0.01)1(0.99)9≈0.9957338.
(3)P(X ≥3) = 1−P(X ≤2) = 1−(P[X ≤1] +P[X= 2])≈0.0001138491. \(^o^)/
問題A.10. コインを400回投げるとき表が180回以上220回以下出る確率を求めよ.
【解説】 こう書いてあるときは暗黙の了解としてθ= 1
2 (違うならそう書かなければならないだ ろう)として話を進めればよい.表が出る回数をX とするとX∼B(400,1/2)だから
P(180≤X ≤220) =FX(220)−FX(179)
=
∑220 k=180
400Ck
(1 2
)k( 1 2
)400−k
=
∑220 k=180
400Ck
(1 2
)400
≈0.9598