幾何分布 (geometric distribution) - 数理統計学Iノート

A.5 ^幾何分布(geometric distribution) 107

108 A ^{代表的な確率分布}

定義 A.37. 0< θ≤1は定数とする．自然数の値をとる確率変数T の質量関数が p(k) = (1−θ)^k⁻¹θ (k= 1,2, . . .)

で与えられるとき， T は幾何分布 (geometric distribution) に従うといい，T ∼Ge(θ) と書くことにする．

累積分布関数は等比数列の和なので簡単に求まって

F(n) =P(T ≤n) =

∑n k=1

(1−θ)^k⁻¹θ=θ· 1−(1−θ)ⁿ

1−(1−θ) = 1−(1−θ)ⁿ.

期待値と分散は次のようになる．期待値は直感とも合うし，θ= 1 のときに分散が0 になるのも意味を考えれば自然である．

命題A.38. T ∼Ge(θ)の期待値と分散はE[T] = 1

θ, V[T] = 1−θ θ² .

証明. 方法はいくつも知られているが，ここでは微積の羃級数の知識を使って直接計算する．1−θ=r とおくと0≤r <1 であり，期待値は

E[T] =

∑∞ k=1

kr^k⁻¹θ=θ

∑∞ k=1

kr^k⁻¹.

ここで羃級数

∑∞ k=1

r^k を考えると，その収束半径は1 で

∑∞ k=1

r^k = 1

1−r ^{なので両辺を}r で微分すれば左辺は項別微分できるから(★)

∑∞ k=1

kr^k⁻¹= d dr

( 1 1−r

)

= 1

(1−r)² ^{を得る．ゆえに}

E[T] =θ

∑∞ k=1

kr^k⁻¹=θ· 1

(1−(1−θ))² = 1 θ

分散は，式(★)の両辺にrをかけてからrで微分すれば

∑∞ k=1

k²r^k⁻¹= d dr

( r (1−r)²

)

= 1 +r (1−r)³ ^なので

V[T] =E[T²]−(E[T])²=θ

∑∞ k=1

k²r^k⁻¹− 1 θ²

=θ 1 + (1−θ) (1−(1−θ))³ − 1

θ² =1−θ

θ² \(^o^)/

注A.39. これは指数分布にも共通することだが，発生間隔が幾何分布に従うとして，期待値分だ

け待てばそろそろ起こると期待するかもしれないが，その確率はそれほど高くはない．

期待値をµ=E[T] = 1/θ とすると，待ち時間がµ以内ですむ確率は累積分布関数から P(T ≤µ) = 1−(1−θ)^µ= 1−(1−θ)^1/θ

と求まり，そのグラフは次のようになる．

A.5 ^幾何分布(geometric distribution) 109

θ (1−θ)^1/θ

0 1

1/e

1/2 1/4

例えばθ= 1

2 ^のときはP(T ≤µ) = 3

4 ^で75%の確率だが，最悪のケースを見積ってθ→0 とすれば lim

θ→0

(

1−(1−θ)^1/θ )

= 1−1

e = 0.632· · · ^なので6割強の確率しかない．

期待値の2倍待てば P(T ≤2µ) = 1−(1−θ)^2µ= 1−(1−θ)^2/θ なので，θ= 1

2 ^のときは 15

16= 0.9375となるが，θ→0 では lim

θ→0P(X ≤2µ) = 0.864· · · ^でまだ9割にも満たない．3倍待てば lim

θ→0P(T ≤3µ) = 1−1/e³= 0.9502· · · となって最悪ケースでも95%を越える．

次の性質も，いかにもランダムな現象の発生間隔らしい性質で無記憶性と呼ばれる．

命題 A.40 (幾何分布の無記憶性). 任意の自然数 m, n に対して P(T > n+m | T > m) = P(T > n).

証明. 累積分布関数がF(n) =P(T ≤n) = 1−(1−θ)ⁿ なのでP(T > n) = 1−F(n) = (1−θ)ⁿ である．m, nが自然数なので当然T > n+m=⇒T > m,つまり事象としては{T > n+m} ⊂ {T > m} なので{T > n+m} ∩ {T > m}={T > n+m}. 従って

P(T > n+m|T > m) = P({T > n+m} ∩ {T > m})

P({T > m}) =P({T > n+m}) P({T > m})

= (1−θ)^n+m

(1−θ)^m = (1−θ)ⁿ=P(T > n) \(^o^)/

くじ引き（復元抽出）なら，m 回続けて外れた状態でさらにn回以上外れる確率は，過去の出来事をリセットして初期状態から始めてn回以上外れる確率と何ら変わらない．独立性を仮定する限り，負けが込んだ分だけ運気が貯まってすぐに大逆転などという確率変動はないのである．なお，無記憶性をもつのは本質的に幾何分布（離散型）と指数分布（連続型）のみである．

幾何分布に関して有名な例題を一つ挙げておく．

問題A.41 (コレクター問題). n種類の景品が当るくじ（スマホゲームのガチャなど）がある．景品を全種類集めるまでくじを引く場合，必要な回数の期待値はいくらか求めよ．ただし

• 1回のくじ引きでどれか1種類の景品が1個貰えるが，どの景品が当るかは等確率つまり 1

n であり，また同じ景品が何度も当ることもあるとする．

• くじ引きの結果は毎回独立であるとする．

【解説】 k 種類持っている状態から新たに1種類ゲットするまでにかかる回数をXk とすれば，

P(Xk=m) = (k

)m−1( 1− k

n )

なのでXk ∼Ge(1−k/n)でありE[Xk] = 1

1−k/n= n n−k. ゆえに求める期待値は

E[X₀+X₁+· · ·+X_n₋₁] =

n−1

∑

m=0

n n−k =n

( 1 + 1

2+· · ·+1 n

)

\(^o^)/

110 A ^{代表的な確率分布}

ドキュメント内数理統計学Iノート (ページ 107-110)