中心極限定理 - 1 確率論の基礎

本題に戻る．今までの「大数の法則」では，S_N がその平均値の周りに集中していくことを見た．そこで，集中していくとしたら，その集中の幅はどのくらいか，またその行った先はどうなっているのか，に答えるのが中心極限定理である．

定理 2.6.1 (中心極限定理，Central Limit Theorem, CLT) X_i（i= 1,2, . . .）を独立，かつ同分布な確率変数とし，その平均と，分散の平方根をそれぞれ

µ≡E[X_i], σ ≡Var[X_i] (2.6.1)

とする．このとき，

S_N ≡^N

i=1

X_i, Z_N ≡ 1 σ√

N i=1

X_i−µ= S_N − S_N σ√

N (2.6.2)

を定義すると，任意のa < b に対して

N→∞lim P

a≤Z_N ≤b

e^−x²^/²

√2π dx (2.6.3)

が成り立つ．

右辺に出てきた分布を「正規分布」（normal distribution）と言う．今までの言葉では，上の定理はZ_N は正規分布に法則収束するとまとめられる．通常，正規分布の累積分布関数を

Φ(x)≡ ^x

−∞

e^−y²^/²

√2π dy (2.6.4)

と書く．以下に 1−Φ(x) =

_∞

e^−y²^/²

√2π dy のいくつかの値を載せておく⁴：

x 0 1 1.645 1.960 2 2.326 2.576 3 4

1−Φ(x) ¹₂ 0.1587 ₂₀¹ ₄₀¹ 0.02275 ₁₀₀¹ ₂₀₀¹ 1.350×10⁻³ 3.167×10⁻⁵ 上の定理の主張をもう少し述べておく．S_N や S_N −N µ 自身は N 個のものの和だから，N が大きくなると（普通は）大きくなる．けれども，S_N−N µの大きくなり方は N に比例するのではなく，√

N に比例する，と言うのが一つの主張．更に，S_N−N µ を√

N で割ることによってZ_N を定義することで，N → ∞でも（大抵は）有限にとどまるような量を定義できる，と言うのがもう一つの主張．更に詳しく，定理は，このZ_N が「正規分布」に近づいていくことを主張している．

2.6.1 中心極限定理の（特殊な場合についての）証明

中心極限定理そのものは上に書いたとおりに非常に一般に成り立つ．しかし，その証明にはいくつかの道具が必要である．そこで，まず，非常に特殊な場合に具体的な計算をする事で，この特殊な場合には実際に定理が成立していることを確かめることにも意味がある（それでもかなり大変なので，細かいところの厳密性ははしょってある）．その後で一般的な場合の証明を行うことにする．なお，この証明自身にはそんなに意味はないが，先週の「自主的に行う問題」の解答を兼ねてこのレジュメに載せることにした．

具体的には X_i が（0< p <1）

X_i=





0 （確率 1−p で）

1 （確率 p で）

(2.6.5)

4この積分は特殊なxの値に対して以外は，陽には計算できない．以下の表は数値計算によるものである

となっている場合のみを考える（「自主的に考える問題」の状況にあわせるにはp= ¹₃ とした上で，Y_i=−2 + 3X_i なるY_i を考えればよい）．この場合，

µ=p, σ² = Var[X₁] =p(1−p) (2.6.6) となっている．

Step 1. さて，問題になっている確率を書き直すところから始めよう．今，確率変数の数 N を

固定し，N 個の X_i のうちで m 個の値が 1 である確率を考えると，これは p_N,m ≡

N m

p^m(1−p)^N−m (2.6.7)

である．またこのとき，Z_N と m の間には Z_N ≡ 1

σ√ N

N i=1

X_i−µ= m−N p σ√

N (2.6.8)

の関係がある．よって，問題になる確率をm に対する条件を用いて計算すると P[a ≤Z_N ≤b] =P[N p+aσ√

N ≤m≤N p+bσ√

N] =

Np+aσ√

N≤m≤Np+bσ√ N

N m

p^m(1−p)^N−m (2.6.9) と言うことになる．この右辺に対して N → ∞ の極限が計算できればよい．そこで，右辺に出てきている確率を計算することにする．

Step 2. そのためにはまず，二項係数を計算する必要があるが，それには Stirling の公式

n!∼√

2π nⁿ⁺¹^/²e⁻ⁿ （n → ∞で） (2.6.10) を用いる．n→ ∞で成り立つ式を有限の n で使うには誤差の評価が必要である．しかし，この公式は小さなn でも異常に正確（n = 2 での相対誤差は4.05%，n = 3なら 2.73%）なので，あたかも等式であるかのように進めて行く．さて，N → ∞では (2.6.9)の和に出てくる m についてはm も，N −m も，共に無限大になる．そこでStirling の公式が使えて，

N m

= N!

m! (N−m)! ≈ 1

√2π

N m(N −m)

₁_/₂

N^N

m^m(N −m)^N^−m (2.6.11) これを更に変形しないといけないが，N → ∞で何が起こるかを見やすくするために，今興味のあるmを m=N p+√

N と書くことにする（(2.6.9)の和に出てくるm に対しては，aσ ≤≤bσ である）．すると（q= 1−pと書く），

N m

≈ 1

√2πN

√N

₋₁_/₂_−Np−^√_N

q−

√N

₋₁_/₂_−Nq₊^√_N

(2.6.12)

となるので，(2.6.11)は

N m

p^mq^N^−m≈ 1

√2πN

√N

₋₁_/₂_−Np−^√_N

q−

√N

₋₁_/₂_−Nq₊^√_N

×p^Np⁺

√Nq^Nq−

√N

= 1

√2πN pq

1 +

√N p

₋₁_/₂_−Np−^√_N

1−

√N q

₋₁_/₂_−Nq₊^√_N

= 1

√2πN pq

1 +

√N p

₋₁_/₂

1−

√N q

₋₁_/₂

×1 +

√N p

_−Np

1−

√N q

_−Nq

×1 +

√N p

₋^√_N

1−

√N q

₊^√_N

(2.6.13)

となる．

Step 3. さて，上の第一行は N → ∞ で 1/√

2πN pq に行く．また，最後の２つは

N→∞lim

1 + x N

=e^x (2.6.14)

から，

1 +

√N p

₋^√_N

1−

√N q

₊^√_N

N→∞−→ e⁻²^/p×e⁻²^/q = exp

−² p − ²

(2.6.15)

となる．真ん中の二つはちょっと厄介なので，log をとってみると，

log

1 +

√N p

_−Np

1−

√N q

_−Nq

=−N p log

1 +

√N p

−N q log

1−

√N q

≈ −N p

√N p− 1 2

√N p

₂

−N q

−

√N q − 1 2

√N q

₂

= ² 2

1 p +1

(2.6.16)

となるから，

1 +

√N p

_−Np

1−

√N q

_−Nq

≈exp

² 2p+ ²

(2.6.17)

が結論できる．

Step 4. 以上から m=N p+√

N に対して，

P[Z_N =/σ] =

N m

p^mq^N−m ≈ 1

√2πN pq ×exp

² 2p+ ²

×exp

−² p − ²

= 1

√2πN σ exp

−² 2

1 p+ 1

(2.6.18)

となることがわかった（最後のところではσ =√pq であることを用いた）．/σ ≡z と書くと，

P[Z_N =z]≈ 1

√2πN σ exp

−σ²z² 2

1 p+ 1

= 1

√2πN σ exp

−z² 2

(2.6.19)

となる．ただし，上の式が意味を持つには，z が許される値（つまり，S_N =N p+σ√

N z が整数になるように）をとることが必要である．

Step 5. これで漸く，(2.6.9)に戻ることができる．問題の確率は P[a≤Z_N ≤b] =P[a≤z ≤b]≈

√ 1

2πN σ exp

−z² 2

(2.6.20)

なのだ．ただし，z の和は，S_N =N p+σ√

N z が整数になるような z のみをとる．さて，そのようなz は，_σ^√¹_N 毎に分布している．そこで上のを以下のように書いてみると，結果は積分のリーマン和の形になる：

P[a≤Z_N ≤b]≈ 1

√2π

1 σ√

N exp

−z² 2

≈ 1

√2π

a exp

−z² 2

dz. (2.6.21) と言うわけで定理が「証明」された．

少しおまけ：上の計算をグラフにしてみたのが以下の図である．図では正規分布の分布密度関数（実線）と，p= 1/3に相当する二項分布を規格化したもの（いくつかの点）を N = 4（左上），N = 16 （右上），N = 64 （左下）， N = 256 （右下）の場合についてそれぞれ描いた．

より正確には，「自主的に計算してみる問題」の場合を考え，

S_N ≡^N

j=1

X_j, Z_N ≡ S_N

√2N (2.6.22)

として定義したZ_N を横軸に，また，

P[Z_N =z]×

√2N

3 (2.6.23)

なる量を縦軸にとったものを描いている．N が増えて行くにつれ，正規分布に近づいている様子がわかる．

0.1 0.2 0.3 0.4

–4 –3 –2 –1 1 2 3 4

0.1 0.2 0.3 0.4

–4 –3 –2 –1 1 2 3 4

0 0.1 0.2 0.3 0.4

–4 –3 –2 –1 1 2 3 4 0

0.1 0.2 0.3 0.4

–4 –3 –2 –1 1 2 3 4

ドキュメント内 1 確率論の基礎 (ページ 34-39)