確率数理工学補足資料
大数の法則と中心極限定理
2020-6-19
鈴木大慈
e-mail: [email protected]
本資料では講義で扱えなかった大数の強法則や中心極限定理に関係するいくつかの定理を示す.なお,本資 料で「確率変数」といえばボレル可測実数値確率変数を表すものとする.1 大数の法則
(Ω, F , P )
を確率空間とする.事象の列A
n∈ F (n = 1, 2, . . . )
があったとして,これに含まれる事象が無限 に起きるかどうかを考察したい.lim sup
n→∞
A
n=
∩
∞ k=1∪
∞ n=kA
nを
A
nの上極限とすれば,ω ∈ lim sup
n→∞
A
n⇐⇒ ω
が無限個のA
nに属するがわかる.これは以下のようにして考えればよい.まず,
ω ∈ lim sup
nA
nなら,どんなに大きなk
を持って きても,k
以上のn
があってω ∈ A
n となる.よって,もしω
が有限個の{ A
n1, . . . , A
nM}
にのみ属するの なら,n > n
M であるすべてのn
でω / ∈ A
nとなるので矛盾する.結局,無限個のA
nに属していなくてはい けないことがわかる.このことから上極限を単純にA
ni.o.
と書くことも多い
(i.o.
はinfinitely often
の略)
.Borel-Cantelli
の補題はA
ni.o.
の確率を評価するのに有用な補題である.Lemma 1 (Borel-Cantelli
の補題).
1. ∑
∞n=1
P (A
n) < ∞
ならばP (
lim sup
n→∞
A
n)
= 0.
つまり,
P(A
ni.o.) = 0.
2.
事象(A
n)
∞n=1は独立で∑
∞n=1
P (A
n) = ∞
ならば,P (
lim sup
n→∞
A
n)
= 1
である.
2.
におけるA
n の独立性を外せない.例えば,コイン投げを無限回繰り返す試行を考えて,A
n は一回 目のコインが表であるという事象としよう.コインの表と裏が出る確率がそれぞれ1/2
の場合,P (A
n) = 1/2
である.よって,∑
∞n=1
P(A
n) = ∞
であるが,A
1= A
2= A
3= · · ·
よりlim sup
nA
n= A
1で,P (lim sup
nA
n) = 1/2 ̸ = 1
である.Proof.
1.
任意のk
′に対して,上極限の定義と確率の劣加法性よりP(lim sup
n→∞
A
n) = P (
∩
∞ k=1∪
∞ n=kA
n) ≤ P(
∪
∞ n=k′A
n) ≤ ∑
∞n=k′
P(A
n)
である.ここで,
k
′は任意で,∑
∞n=1
P (A
n) < ∞
の仮定よりlim
k′→∞∑
∞n=k′
P (A
n) = 0
なので左辺は0
で ある.2.
まず,P ((
lim sup
n→∞
A
n)
c)
= P (
∞∪
k=1
( ∪
∞ n=kA
n)
c)
≤
∑
∞ k=1P (( ∪
∞n=k
A
n)
c)
に注意すると,任意の
k
に対してP (( ∪
∞n=k
A
n)
c) = 0
が示せれば良い.以下,これを示す.任意の
N > k
に対して,A
nらの独立性からP ( ∩
Nn=k
A
cn) = ∏
Nn=k
P (A
cn)
なので,P (( ∪
∞n=k
A
n)
c)
= 1 − P (
∞∪
n=k
A
n)
≤ 1 − P (
N∪
n=k
A
n)
= P (
(
∪
Nn=k
A
n)
c)
= P (
N∩
n=k
A
cn)
=
∏
Nn=k
P (A
cn) =
∏
Nn=k
(1 − P (A
n))
≤
∏
Nn=k
e
−P(An)= e
−∑Nn=kP(An)である.仮定から
∑
∞n=k
P(A
n) = ∞
が任意のk
に対して成り立つことを思い出すと,N → ∞
の極限を取 ることで,右辺→ 0
がわかる.ここから大数の強法則を示すが,そのためにいくつか準備をする.
Lemma 2 (Kronecker
の補題).
実数列(x
n)
∞n=1と∞
に発散する増加正数列(b
n)
∞n=1に対して,∑
∞ n=1x
nb
nが収束
= ⇒ 1 b
n∑
nk=1
x
k→ 0.
Proof. n = 0, 1, 2, . . . , ∞
に対し,s
0= 0, s
n=
∑
nk=1
x
kb
k→ s
∞ とおくと(仮定よりs
nの収束先があることに注意),x
n= b
n(s
n− s
n−1).
よって,
1 b
n∑
nk=1
x
k= 1 b
n∑
nk=1
b
k(s
k− s
k−1) = s
n− 1 b
n∑
nk=1
s
k−1(b
k− b
k−1) (1)
であるが,
b
k− b
k−1≥ 0,
∑
nk=1
(b
k− b
k−1) = b
n→ ∞ ,
に注意すると
| 1 b
n∑
nk=1
s
k−1(b
k− b
k−1) − s
∞|
= | 1 b
n∑
nk=1
s
k−1(b
k− b
k−1) − s
∞b
n∑
nk=1
(b
k− b
k−1) |
= | 1 b
n∑
nk=1
(s
k−1− s
∞)(b
k− b
k−1) |
≤ 1 b
n∑
nk=1
| s
k−1− s
∞| (b
k− b
k−1)
である.
s
n→ s
∞より,右辺は任意のϵ
に対して,十分大きなN
を| s
k− s
∞| ≤ ϵ ( ∀ k ≥ N )
を満たすよう にとってくることができて,0 ≤ 1 b
n∑
nk=1
| s
k−1− s
∞| (b
k− b
k−1)
= 1 b
n∑
nk=N+1
| s
k−1− s
∞| (b
k− b
k−1) + 1 b
n∑
Nk=1
| s
k−1− s
∞| (b
k− b
k−1)
≤ ϵ 1 b
n∑
nk=N+1
(b
k− b
k−1) + b
Nb
nmax
1≤k≤N
| s
k− s
∞|
n→∞→ ϵ
を得るので,n → ∞
で0
に収束することがわかる.よって,1 b
n∑
nk=1
s
k−1(b
k− b
k−1) → s
∞ である.また,s
n→ s
∞でもあるので,式(1)
よりn
lim
→∞1 b
n∑
nk=1
x
k= s
∞− s
∞= 0.
Lemma 3 (Kolmogorov
の不等式). (X
i)
ni=1を独立な確率変数列として,E[X
i] = 0, V
i= Var[X
i] < ∞
と する.このとき,任意のM > 0
に対して,P (
max
1≤k≤n
| X
1+ · · · + X
k| ≥ M )
≤ 1 M
2∑
ni=1
V
i.
Proof. Z
k= ∑
ki=1
X
iに対して,A = {
ω ∈ Ω | max
1≤k≤n
| Z
i| ≥ M }
とおく.この事象の確率を評価するために,
| Z
i|
をi
について動かすときにいつ初めてM
以上になるかに着 目する.すなわち,A
k= {
ω ∈ Ω | max
1≤i≤k−1
| Z
i| < M
かつ| Z
k| ≥ M }
とすると,
A
k(k = 1, . . . , n)
は多大に素で,A = ∪
nk=1
A
k と分解できる.ここで,事象A
k においてはZ
k≥ M
なので,P (A) =
∑
nk=1
P (A
k) ≤
∑
nk=1
1
M
2E[Z
k21
Ak]
である.ただし,
1
Akは1
Ak(ω) = 1 (ω ∈ A
k), 1
Ak(ω) = 0 (otherwise)
で与えられる関数である.ここで,実は
E[Z
k21
Ak] ≤ E[Z
n21
Ak]
が成り立つことを示そう.まず,E[Z
k21
Ak] − E[Z
n21
Ak] ≤ 2E[(Z
k− Z
n)Z
k1
Ak]
に注意する.Z
k− Z
n= ∑
ni=k+1
X
iなので,Z
k− Z
nは(X
k+1, . . . , X
n)
の関数であり,Z
k1
Akは(X
1, . . . , X
k)
の関数なので,(X
i)
ni=1らの独立性からZ
k− Z
nとZ
k1
Ak は独立である.よって,2E[(Z
k− Z
n)Z
k1
Ak] = 2E[(Z
k− Z
n)]E[Z
k1
Ak] = 0 ( ∵ E[Z
k] = E[Z
n] = 0)
が成り立ち,
E[Z
k21
Ak] ≤ E[Z
n21
Ak]
が示せた.以上より,
P(A) ≤
∑
nk=1
1
M
2E[Z
k21
Ak]
≤ 1 M
2∑
nk=1
E[Z
n21
Ak] = 1
M
2E[Z
n21
A] ≤ 1 M
2E[Z
n2]
= 1
M
2E[(X
1+ · · · + X
n)
2] = 1 M
2∑
ni=1
V
i.
Theorem 4 (Kolmogorov
の定理).
確率変数列(X
n)
∞n=1に対し,∑
∞n=1
E[X
n]
と∑
∞n=1
Var[X
n]
がともに 収束するなら,∑
∞n=1
X
nは有限な値に概収束する.Proof. ∑
∞n=1
E[X
n]
が収束することと,X
n= (X
n− E[X
n]) + E[X
n]
かつVar[X
n] = Var[X
n− E[X
n]]
で あることから,E[X
n] = 0
として良い.S
n=
∑
ni=1
X
i,
として,
V
i= Var[X
i]
とする.Kolmogorov
の不等式をX
n+1, X
n+2, . . . , X
n+mに適用して,P (
max
1≤k≤m
| S
n+k− S
n| ≥ ϵ )
≤ 1 ϵ
2∑
mk=1
V
n+kである.また,
1 ≤ k, l ≤ m
に対して,| S
n+k− S
n+l| ≤ | S
n+k− S
n| + | S
n− S
n+l|
なので,max
1≤k,l≤m
| S
n+k− S
n+l| ≤ 2 max
1≤k≤n
| S
n+k− S
n|
である.よって,P (
max
1≤k,l≤m
| S
n+k− S
n+l| ≥ 2ϵ )
≤ 1 ϵ
2∑
mk=1
V
n+k≤ 1 ϵ
2∑
∞ k=1V
n+kを得る.ここで,
{ max
1≤k,l≤m| S
n+k− S
n+l| ≥ 2ϵ }
なる事象はm
とともに増大するので,m
について極限 を取ることで,P (
sup
1≤k,l
| S
n+k− S
n+l| ≥ 2ϵ )
≤ 1 ϵ
2∑
∞ k=1V
n+kもわかる.一方,
{ max
1≤k,l| S
n+k− S
n+l| ≥ 2ϵ }
なる事象はn
とともに減少するので,n
について極限を取 ることでP (
n
lim
→∞sup
1≤k,l
| S
n+k− S
n+l| ≥ 2ϵ )
≤ 1 ϵ
2lim
n→∞
∑
∞ k=1V
n+k= 0
である.ただし,
∑
∞k=1
V
kが収束することを用いた.よって,ϵ → 0
とすることで,P (
n
lim
→∞sup
n≤m,m′
| S
m− S
m′| = 0 )
= 1
つまり,
(S
n)
∞n=1は確率1でコーシー列.コーシー列は有限の値に収束するので,これはある有限な値への概 収束を意味する.Theorem 5. (X
i)
∞i=1をE[X
i2] < ∞ ( ∀ i)
である独立な確率変数列とする.今,(b
i)
∞i=1を∞
に発散する増 加正数列とし,∑
∞ n=1Var[X
n] b
2n< ∞
を仮定する.すると,
∑
ni=1
(X
i− E[X
i])
b
n→ 0 (a.s.).
Proof. Y
n=
Xn−bE[Xn]n とすれば,
E[Y
n] = 0,
∑
∞ n=1Var[Y
n] =
∑
∞ n=1Var[X
n] b
2n< ∞
である.よって,Kolmogorov
の定理を(Y
n)
∞n=1に適用することで,∑
∞n=1
Y
n= ∑
∞n=1
Xn−E[Xn]
bn は確率1
で有限の値に概収束する.さらに,
Kronecker
の補題を適用すると b1n
∑
ni=1
(X
n− E[X
n])
は0
に概収束する ことがわかる.Corollary 6. (X
i)
∞i=1はE[X
i2] ≤ ∞ ( ∀ i)
かつE[X
i] = µ ( ∀ i)
である独立な確率変数列とする.すると,∑
∞ n=1Var[X
n] n
2< ∞
を満たせば,
∑
ni=1
X
in → µ (a.s.).
Proof. b
n= n
として定理5
を適用すれば良い.上の
Corollary
ではX
iらの2
次モーメントが有限であることを仮定したが,実は独立同一な列に対しては期待値の有限性のみに仮定を緩めることができる.
Theorem 7 (
大数の強法則). (X
i)
∞i=1は独立同一な確率変数で,その期待値E[X
1] = µ
は有限であるとす る.このとき,1 n
∑
ni=1
X
i→ µ (a.s.).
Proof.
任意のi = 1, 2, . . .
に対してE[X
i] = 0
を仮定しても一般性を失わない.X
iと同じ分布を持つ確率変 数をX
と書く.確率変数
Z
nをZ
n= {
X
n( | X
n| ≤ n) 0 (otherwise)
と定義する.すると,
∑
∞ n=1P (X
n̸ = Z
n) =
∑
∞ n=1P ( | X
n| > n) =
∑
∞ n=1P( | X | > n) ( ∵ X
nらはX
と同じ分布に従う)
≤
∫
∞0
P ( | X | > x)dx =
∫
∞0
E[1 {| X | > x } ]dx
= E [∫
∞0
1 {| X | > x } dx ]
= E[ | X | ] < ∞ .
よって,Borel-Cantelli
の補題より,P(X
n̸ = Z
ni.o.) = 0.
よって,
∑
n i=1Z
in → µ (a.s.)
が言えれば良い.一方で,
E[Z
n] = E[X1 {| X | ≥ n } ] → µ (n → ∞ )
なので,∑
n i=1E[Z
i]
n → µ
でもある.よって,
∑
ni=1
(Z
i− E[Z
i])
n → 0 (a.s.)
を示せばよい.ここで,
Z
n− E[Z
n]
は期待値が0
であり,かつ| Z
n| ≤ n
なので有界で,特にE[(Z
n− E[Z
n])
2] <
∞
である.よって,Corollary 6
から,∑
∞ n=1Var[Z
n− E[Z
n]]
n
2< ∞
が言えれば十分である.
X
の分布関数をF
と書くと,∑
∞ n=1Var[Z
n− E[Z
n]]
n
2≤ ∑
∞n=1
E[Z
n2] n
2≤ 4
∑
∞ n=1E[Z
n2] (n + 1)
2= 4
∑
∞ n=11 (n + 1)
2∫
|x|≤n
x
2dF (x)
≤ 4
∫
∞0
1 y
2dy
∫
|x|≤y
x
2dF (x)
≤ 4
∫ (∫
∞|x|
1 y
2dy
)
x
2dF (x)
= 4
∫
| x | dF (x) = 4E[ | X | ] < ∞ .
2 Levy の連続性定理
中心極限定理に代表されるような法則収束を示すには
Levy
の連続性定理が有用である.ここでは,Levy
の 連続性定理を証明する.Lemma 8 (Helly
の補題).
任意の分布関数の列(F
n)
∞n=1が与えられているとする.部分列(F
nj)
∞j=1が存在 して,ある右連続かつ単調増加な関数F = F (x)
に対して,F
の任意の連続点x ∈ R
において,j
lim
→∞F
nj(x) = F (x)
が成り立つ.
F
は右連続かつ単調増加なので,分布関数に必要な条件をある程度備えているが,lim
x→∞F (x) = 1
お よびlim
x→−∞F(x) = 0
が成り立つとは限らない.つまり,ある確率分布に対する分布関数になるとは限ら ない.Proof. Q = { q
1, q
2, . . . }
を有理数の集合とし,有理数を一列に並べて,q
1, q
2 のように番号を振る.Q
はR
において稠密であることに注意する.q
1に対して,F
n(q
1)
は[0, 1]
に含まれる数列なので,ある部分列(n
(1)j)
∞j=1を取ってくることで,(F
n(1)j
(q
1))
∞j=1が収束するようにできる.次に,同様にして(n
(1)j)
∞j=1の中から,
F
n(1) j(q
2)
が収束する部分列を取り出し,それを(n
(2)j)
∞j=1⊆ (n
(1)j)
∞j=1とおく.以下,同様の手続きを続 けることで,数列の列(n
(1)j)
∞j=1⊇ (n
(2)j)
∞j=1⊇ (n
(3)j)
∞j=1⊇ · · ·
を得る.ここで,
(n
j)
∞j=1をn
j= n
(j)jのように対角線状に数列を取り出すと,任意の
q ∈ Q
に対してF
nj(q)
は収束する.この収束先をG(q)
と書 く.G
の構成の仕方からq ≤ q
′なら,G(q) ≤ G(q
′)
がわかる.しかし,G(q)
はQ
上においてのみ定義され ており,しかも右連続であるとは限らない.そこで,F(x) = inf { G(q) | q > x }
とおく(
inf
内ではq ≥ x
ではなくq > x
としていることに注意).すると,F (x)
は単調増加で,さらに右 連続であることが示せる.なぜなら,x
を任意の点として,任意のϵ > 0
に対して,あるq > x
が存在して,G(q) − F(x) < ϵ
とできるので,任意のx ≤ y ≤ q
に対してF (y) − F (x) < ϵ
が言えるからである.x
をF
の連続点として,F
nj(x) → F (x)
を示す.x
においてF
は連続なので,あるq < x < q
′が存在し て,G(q
′) − G(q) < ϵ
とできる.単調性からG(q) ≤ F (x) ≤ G(q
′)
も成り立つ.よって,G(q) = lim
j→∞
F
nj(q) ≤ lim inf
j→∞
F
nj(x) ≤ lim sup
j→∞
F
nj(x) ≤ lim
j→∞
F
nj(q
′) = G(q
′)
が成り立つ.よって,
ϵ → 0
とすることでlim
j→∞F
nj(x) = F (x)
が示せる.ある確率変数の列
(X
n)
∞n=1が緊密(tight)
であるとは,任意のϵ
に対して,あるM > 0
が存在してsup
n
P ( | X
n| ≥ M ) < ϵ
が成り立つことと定義する.
Theorem 9 (Prohorov
の定理).
1. X
n⇝ X
がある確率変数X
に対して成り立つならば(X
n)
∞n=1は緊密である.2. (X
n)
∞n=1が緊密ならば,ある部分列が存在してX
nj⇝ X
がある確率変数X
に対して成り立つ.Prohorov
の定理は「有界な実数列は収束部分列を持つ」という命題(Bolzano-Weierstrass
の定理)の確率 変数版と言える.Proof. 1. ϵ > 0
を任意にとる.確率測度の連続性より十分大きなM
に対してP ( | X | ≥ M ) ≤ ϵ
とできる.X
nはX
に法則収束するので,十分大きなN
に対して,任意のn ≥ N
でP ( | X
n| ≥ M ) − P( | X | ≥ M ) ≤ ϵ
とできる
(portmanteau
の定理を使えばすぐに示せるが,必要ならばM
を少し大きく取りx = ± M
がX
の分布関数の連続点であるようにすれば示せる
)
.よって,全てのn ≥ N
においてP( | X
n| ≥ M ) ≤ 2ϵ
である.あとは,十分大きな
M
′を用いればmax
1≤n<NP( | X
n| ≥ M
′) ≤ ϵ
とできるので,適宜M
を大きくとること で,sup
nP( | X
n| ≥ M ) < 2ϵ
が示せる.2. Helly
の補題より,ある部分列n
j(j = 1, 2, . . . )
が存在して,F
nj(x) = P (X
nj≤ x)
は,ある単調増大か つ右連続な関数F
に任意のF
の連続点x
で収束する.あとは,lim
x→∞F(x) = 1
かつlim
x→−∞F (x) = 0
を示せばよい.(X
n)
∞n=1の緊密性より,十分大きなM
を取ってくればF
n(M ) > 1 − ϵ
が全てのn
で成り立つ.よって,F (M ) = lim
j→∞F
nj(M ) > 1 − ϵ
が言える.このことから,x → ∞
でF (x) → 1
とできることがわかる.同様に
lim
x→−∞F (x) = 0
も示せる.Theorem 10 (Levy
の連続性定理). (X
n)
∞n=1を確率変数の列とし,それらの特性関数をϕ
n(t) = E[e
itXn]
とする.このとき,1.
ある確率変数X
が存在して,X
n⇝ X
ならば,任意のt ∈ R
において,ϕ
n(t) → ϕ(t).
2.
任意のt ∈ R
においてϕ
n(t) → ϕ(t)
が成り立ち,ϕ
がt = 0
で連続ならば,ϕ
はある確率変数X
の特 性関数であって,X
n⇝ X
である.Proof. 1.
は有名なportmanteau
の定理から示せる.例えば[1]
のTheorem 3.2.3
を参照せよ.2.
を示す.まず(X
n)
∞n=1が緊密であることを示す.任意のM > 0
に対して,P ( | X
n| ≥ M ) ≤ 1 1 − sin(1) E
[
1 − sin( | X
n| /M )
| X
n| /M ] (
∵ 1 − sin(x)
x ≥ 0 ( ∀ x ∈ R ), 1 − sin(x)
x ≥ 1 − sin(1) ( ∀ x ≥ 1) )
= 1
1 − sin(1) E [
1 − sin(X
n/M) X
n/M
]
( ∵ sin(x)/x = sin( − x)/( − x))
= 1
1 − sin(1) E [(
1 − 1 2
∫
1−1
e
itXn/Mdt )]
= 1
1 − sin(1) (
1 − 1 2
∫
1−1
ϕ
n(t/M )dt )
である.ここで,
1 − 1 2
∫
1−1
ϕ
n(t/M )dt = [
1 − 1 2
∫
1−1
ϕ(t/M)dt ]
− 1 2
∫
1−1
(ϕ
n(t/M) − ϕ(t/M))dt
に注意する.右辺第一項を
A
M,
第二項をB
M(n)
とする.まずA
M を評価する.ϕ(t)
はt = 0
で連続で,か つϕ(0) = 1
である.よって,任意のϵ > 0
に対して,十分大きなM
を取れば,| ϕ(t/M) − 1 | ≤ ϵ
が全ての− 1 ≤ t ≤ 1
で成り立つ.このとき,| A
M| ≤ ϵ
となる.この評価は
n
に依存しないことに注意する.次に,B
M(n)
を評価する.| ϕ
n(t) | ≤ 1
かつ| ϕ(t) | ≤ 1
なので,ルベーグの収束定理よりn
lim
→∞B
M(n) = 0
である.よって,十分大きな
N
に対し,全てのn ≥ N
において| B
M(n) | ≤ ϵ
とできる.以上より,(X
n)
∞n=1が緊密であることが示された.(X
n)
∞n=1が緊密であるので,Prohorov
の定理よりその部分列n
jを取ってくることで,ある確率変数X
へ 法則収束させることができる.X
の特性関数をϕ
′とすれば,1.
よりlim
j→∞ϕ
nj(t) = ϕ
′(t)
が成り立つ.と ころが,仮定よりlim
j→∞ϕ
nj(t) = ϕ(t)
でもあるので,ϕ
′(t) = ϕ(t)
である.このことから,部分列の取り方 によらず法則収束する先の分布の特性関数はϕ
であることがわかる.分布は特性関数から一意に決まるので,法則収束先の分布も部分列の取り方によらず一意に決まる.この分布を持つ確率変数を
X
とする.ここで,もし
X
n⇝ X
でなければ,ある部分列(X
nj)
∞j=1が存在して,それはX
に法則収束しない.つまり,X
の分 布関数F
のある連続点x
において,F
nj(x)
はF(x)
に収束しない.すると,必要ならばさらに部分列を取る ことでinf
j| F
nj(x) − F(x) | > 0
とできる.しかし,上記の議論より,この部分列の中にもX
に法則収束する 部分列が取れてしまい,inf
j| F
nj(x) − F (x) | = 0
となるので,矛盾する.よって,X
n⇝ X
が示された.Levy
の連続性定理より,講義で示したように中心極限定理を示すことができる.ここでは,大数の弱法則 の別証明を与えよう.Theorem 11 (
大数の弱法則(
別証明)). X
1, . . . , X
nを独立同一な確率変数とし,それらの特性関数がϕ
で あるとする.今,ϕ
が原点で微分可能でiµ = ϕ
′(0)
としたとき,X ¯
n= ∑
nk=1
X
k/n →
pµ
である.Proof. ϕ(0) = 1
とϕ
の原点での微分可能性よりϕ(t) = 1 + tϕ
′(0) + o(t)
がt → 0
において成り立つ.よって,
E[e
itX¯n] = ϕ
n( t
n )
= (
1 + t n iµ + o
( 1 n
))
n→ e
itµが全ての