2013.10.9. (訂正版:10.10.) 有限母集団からの非復元抽出に対する中心極限定理
加藤 賢悟
本ノートでは,[1]に基づいて,有限母集団からの非復元抽出に対する中 心極限定理をなるべく平易に証明する1.標準的な確率論の教科書では扱われ ないトピックなので,改めてノートとしてまとめてみた.なお,本ノートを 理解するのに,(分布収束と特性関数の収束の同値性を認めれば)いわゆる教 養レベルの解析学を超える知識は必要ない.従って,証明は初等的であるが, ある程度数学的な慣れがないと難しく感じられるかもしれない.
{a1, . . . , aN}を有限母集団とし,X1, . . . , Xn (n ≤ N)を{a1, . . . , aN}か らの非復元無作為抽出とする.母集団平均・分散をそれぞれ
µN = 1 N
N
∑
j=1
aj, σN2 = 1 N
N
∑
j=1
(aj− µN)2
とおく.最後に,
D2N =
N
∑
j=1
(aj− µN)2, D2N,n= n N
(
1 −Nn)D2n
とおく.講義と同様にして,次のような漸近論を考える.
仮定. 標本サイズnは母集団のサイズNに応じて決まり,Nによって添え字 つけられているとする:n = nN.さらに,N → ∞となるとき,nN → ∞と なるものとする.
以上の準備の下で,次の定理を示す.
定理(Erd¨os-R´enyi).n ≤ N/2であって,任意のϵ > 0に対して, 1
DN2
∑
|aj−µN|>ϵDN,n
(aj− µN)2 → 0, N → ∞
1論文[1]の証明はいくつか軽微なミスがあるが,このノートでは訂正されている,はず.
を仮定する.このとき, 1 DN,n
n
∑
i=1
(Xi− µN)→ N(0, 1), N → ∞.d
証明.一般性を失うことなく,
µN = 0 を仮定してよい.和X1+ · · · + Xnの特性関数を
φN,n(t) = E[eit(X1+···+Xn)], t ∈ R
とおく.N (0, 1)の特性関数がe−t2/2であることを思い出すと,
N →∞lim φN,n(t/DN,n) = e
−t2/2, t ∈ R
を示せばよい.t = 0の場合は自明なので,t ̸= 0の場合のみ考えればよい.
以下,t ̸= 0を任意に固定する.証明を4ステップに分ける.
ステップ1.まずφN,n(t)を変形していく.任意の1 ≤ j1 < · · · < jn≤ N に対して,
P ({X1, . . . , Xn} = {aj1, . . . , ajn}) = (N1
n
) であることに注意すると,
φN,n(t) = (N1
n
)
∑
1≤j1<···<jn≤N
eit(aj1+···+ajn),
と書ける.
p = n
N, BN,n(p) = (N
n )
pn(1 − p)N −n とおく.次の補題を示す.
補題.
φN,n(t) = 1 2πBN,n(p)
∫ π
−π
N
∏
j=1
{(1 − p) + pei(θ+taj)}
e−iθndθ.
補題の証明.積分の中の積を展開すると,
N
∏
j=1
{(1 − p) + pei(θ+taj)} =
N
∑
k=1
pk(1 − p)N −keikθ ∑
1≤j1<···<jk≤N
eit(aj1+···+ajk).
さらに,
1 2π
∫ π
−π
eiθ(k−n)dθ =
1, k = n, 0, k ̸= n, に注意すると,補題の結論を得る.
a1+ · · · + aN = 0に注意すると,
N
∏
j=1
{(1 − p) + pei(θ+taj)}
e−iθn
=
N
∏
j=1
{(1 − p)e−ipθ+ pei((1−p)θ+taj)
} (∵ p = n/N)
= e−ipt(a1+···+aN)
N
∏
j=1
{(1 − p)e−ipθ+ pei((1−p)θ+taj)
} (∵ a1+ · · · + aN = 0)
=
N
∏
j=1
{(1 − p)e−ip(θ+taj)+ pei(1−p)(θ+taj)
}.
従って,
φN,n(t) = 1 2πBN,n(p)
∫ π
−π
N
∏
j=1
{(1 − p)e−ip(θ+taj)+ pei(1−p)(θ+taj)
}
dθ. ここで,スターリングの公式
k! ∼√2πkkke−k, k → ∞ (bk∼ ck ⇔ bk/ck→ 1, k → ∞) を用いると,N → ∞, n → ∞で,
BN,n(p) = N ! n!(N − n)!p
n(1 − p)N −k ∼ √1 2π
√ N n(N − n) =
1
√2πNp(1 − p).
この結果を使うと,
φN,n(t/DN,n) ∼
√N p(1 − p) 2π
∫ π
−π
[∏N
j=1
{(1 − p)e−ip(θ+taj/DN,n)
+ pei(1−p)(θ+taj/DN,n)}]dθ.
θ = θ′/√Np(1 − p)と変数変換すると,
φN,n(t/DN,n) ∼ √1 2π
∫ π√N p(1−p)
−π√N p(1−p)
N
∏
j=1
gj(θ, t)
dθ (*)
と書き直すことができる.ただし,
gj(θ, t) = (1 − p)e−ip(θ/√N p(1−p)+taj/DN,n)+ pei(1−p)(θ/√N p(1−p)+taj/DN,n).
ステップ2.次に,ϵ = ϵN → 0をDN−2∑|aj|>ϵDN,na2j → 0, ϵ−2= O(n1/2) となるように選ぶ.例えば,
ϵN = inf
ϵ > 1/n1/4: 1 D2N
∑
|aj|>ϵDN,n
a2j ≤ ϵ
とすればよい.|θ| ≤ 2ϵ√Np(1 − p)において積∏Nj=1gj(θ, t)を展開する.
まず,
|eit− 1 − it| ≤ |t|
2
2 ,
eit− 1 − it + t
2
2 ≤
|t|3
6 , t ∈ R なる不等式を用いると(証明はテイラーの定理を使えばよい),
|gj(θ, t) − 1| ≤ p(1 − p)
2 (θ/√Np(1 − p) + taj/DN,n)2 ≤ θ
2
N + t2a2j D2N,
|gj(θ, t) − 1 +12(θ/√N + taj/DN)2|
≤ p(1 − p)6 |θ/√Np(1 − p) + taj/DN,n|3, と評価できることに注意する.さらに,積∏Nj=1を
N
∏
j=1
= ∏
|aj|>ϵDN,n/|t|
× ∏
|aj|≤ϵDN,n/|t|
と分解し,|aj| > ϵDN,n/|t|と|aj| ≤ ϵDN,n/|t|の場合に分けて考える.以下, C1, C2, . . . は正の絶対定数とする.
まず,|θ| ≤ 2ϵ√Np(1 − p)に関して一様に,
∑
|aj|>ϵDN,n/|t|
(θ2/N + t2a2j/D2N) ≤ C1p(1 − p)
∑
|aj|>ϵDN,n/|t|
1 + o(1)
≤ C1t
2
ϵ2DN2
∑
|aj|>ϵDN,n/|t|
a2j+ o(1) = o(1), (**)
であるから,
log(1 + x) = (1 + o(1))x, x → 0, (*3) より,
∏
|aj|>ϵDN,n/|t|
gj(θ, t) = eo(1). また,|aj| ≤ ϵDN,n/|t|なるjに対して,
|gj(θ, t) − 1 +12(θ/√N + taj/DN)2| ≤ C22ϵ(θ/√N + taj/DN)2,
だから,
gj(θ, t) = 1 − 1 − ηj2(θ, t)ϵ(θ/√N + taj/DN)2, |ηj(θ, t)| ≤ C2
と展開できる.ηj = ηj(θ, t)と引数を省略すると,
∏
|aj|≤ϵDN,n/|t|
gj(θ, t) = ∏
|aj|≤ϵDN,n/|t|
{
1 −1− η2 jϵ(θ/√N + taj/DN)2
} ,
と表せる.いま,|θ| ≤ 2ϵ√Np(1 − p)に関して一様に,
∑
|aj|≤ϵDN,n/|t|
(θ/√N + taj/DN)2 =
N
∑
j=1
(θ/√N + taj/DN)2+ o(1) (∵ (∗∗))
= θ2+ t2+√2tθ N
N
∑
j=1
aj
DN + o(1),
であって,
√2tθ N
N
∑
j=1
aj DN
≤ √C3ϵ N
n
∑
j=1
aj DN
≤ C3ϵ.
ここで,|∑Nj=1aj/DN| ≤√N (∑Nj=1a2j/DN2)1/2 =√N(シュワルツの不等 式!)という事実を使った.再び(*3)を使うと,|θ| ≤ 2ϵ√Np(1 − p)におい て一様に,
log ∏
|aj|≤ϵDN,n/|t|
gj(θ, t) = −1 + o(1) 2 (θ
2+ t2+ o(1))
である.従って,
N
∏
j=1
gj(θ, t) = exp {
−1 + o(1) 2 (θ
2+ t2+ o(1))
} ,
と評価できる.
ステップ3.このステップでは,∏Nj=1gj(θ, t)の|θ| > 2ϵ√Np(1 − p)で の評価を行う.ここで,複素数値関数
h(y) = (1 − p)e−ipy+ pei(1−p)y, y ∈ R, を考える.次の補題を示す.
補題.0 < ϵ ≤ π/2とする.ϵ ≤ |y| ≤ πに対して,
|h(y)|2 ≤ 1 − 2p(1 − p)(1 − cos ϵ).
補題の証明.簡単な計算により,
|h(y)|2 = h(y) · h(y) = p2+ (1 − p)2+ 2p(1 − p) cos y
= 1 − 2p(1 − p)(1 − cos y),
であって,ϵ ≤ |y| ≤ πにおいて,cos y ≤ cos ϵである.
この補題より,|θ| > 2ϵ√Np(1 − p), |aj| ≤ ϵDN,n/|t|のとき,|gj(θ, t)|2 ≤ 1 − 2p(1 − p)(1 − cos ϵ)がわかる.|aj| > ϵDN,n/|t| のときは自明な評価
|gj(θ, t)| ≤ 1を使うと,2ϵ√Np(1 − p) < |θ| ≤ π√Np(1 − p)において,
N
∏
j=1
|gj(θ, t)| ≤ ∏
|aj|≤ϵDN,n/|t|
√1 − 2p(1 − p)C(ϵ) (C(ϵ) = 1 − cos ϵ)
≤ eo(1)(1 − 2C(ϵ)p)N/2= eo(1) (
1 −2C(ϵ)nN )N/2
≤ e−C(ϵ)n+o(1).
ここで,C(ϵ) = O(ϵ2)であって,ϵ2n ≥ C4n1/2だから,最右辺は≤ e−C4n1/2+o(1) である.
ステップ4.いま,
(*)の右辺= √1 2π
{∫
|θ|≤2ϵ√N p(1−p)
+
∫
2ϵ√N p(1−p)<|θ|≤π√N p(1−p)
}
=: I+II,
と分割したとき,ステップ2の結果より,I = e−t2/2+ o(1)であり,一方,ス テップ3の結果より,|II| ≤ C5e−C4n1/2+o(1)√n = o(1)である.以上より,求 める結果を得る.
References
[1] Erd¨os, P. and R´enyi, A. (1959). On the central limit theorem for samples from a finite population. Publ. Math. Inst. Hungarian Acad. Sci. 4 49-61.