経済統計 2013 冬学期 Kengo Kato Appendix2

(1)

2013.10.9. (訂正版：10.10.) 有限母集団からの非復元抽出に対する中心極限定理

加藤賢悟

本ノートでは，[1]に基づいて，有限母集団からの非復元抽出に対する中心極限定理をなるべく平易に証明する¹．標準的な確率論の教科書では扱われないトピックなので，改めてノートとしてまとめてみた．なお，本ノートを理解するのに，（分布収束と特性関数の収束の同値性を認めれば）いわゆる教養レベルの解析学を超える知識は必要ない．従って，証明は初等的であるが，ある程度数学的な慣れがないと難しく感じられるかもしれない．

{a1, . . . , a_N_}を有限母集団とし，X₁, . . . , X_n _{(n ≤ N)}を_{a1, . . . , a_N_}からの非復元無作為抽出とする．母集団平均・分散をそれぞれ

µ_N = ¹ N

N

∑

j=1

a_j, σ_N² = ¹ N

N

∑

j=1

(a_j_{− µ}_N)²

とおく．最後に，

D²_N =

N

∑

j=1

(a_j_{− µ}_N)², D²_N,n= ⁿ N

(

1 −_Nⁿ⁾^D²n

とおく．講義と同様にして，次のような漸近論を考える．

仮定. 標本サイズnは母集団のサイズNに応じて決まり，Nによって添え字つけられているとする：n = n_N．さらに，_{N → ∞}となるとき，n_N _{→ ∞}となるものとする．

以上の準備の下で，次の定理を示す．

定理（Erd¨os-R´enyi）．_{n ≤ N/2}であって，任意のϵ > 0に対して， 1

D_N²

∑

|aj−µN|>ϵDN,n

(a_j_{− µ}_N)² _{→ 0, N → ∞}

1_論文_[1]の証明はいくつか軽微なミスがあるが，このノートでは訂正されている，はず．

(2)

を仮定する．このとき， 1 DN,n

n

∑

i=1

(X_i_{− µ}_N)→ N(0, 1), N → ∞.^d

証明．一般性を失うことなく，

µN = 0 を仮定してよい．和X1+ · · · + Xⁿ^{の特性関数を}

φN,n(t) = E[e^it(X¹^+···+Xⁿ⁾_{], t ∈ R}

とおく．N (0, 1)の特性関数がe^−t²^/2であることを思い出すと，

N →∞lim ^φ^N,n^(t/D^N,n^{) = e}

−t²/2_{, t ∈ R}

を示せばよい．t = 0の場合は自明なので，_{t ̸= 0}の場合のみ考えればよい．

以下，_{t ̸= 0}を任意に固定する．証明を4ステップに分ける．

ステップ¹．まずφ_N,n(t)を変形していく．任意の_{1 ≤ j}1 < · · · < jn≤ N に対して，

P ({X1, . . . , X_n_{} = {a}_j₁, . . . , a_j_n_{}) =} ₍_N¹

n

) であることに注意すると，

φ_N,n(t) = ₍_N¹

n

)

∑

1≤j₁<···<jn≤N

e^it(a^j1^+···+a^jn⁾,

と書ける．

p = ⁿ

N^{, B}^N,n^{(p) =} (N

n )

pⁿ_{(1 − p)}^{N −n} とおく．次の補題を示す．

補題．

φN,n(t) = ¹ 2πB_N,n(p)

∫ π

−π





N

∏

j=1

{(1 − p) + pe^i(θ+ta^j⁾}



e^−iθndθ.

(3)

補題の証明．積分の中の積を展開すると，

N

∏

j=1

{(1 − p) + pe^i(θ+ta^j⁾} =

N

∑

k=1

p^k_{(1 − p)}^{N −k}e^ikθ ^∑

1≤j1<···<jk≤N

e^it(a^j1^+···+a^jk⁾.

さらに，

1 2π

∫ π

−π

e^iθ(k−n)dθ =







1, k = n, 0, k ̸= n, に注意すると，補題の結論を得る．

a₁+ · · · + aN ^{= 0}に注意すると，





N

∏

j=1

{(1 − p) + pe^i(θ+ta^j⁾}



e^−iθn

=

N

∏

j=1

{(1 − p)e^−ipθ^{+ pe}i((1−p)θ+ta_j)

} (∵ p = n/N)

= e^−ipt(a¹^+···+a^N⁾

N

∏

j=1

{(1 − p)e^−ipθ^{+ pe}i((1−p)θ+taj)

} (∵ a1+ · · · + aN ^{= 0)}

=

N

∏

j=1

{(1 − p)e^−ip(θ+ta^j⁾^{+ pe}i(1−p)(θ+taj)

}.

従って，

φN,n(t) = ¹ 2πB_N,n(p)

∫ π

−π





N

∏

j=1

{(1 − p)e^−ip(θ+ta^j⁾^{+ pe}i(1−p)(θ+taj)

}



dθ. ここで，スターリングの公式

k! ∼^√^2πkk^k^e^−k, k → ∞ (bk∼ ck ⇔ bk^/ck→ 1, k → ∞) を用いると，N → ∞, n → ∞^で，

BN,n(p) = ^{N !} n!(N − n)!^p

n(1 − p)^{N −k} ∼ √¹ 2π

√ N n(N − n) ⁼

1

√2πNp(1 − p)^.

(4)

この結果を使うと，

φ_N,n(t/D_N,n_{) ∼}

√N p(1 − p) 2π

∫ _π

−π

[_∏^N

j=1

{(1 − p)e^−ip(θ+ta^j^/D^N,n⁾

+ pei(1−p)(θ+taj/DN,n)_}^]_dθ.

θ = θ^′/_{√Np(1 − p)}と変数変換すると，

φ_N,n(t/D_N,n_{) ∼} _√¹ 2π

∫ π^√N p(1−p)

−π^√N p(1−p)





N

∏

j=1

gj(θ, t)



dθ (*)

と書き直すことができる．ただし，

g_j(θ, t) = (1 − p)e^−ip(θ/^√N p(1−p)+taj/D_N,n)_{+ pe}i(1−p)(θ/^√N p(1−p)+taj/D_N,n)_.

ステップ²．次に，ϵ = ϵ_N _{→ 0}をD_N⁻²^∑_|a_j_|>ϵD_N,na²_j _{→ 0, ϵ}⁻²= O(n^1/2) となるように選ぶ．例えば，

ϵ_N = inf







ϵ > 1/n^1/4: ¹ D²_N

∑

|aj|>ϵDN,n

a²_j _{≤ ϵ}







とすればよい．|θ| ≤ 2ϵ√Np(1 − p)^{において積}^∏^Nj=1^g^j^{(θ, t)}^{を展開する．}

まず，

|e^it− 1 − it| ≤ ^|t|

2

2 ^,

e^it_{− 1 − it +} ^t

2

2 ^≤

|t|³

6 ^{, t ∈ R} なる不等式を用いると（証明はテイラーの定理を使えばよい），

|gj(θ, t) − 1| ≤ ^{p(1 − p)}

2 ^(θ/√Np(1 − p) + taj^/DN,n⁾² ≤ ^θ

2

N ⁺ t²a²_j D²_N^,

|g^j(θ, t) − 1 +¹₂^(θ/^√^{N + ta}^j^/DN⁾²|

≤ ^{p(1 − p)}₆ |θ/√Np(1 − p) + taj^/DN,n|³^, と評価できることに注意する．さらに，積^∏^N_j=1を

N

∏

j=1

= ^∏

|aj|>ϵDN,n/|t|

× ^∏

|aj|≤ϵDN,n/|t|

(5)

と分解し，_|aj| > ϵDN,n/|t|^と|aj| ≤ ϵDN,n/|t|の場合に分けて考える．以下， C₁, C₂, . . . は正の絶対定数とする．

まず，|θ| ≤ 2ϵ√Np(1 − p)に関して一様に，

∑

|aj|>ϵDN,n/|t|

(θ²/N + t²a²_j/D²_N_{) ≤ C}1_{p(1 − p)}

∑

|aj|>ϵDN,n/|t|

1 + o(1)

≤ ^C¹^t

2

ϵ²D_N²

∑

|aj|>ϵD_N,n/|t|

a²_j+ o(1) = o(1), (**)

であるから，

log(1 + x) = (1 + o(1))x, x → 0, ^(*3) より，

∏

|aj|>ϵDN,n/|t|

g_j(θ, t) = e^o(1). また，_|aj| ≤ ϵDN,n/|t|^なる^j^{に対して，}

|gj(θ, t) − 1 +¹₂^(θ/^√^{N + ta}j^/DN⁾²| ≤ ^C₂²^ϵ^(θ/^√^{N + ta}j^/DN⁾²^,

だから，

g_j(θ, t) = 1 − ^{1 − η}^j₂^{(θ, t)ϵ}^(θ/^√^{N + ta}j^/DN⁾², |ηj(θ, t)| ≤ C2

と展開できる．ηj = ηj(θ, t)と引数を省略すると，

∏

|aj|≤ϵDN,n/|t|

g_j(θ, t) = ^∏

|aj|≤ϵDN,n/|t|

{

1 −¹^{− η}₂ ^j^ϵ^(θ/^√^{N + ta}j^/DN⁾²

} ,

と表せる．いま，|θ| ≤ 2ϵ√Np(1 − p)^{に関して一様に，}

∑

|aj|≤ϵDN,n/|t|

(θ/^√N + taj/DN)² =

N

∑

j=1

(θ/^√N + taj/DN)²+ o(1) _{(∵ (∗∗))}

= θ²+ t²+_√^2tθ N

N

∑

j=1

a_j

D_N ^{+ o(1),}

(6)

であって，

√2tθ N

N

∑

j=1

a_j D_N

≤ √^C³^ϵ N

n

∑

j=1

a_j D_N

≤ C3^ϵ.

ここで，_|^∑^N_j=1a_j/D_N_{| ≤}^√N (^∑^N_j=1a²_j/D_N²)^1/2 =^√N（シュワルツの不等式！）という事実を使った．再び(*3)を使うと，|θ| ≤ 2ϵ√Np(1 − p)において一様に，

log ^∏

|aj|≤ϵDN,n/|t|

g_j_{(θ, t) = −}^{1 + o(1)} 2 ^(θ

2_{+ t}2_{+ o(1))}

である．従って，

N

∏

j=1

g_j(θ, t) = exp {

−^{1 + o(1)} 2 ^(θ

2_{+ t}2_{+ o(1))}

} ,

と評価できる．

ステップ³．このステップでは，^∏^N_j=1g_j(θ, t)の|θ| > 2ϵ√Np(1 − p)^での評価を行う．ここで，複素数値関数

h(y) = (1 − p)e^−ipy^{+ pe}^i(1−p)y, y ∈ R, を考える．次の補題を示す．

補題．0 < ϵ ≤ π/2^とする．ϵ ≤ |y| ≤ π^{に対して，}

|h(y)|² ≤ 1 − 2p(1 − p)(1 − cos ϵ).

補題の証明．簡単な計算により，

|h(y)|² = h(y) · h(y) = p²+ (1 − p)²+ 2p(1 − p) cos y

= 1 − 2p(1 − p)(1 − cos y),

であって，ϵ ≤ |y| ≤ π^{において，}cos y ≤ cos ϵ^である．

(7)

この補題より，|θ| > 2ϵ√Np(1 − p), |aj| ≤ ϵDN,n/|t|^のとき，|gj(θ, t)|² ≤ 1 − 2p(1 − p)(1 − cos ϵ)^{がわかる．}|aj| > ϵDN,n/|t| ^{のときは自明な評価}

|g^j(θ, t)| ≤ 1^{を使うと，}^2ϵ√Np(1 − p) < |θ| ≤ π√Np(1 − p)において，

N

∏

j=1

|gj(θ, t)| ≤ ^∏

|aj|≤ϵDN,n/|t|

√1 − 2p(1 − p)C(ϵ) (C(ϵ) = 1 − cos ϵ)

≤ e^o(1)(1 − 2C(ϵ)p)^N/2^{= e}^o(1) (

1 −^2C(ϵ)n_N )N/2

≤ e−C(ϵ)n+o(1)_.

ここで，C(ϵ) = O(ϵ²)であって，ϵ²_{n ≥ C}₄n^1/2だから，最右辺は_{≤ e}^−C⁴ⁿ^1/2^+o(1) である．

ステップ⁴．いま，

(*)の右辺= _√¹ 2π

{∫

|θ|≤2ϵ^√N p(1−p)

+

∫

2ϵ^√N p(1−p)<|θ|≤π^√N p(1−p)

}

=: I+II,

と分割したとき，ステップ2の結果より，I = e^−t²^/2+ o(1)であり，一方，ステップ3の結果より，_{|II| ≤ C}5e^−C⁴ⁿ^1/2^+o(1)^√n = o(1)である．以上より，求める結果を得る．

References

[1] Erd¨os, P. and R´enyi, A. (1959). On the central limit theorem for samples from a finite population. Publ. Math. Inst. Hungarian Acad. Sci. 4 49-61.