ブートストラップ - mathematical statistics v4

FをR上のd.f.とし，X₁, . . . , X_n ∼F i.i.d.とする．このとき，F の汎関数θ=θ(F) に対してCIを構成することを考える．θ(F)の例として，Fの平均，分散，分位点などがある．さらに，θに対して，推定量

bθ=θ(Xb ₁, . . . , X_n)

と何らかの統計量σb=σ(Xb 1, . . . , Xn)>0が存在して，n→ ∞^のとき，

T_n:=

√n(bθ−θ) b σ

→d T

とする．G(t) =P(T ≤t), t ∈Rとおき，α ∈(0,1)に対して，ξ_αをGの(1−α)分位点とする：ξ_α =G^←(1−α)．Gが連続なら，α, β >0, α+β <1に対して，

[θb−ξ_βbσ/√

n,θb−ξ₁₋_ασ/b √ n] はθに対する近似的に水準(1−α−β)のCIになる²⁶．これは，

θ∈[

θb−ξ_βσ/b √

n,θb−ξ₁₋_αbσ/√ n]

⇔ξ₁₋_α≤

√n(bθ−θ) b

σ ≤ξ_β

という同値関係からわかる．例えば，水準0.95のCIを構成したいなら，α=β = 0.025 とすればよい．

26ここでは“パラメータ”はFであって，その“関数”θ(F)に対してCIを構成することを考えている．よって，ここでの設定はこれまでの設定と少し異なっている．

Example 5.5. σbとTの分布の組み合わせには任意性がある．あるτ =τ(F)>0が存在して，n→ ∞^のとき，

√n(θb−θ)→^d N(0, τ²)

としよう．このとき，bσ= 1とすると，T ∼N(0, τ²)となり，bσをτの一致推定量とすると，T ∼N(0,1)となる．

ブートストラップ (bootstrap)とは統計量の標本分布を推定する汎用的な手法であり，

Efron (1979)によって提案された．Fb_n(x) = n⁻¹∑n

i=1I(X_i ≤ x)を経験分布関数とし，

X₁, . . . , X_nを所与として，

X₁^∗, . . . , X_n^∗ ∼Fb_n

を人工的に発生させる．X₁^∗, . . . , X_n^∗をブートストラップ標本(bootstrap sample)と呼ぶ．

P^∗をブートストラップ標本に関する確率とする．例えば，

P^∗(X_i^∗ ≤x) =Fb_n(x) である．ここで，

θb^∗ =θ(Xb ₁^∗, . . . , X_n^∗), bσ^∗=bσ(X₁^∗, . . . , X_n^∗), T_n^∗ =

√n(θb^∗−θ)b b σ^∗ とおいて，T_n^∗のP^∗のもとでのd.f.をGb_nとおく：

Gb_n(t) =P^∗(T_n^∗ ≤t), t∈R.

Gb_nはX₁, . . . , X_nに依存するから，確率的なd.f.である．また，ξb_αをGb_nの(1−α)分位点とおく：

ξb_α=Gb^←_n (1−α).

GbnはGを近似していると考えられるから，

P(T_n≤ξb_α)≈1−α となることが予想される．そこで，

[θb−ξb_βbσ/√

n,θb−ξb₁₋_ασ/b √ n]

(*) というCIを考える．

Remark 5.4. ほとんどの場合，ξb_αは陽には計算できないので，その計算はシミュレーションによる．ブートストラップ標本を独立にB回発生させる：

X_1,b^∗ , . . . , X_n,b^∗ ∼Fb_n, b= 1, . . . , B, i.i.d.

このとき，bθ_b^∗ = θ(Xb _1,b^∗ , . . . , X_n,b^∗ ),σb^∗_b = bσ(X_1,b^∗ , . . . , X_n,b^∗ ), T_n,b^∗ = √n(θb_b^∗−θ)/b bσ_b^∗とおくと，X1, . . . , Xnを与えたとき，

T_n,1^∗ , . . . , T_n,B^∗ ∼Gb_n i.i.d.

であるから，Gb_n(t)は

Gbn(t)≈ 1 B

∑B b=1

I(T_n,b^∗ ≤t) と近似できる．以上より，ξbαは

ξb_α ≈inf {

t∈R: 1 B

∑B b=1

I(T_n,b^∗ ≤t)≥1−α }

と近似すればよい．

• bσ= 1のとき，(*)のCIの構成法をパーセンタイル法 (percentile method)と呼ぶ．

ζbαをθb^∗のP^∗のもとでのd.f.の(1−α)分位点とする：

ζb_α= inf{t∈R:P^∗(bθ^∗≤t)≥1−α}. このとき，T_n^∗ =√n(bθ^∗−θ)b より，

ξb_α=√n(bζ_α−bθ) となる．よって，パーセンタイル法によるCIは

[2θb−ζb_β,2θb−ζb1−α

]

とも表せる．ζb_αもブートスラップ標本を多数発生させることによって，近似計算できる．

• √

n(θb−θ)→^d N(0, τ²), τ >0であって，bσがτの一致推定量のとき，(*)のCIの構成法をパーセンタイルt法(percentile t-method)と呼ぶ．

√n(bθ−θ)→^d N(0, τ²)であって，τの一致推定量が容易に構成できる場合，パーセンタイルt法は，パーセンタイル法や正規近似にもとづくCI [θb−z_βbσ/√

n,θb−z1−αbσ/√ n]と比べて (ここでσbはτ の一致推定量とする)，より小さい被覆確率の誤差をもつといわれる²⁷．しかし，パーセンタイル法はτ の推定を必要としない分，τの一致推定が難しい問題に対しても有効である．そのような問題として，分位点の推定を考察してみよう．

27こうした被覆確率の比較はEdgeworth展開と呼ばれる正規近似の精密評価にもとづく．詳細はHall (1993)を参照せよ．

Example 5.6. u ∈ (0,1)とし，F のu分位点θ_u = F^←(u)の推定を考える．経験分布関数をFb_n(x) = n⁻¹∑n

i=1I(X_i ≤ x)とおくと，θ_uの標準的な推定量は標本u分位点 θb_u=Fb_n^←(u)である．いま，Fは密度関数fをもち，fはθ_uで正かつ連続と仮定する．このとき， √n(bθ_u−θ_u)→^d N

(

0,u(1−u) f(θ_u)²

)

となる (後述)．ここで，漸近分散

u(1−u) f(θu)²

は未知の密度関数に依存していて，その推定はそれほど明らかではない．密度関数の値 f(θ_u)を一致推定する手法はいくつかあるが，その場合，バンド幅と呼ばれるパラメータをユーザーが決めなければならない．

u分位点θ_uに対してパーセンタイル法を使ったCIを構成してみよう．θb^∗_uをブートストラップ標本X₁^∗, . . . , X_n^∗にもとづく標本u分位点とする．すなわち，

Fb_n^∗(x) = 1 n

∑n i=1

I(X_i^∗ ≤x), x∈R とおくと，

θb^∗_u =Fb_n^∗←(u) = inf{x∈R:Fb_n^∗(x)≥u} である．そこで，θb^∗_uのP^∗のもとでの1−α分位点をζb_u,αとおく：

ζb_u,α = inf{x∈R:P^∗(bθ^∗_u≤x)≥1−α}. このとき，パーセンタイル法にもとづくCIは

[2θbu−ζb_u,β,2θbu−ζbu,1−α

]

で与えられる．このCIの利点は複雑な漸近分散の推定を省略できる点にある．このCIは，

前述の仮定のもとで近似的に水準1−α−βをもつことが示される (6.2節を参照せよ)． (*)のCIの漸近的な正当性を保証する十分条件を与えよう．

Theorem 5.3. Gは連続であって，さらに次の条件が成り立つことを仮定する：

sup

t∈R|Gb_n(t)−G(t)|→^P 0. (**) このとき，

P{ θ∈[

bθ−ξb_βσ/b √

n,θb−ξb₁₋_αbσ/√ n]}

→1−α−β.

Proof. G_n(t) =P(T_n≤t), t∈Rとおく．G_n→^d GとGが連続なことから，P´olyaの定理より，

sup

t∈R|G_n(t)−G(t)| →0 となる．Yn P

→0なら，ある数列εn→0が存在してP(|Yn|> εn)≤εnとなるから，十分遅いε_n→0に対して，

sup

t∈R|G_n(t)−G(t)| ≤ε_n, P {

sup

t∈R|Gb_n(t)−G(t)| ≤ε_n }

>1−ε_n となる．そこで，

En= {

sup

t∈R|Gbn(t)−G(t)| ≤εn

}

⊂Ω とおくと，E_n上で，

Gbn(ξα−εn)≥G(ξα−εn)−εn= 1−(α−εn)−εn= 1−α となることから，

ξb_α ≤ξ_α₋_ε_n onE_n を得る．これから，

P(T_n≤ξb_α)≤P(T_n≤ξ_α₋_ε_n)

| {z }

=Gn(ξ_α−εn)

+P(E_n^c)≤G(ξ_α₋_ε_n) + 2ε_n= 1−α+ 3ε_n

を得る．次に，E_n上で，

G(ξbα)≥Gbn(ξbα)−εn≥1−α−εn

となることから，

ξα+εn ≤ξbα onEn

を得る．よって，

P(T_n≤ξb_α)≥P(T_n≤ξ_α+ε_n)

| {z }

=Gn(ξ_α+εn)

−P(E_n^c)≥G(ξ_α+ε_n)−2ε_n= 1−α−3ε_n.

以上より，P(Tn≤ξbα)→1−αを得る．同様に，P(Tn<ξbα)→1−αも従う．よって，

P{ θ∈[

θb−ξb_βbσ/√

n,bθ−ξb₁₋_αbσ/√ n]}

=P(T_n≤ξb_β)−P(T_n<ξb₁₋_α)

→1−α−β となるから定理が示された．

(**)の条件は多くの例に対して成り立つが，ここではもっとも単純な例を考察しよう．

Example 5.7. E[X₁²]<∞^{と仮定して，}θ=E[X₁],θb=X,bσ= 1とする．このとき，

T_n=√

n(X−θ), T_n^∗ =√

n(X^∗−X) である．また，τ² = Var(X₁)とおくと，CLTより，

T_n→^d N(0, τ²)

となる．τ >0と仮定すると，N(0, τ²)のd.f.はΦ(·/τ)である．このとき，

sup

t∈R|Gb_n(t)−Φ(t/τ)|→^P 0 (*3) となる．直観的には，P^∗のもとで，X_i^∗, i= 1, . . . , nはi.i.d.であって，その平均と分散はそれぞれX, n⁻¹∑n

i=1(Xi−X)² =:τb²であるから，CLTより，

Gb_n(t)≈Φ(t/bτ) (*4)

となることが予想される．さらに，bτ² →^P τ²であるから，

Φ(t/τb)→^P Φ(t/τ)

であるので，(*3)が従うことが予想される．以上の議論は直観的なものであって，厳密ではない．厳密には，(*4)の近似の意味を明確にする必要があるし，(*3)を示すためには，

各t∈Rに対して確率収束Gbn(t)→^P Φ(t/τ)を示すだけでは不十分であって，t∈Rに関して一様に確率収束を示さなくてはならない．(*3)のフォーマルな証明は次節を参照せよ．

Example 5.8. ブートストラップは常にうまく働くわけではない．例えば，X1, . . . , Xn∼ U[0, θ] i.i.d.として，θに対してCIを構成することを考える．このとき，θのMLEはX_(n) であって，n(θ−X_(n))→^d Ex(1/θ)となる．しかし，X₁^∗, . . . , X_n^∗のなかにX_(n)が含まれる確率は1−(1−(1/n))ⁿ= 1−e⁻¹+o(1)だから，(X₁, . . . , X_n)を与えたとき，n(X_(n)−X_(n)^∗ ) は1−e⁻¹+o(1)の確率で0になってしまって，P^∗のもとでの分布がEx(1/θ)を近似しない．よって，この場合，パーセンタイル法によるCIは誤った被覆確率をもつ．

ドキュメント内 mathematical statistics v4 (ページ 133-138)