不偏検定 - mathematical statistics v4

本節では，両側検定問題

H₀:θ=θ₀ vs. H₁ :θ̸=θ₀

を考える．両側検定問題に対しては，ほとんどの場合，UMP検定は存在しない．

Example 4.6. X ∼N(θ,1)に対して，

H₀ :θ= 0 vs. H₁ :θ̸= 0 (*)

という検定問題を考えよう．このとき，仮にδ^∗が水準αのUMP検定なら，任意のθ₁ ̸= 0 に対して，δ^∗は

H₀ :θ= 0 vs. H₁ :θ=θ₁ (**)

という検定問題に対するMP検定になっている．しかし，Neyman-Pearsonの補題より，

θ₁>0のときは，I(x > c)なる検定が(**)に対するMP検定であって，θ₁ <0のときは，

I(x < c)なる検定が(**)に対するMP検定である．MP検定の一意性を認めると，(*)に対するUMP検定が存在しないことがわかる．

そこで両側検定問題については，検定のクラスを制限する．

Definition 9 (不偏検定とUMPU検定). 検定問題H₀ :θ∈Θ₀ vs. H₁:θ∈Θ₁に対する水準αの検定δが不偏 (unbiased)であるとは，

β_δ(θ) =E_θ[δ(X)]≥α, ∀θ∈Θ₁ となることをいう．

さらに，水準αの不偏検定δ^∗が一様最強力不偏検定(uniformly most powerful unbiased

text, UMPU検定)であるとは，水準αの任意の不偏検定δに対して，

β_δ∗(θ)≥β_δ(θ), ∀θ∈Θ となることをいう．

いま，ΘはRの開区間とし，X = (X₁^′, . . . , X_n^′)^′の同時確率(密度)関数は pn(x;θ) =H(x) exp{θT(x)−C(θ)}

の形に表せるとしよう．

Theorem 4.4. 次の形の検定はH₀ :θ=θ₀ vs. H₁ :θ̸=θ₀に対する水準αのUMPU検定になる：

δ^∗(x) =









1 ifT(x)< c₁ orT(x)> c₂ γ_i ifT(x) =c_i, i= 1,2 0 otherwise

ただし，c_i, γ_i, i= 1,2は

E_θ₀[δ^∗(X)] =α, E_θ₀[T(X)δ^∗(X)] =E_θ₀[T(X)]α (*3) をみたすように選ぶ．

Proof. 略証のみ与える．この証明では，p_n(x;θ)は密度関数とし，微分と積分の順序交換を自由に行う(ちゃんと正当化できる)．さらに，(*3)をみたすc_i, γ_i, i= 1,2の存在は認めて，δ^∗がUMPU検定であることを示す．δを水準αの任意の不偏検定とすると，

β_δ(θ₀)≤α, β_δ(θ)≥α, ∀θ̸=θ₀

となる．ここで，β_δ(θ) =E_θ[δ(X)]はθについて微分可能であることが示せる．β_δ(θ)の連続性より，β_δ(θ0) =αであって，β_δ(θ)はθ=θ0で最小になる．よって，

β_δ(θ0) =α, 0 =β_δ^′(θ0) =

∫

δ(x) ∂

∂θpn(x;θ0)dx=E_θ₀[T(X)δ(X)]−C^′(θ0)α となる．ここで，e^C(θ) =∫

e^θT(x)H(x)dxの両辺をθについて微分して，C^′(θ) =E_θ[T(X)]

を得る．従って，

∫

δ(x) ∂

∂θp_n(x;θ₀)dx= 0⇔E_θ₀[T(X)δ(X)] =E_θ₀[T(X)]α である．

次に，θ₁̸=θ₀を任意に固定して，a₁, a₂ ∈Rに対して，

r_a₁_,a₂(x) =p_n(x;θ₁)−a₁p_n(x;θ₀)−a₂ ∂

∂θp_n(x;θ₀)

=p_n(x;θ₀)e^C(θ⁰⁾⁻^C(θ¹⁾{e^(θ¹⁻^θ⁰^)T^(x)−ea₁−ea₂T(x)}

とおく．ここで，ea₁ =e^C(θ¹⁾⁻^C(θ⁰⁾{a₁−C^′(θ₀)},ea₂ =e^C(θ¹⁾⁻^C(θ⁰⁾a₂である．c₁, c₂に対して，a1, a2をc1, c2, θ0, θ1に依存させて適当に選べば，H(x)>0なるxに対して，

δ^∗(x) = 1⇔r_a₁_,a₂(x)>0, δ^∗(x) = 0⇔r_a₁_,a₂(x)<0 が成り立つ．よって，

{δ^∗(x)−δ(x)}r_a₁_,a₂(x)≥0 となるから，両辺を積分して，

β_δ∗(θ1)−β_δ(θ1) =

∫

{δ^∗(x)−δ(x)}pn(x;θ1)dx

≥a₁

∫

{δ^∗(x)−δ(x)}p_n(x;θ₀)dx+a₂

∫

{δ^∗(x)−δ(x)} ∂

∂θp_n(x;θ₀)dx= 0

を得る．さらに，δ(x)≡αなる検定と比較して，β_δ∗(θ₁)≥αを得る．θ₁ ̸=θ₀は任意だったから，δ^∗がUMPU検定であることが示された．

Example 4.7. X₁, . . . , X_n∼N(θ,1) i.i.d.に対して，

H₀:θ=θ₀ vs. H₁ :θ̸=θ₀

という検定問題を考える．このとき，T(X) =nXであって，Xは連続型なので，

δ(X) =I(X < c₁ orX > c₂)

という形の検定がUMPU検定になる．θ=θ₀のもとでX−θ₀ ∼N(0,1/n)であるから，

z_α/2 = Φ⁻¹(1−α/2)とおいて，c₁ =θ₀−z_α/2/√n, c₂ =θ₀+z_α/2/√nにとれば，

E_θ₀[δ(X)] =P_θ₀(|X−θ₀|> z_α/2/√

n) =α,

E_θ₀[T(X)δ(X)] =n E_θ₀[(X−θ0)I(|X−θ0|> z_α/2/√

| {z n)]}

+nθ0E_θ₀[δ(X)] =nθ0α となる．以上より，

√n|X−θ₀|> z_α/2 ⇒reject という検定が水準αのUMPU検定になる．

Example 4.8. X₁, . . . , X_n∼N(0, σ²) i.i.d.に対して，

H0:σ² =σ₀² vs. H1 :σ² ̸=σ₀² という検定問題を考える．このとき，

p_n(x;σ²) = (2πψ⁻¹)⁻^n/2e⁻^ψ^∑ⁿⁱ⁼¹^x²ⁱ^/2=e^ψT^(x)⁻(n/2) log(2πψ⁻¹), ψ= 1/σ², T(x) =−

∑n i=1

x²_i/2 であって，検定問題はψ₀= 1/σ₀²とおくと，

H₀:ψ=ψ₀ vs. H₁ :ψ̸=ψ₀ と等価である．よって，W =∑n

i=1X_i²/σ₀²とおくと，W は連続型なので，

δ(X) =I(W < c₁ orW > c₂) という形の検定がUMPU検定になる．c₁, c₂は

E_ψ=ψ₀[δ(X)] =α, E_ψ=ψ₀[T(X)δ(X)] =E_ψ=ψ₀[T(X)]α をみたすように選ぶ．この条件は

P_ψ=ψ₀(c₁≤W ≤c₂) = 1−α, E_ψ=ψ₀[W I(c₁ ≤W ≤c₂)] =n(1−α) と等価である．ψ=ψ₀のとき，W ∼χ²(n)であるから，その密度関数は

fn(w) = 1

Γ(n/2)2^n/2w^n/2⁻¹e⁻^w/2

であって，

E_ψ=ψ₀[W I(c₁≤W ≤c₂)] = 1 Γ(n/2)2^n/2

∫ c2

w^n/2 e| {z }⁻^w/2

=(−2e^−w/2)^′

=−2{c₂f_n(c₂)−c₁f_n(c₁)}+n

∫ c2

f_n(w)dw となる．以上より，c₁, c₂は

∫ c2

f_n(w)dw = 1−α, c₁f_n(c₁) =c₂f_n(c₂) で与えられる．

この検定は理論的には望ましいが，ちょっと面倒である．より簡便な検定は，χ²(n)の (1−α)分位点をχ²_α(n)とおくと，

W < χ²₍₁₋_α)/2(n) or W > χ²_α/2(n)⇒reject という検定である．この検定はサイズαであるが，不偏ではない．

Example 4.9. X_n∼Bin(n, θ)に対して，

H₀:θ=θ₀ vs. H₁ :θ̸=θ₀

という検定問題を考える．Xnは離散型なので，UMPU検定は確率化検定になる．これは面倒なので，通常は次のような簡便な検定が用いられる．θ=θ0のもとで，n→ ∞^のとき，CLTより， √

n(Xn/n−θ0)

√θ₀(1−θ₀)

→d N(0,1) となるから，P´olyaの定理より，

√n|X_n/n−θ₀|

√θ₀(1−θ₀) > z_α/2⇒reject

は近似的にサイズαの検定になる．この検定は不偏でもないし，UMPUでもないが，合理的な検定といえる．

Example 4.10. (µ, σ²) ∈R×(0,∞)を未知として，X₁, . . . , X_n ∼ N(µ, σ²) i.i.d.とする．このとき，

H₀:µ=µ₀ vs. H₁ :µ̸=µ₀ という検定問題を考える．この検定問題は，正確には，

H₀:µ=µ₀, σ² >0 vs. H₁ :µ̸=µ₀, σ² >0

であるから，H₀は複合仮説である．σ²のように，未知だが検定問題にとってさしあたり興味のないパラメータを局外パラメータ (nuisance parameter)と呼ぶ．この検定問題に対しては，t統計量を

T =T(X) =

√n(X−µ₀) S とおくと，

|T|> c⇒reject

という検定がUMPU検定になる．µ=µ0のもとでは，T ∼t(n−1)であるから，t分布の対称性より，t(n−1)の(1−α/2)分位点をt_α/2(n−1)とおくと，

|T|> t_α/2(n−1)⇒reject

が水準αのUMPU検定になる．この証明は入り組んでいるので，省略する．

4.3 最尤法にもとづく検定

ドキュメント内 mathematical statistics v4 (ページ 116-121)