担当:鹿野(大阪府立大学)
2014 年度前期
はじめに
前回の復習
漸近理論(n → ∞)。
大数の法則・中心極限定理。
今回学ぶこと
統計量の漸近的な性質。
非正規母集団の仮説検定。
テキスト該当箇所:8章、11.3章、12.4章。
1 統計量の漸近的な性質
1.1
漸近的に望ましい推定量
小標本(有限のサンプル数n)のもとで、良い推定量とは?(講義ノート#19) 1. 不偏推定量:未知母数θの推定量ˆθが、E(ˆθ) = θ。
2. 有効推定量:不偏推定量が複数存在⇒分散Var(ˆθ)が一番小さい不偏推定量。
Remark:分析するモデルによっては、不偏推定量が作れないことも。
⊲ 何を基準に推定量の性能を比較すれば良い?⇒ (n → ∞)による基準 作り。
⊲ 漸近的な性質:一致性、漸近正規性、漸近有効性。
1.2
一致性、漸近正規性、漸近有効性
一致性:母数θの推定量 ˆθについて、
plim ˆθ = θ (1)
ならば、ˆθをθの と呼ぶ。
1
⊲ 一致性の望ましさ:ˆθがθに確率収束(講義ノート#25)。∴サンプル数nが十分大き ければ、θとˆθを区別しなくてよい。
⊲ 例:大数の法則(講義ノート#25)より、無作為標本の平均X¯ は
plim ¯X = µ. (2)
∴ X¯ は母平均µの一致推定量。
漸近正規性:一致推定量 ˆθが、漸近的に
ˆθ∼ Na θ, σ2ˆθ (3)
ならば、ˆθをθの と呼ぶ。ここでσ2
ˆθを、ˆθの と呼ぶ。
⊲ 漸近正規性の望ましさ:ˆθの分布が正規分布に分布収束(講義ノート#25)。∴nが十 分大きければ、
Z = ∼ N(0, 1)a (4)
をθの区間推定・仮説検定に使える。(後述。)
⊲ 例:中心極限定理(講義ノート#25)より、無作為標本の平均X¯を標準化した統計量 は、どんな母集団分布についても
Z = X − µ¯ σ/√n
∼ N(0, 1).a (5)
∴ X¯ はµの漸近正規推定量。
漸近有効性:漸近正規推定量の中で最小の漸近分散を持つものを、 と 呼ぶ。
⊲ 漸近有効性の望ましさ:漸近正規推定量で、最も精度の高い推定量。
⊲ 例:無作為標本の平均X¯ は、µの漸近有効推定量である。証明は中級以上の数理統 計学のテキスト参照。
Remark:推定量の性質(採用基準)をまとめると
小標本(nは有限に固定) 漸近理論(n → ∞)
不偏性:E(ˆθ) = θ ⇔ 一致性:plim ˆθ = θ
⇓選抜
⇓選抜 漸近正規性:ˆθ∼ Na θ, σ2ˆθ
⇓選抜
有効性:最小の分散 ⇔ 漸近有効性:最小の漸近分散
⊲ 漸近理論の一致性は、小標本における に対応する性質。最低限コレが必要。
⊲ 小標本では、 の仮定から推定量の分布を導出。
⊲ いずれの場合も、推定量の分散が採用の決め手。
2 非正規母集団の仮説検定
2.1
ベルヌーイ母集団
ベルヌーイ母集団:ベルヌーイ分布(試行回数1の二項分布、講義ノート#09)からの標本
Xi∼ Bin(1, p) (6)
を考える。母数は成功確率p。
⊲ 確率関数は
f (x) = px(1 − p)1−x, x = 0, 1. (7)
∴ベルヌーイ標本X1,X2, . . . ,Xnは、0 or 1の 。Xi= 0, 1。
⊲ 母平均・母分散はベルヌーイ分布の性質より
E(Xi) = µ = , Var(Xi) = σ2= . (8)
∴標本平均X¯ を求めれば、pの不偏推定量・一致推定量となる。
例:内閣支持率の世論調査。
⊲ 「支持しない」→ Xi = 0、「支持する」→ Xi= 1。ダミー変数。
⊲ 未知の母数pは、母集団での支持率。⇒ ¯Xでpを推定。
Remark:Xi= 0, 1に気を付けて、ベルヌーイ標本の平均をよく見ると...
X =¯ 1
n(X1+ X2+· · · + Xn) = 1 n
後半にXi= 1 をまとめる
(0 + 0 + · · · + 0 + 1 + 1 + · · · + 1
n1個のXi= 1
) = 1
nn1. (9)
ここでn1はnのうち、Xi = 1の個数。
⊲ ∴ベルヌーイ標本(ダミー変数)の平均は、「標本全体に占める 」
X = ˆp =¯ (10)
に等しい。
⊲ 例:世論調査の標本で、X = ˆp =¯ 「調査に答えた人のうち、内閣を支持する人の割 合」。(∴標本内での支持率。)
2.2
非正規母集団の
Z 検定Remark:成功確率pは、標本平均X = ˆp¯ で推定。⇒ pの仮説検定はどうする?
⊲ ベルヌーイ標本のX = ˆp¯ の期待値・分散は
E( ˆp) = p, Var( ˆp) = p(1 − p)
n . (11)
⊲ しかし、ˆpを標準化してZ統計量
Z = ˆp − p
p(1 − p)/n (12)
を作っても、Zがどんな分布に従うか不明。∴Zの臨界値が計算できない。⇒仮説 検定ができない。
⊲ nが十分多いならば、 による近似を使えば良い!
成功確率 pのZ検定:中心極限定理より、標本平均を標準化すると、どんな母集団でも
(ベルヌーイでも)
Z∼ N(0, 1).a (13)
∴標準正規分布の臨界値で ができる!⇒具体的には 1. 帰無仮説H0: p = p∗のもとで
Z∗= ˆp − p∗
p∗(1 − p∗)/n or Z∗=
ˆp − p∗
ˆp(1 − ˆp)/n (14)
を計算。(分母はp∗で求めても、ˆpで求めても良い。)
2. 一方、標準正規分布N(0, 1)の臨界値は、片側5%検定ならZ0.05= 1.645、 両側5%検
定ならZ0.025 = 1.960。(たいたいt分布表の臨界値と同じ。)
3. Z∗が臨界値を超えれば、H0: p = p∗を棄却。
例:n = 400人を対象に世論調査を行ったところ、内閣支持率pの推定値は ˆp = 0.36だった。
⊲ 一方、先月の同様の調査ではp∗= 0.4だった。内閣支持率は有意に変化したか?
⊲ H0: p = 0.4のもとでZ値はおよそ
Z∗= √0.36 − 0.4
0.4 · 0.6/400 = > −1.645 > −1.960. (15)
両側検定・左片側検定、ともにH0: p = 0.4を 。∴支持率は、変化し ていない。
⊲ 注意:「先月の支持率」も推定値なので、本当は二標本検定をするべき。
Remark:中心極限定理による近似で、非正規母集団の仮説検定もカンタン。
⊲ 例:ベルヌーイ母集団Xi ∼ Bin(1, p)のp。上で説明した通り。95%信頼区間の計算 もできる。⇒今回の復習問題参照。
⊲ 例:ポアソン母集団Xi ∼ Po(λ)のλ。E(Xi) = Var(Xi) = λなので
Z = √ˆλ − λ λ/n
∼ N(0, 1).a (16)
コレを使って、H0 : λ = λ∗の検定ができる。⇒詳しくは宿題#05で。
まとめと復習問題
今回のまとめ
統計量の漸近的な性質:一致性、漸近正規性、漸近有効性。
非正規母集団(ベルヌーイ、ポアソン)の仮説検定。
復習問題
出席確認用紙に解答し(用紙裏面を用いても良い)、退出時に提出せよ。
1. ベルヌーイ母集団の成功確率pについて、95%信頼区間を導出せよ。ただし次の近似
Z = ˆp − p ˆ σ/√n
∼ N(0, 1),a σ =ˆ ˆp(1 − ˆp) (17)
を使うこと。(右端2.5%臨界値はZ0.025 = 1.960。)式の展開は省略し、下限と上限[L, U] だけ答えれば良い。