計量経済学#05
統計的推測 (2)
鹿野繁樹
大阪府立大学
2017 年 10 月更新
鹿野繁樹 (大阪府立大学) 計量経済学#05 2017 年 10 月更新 1 / 28
Outline
1 母数の推定
2 母数の仮説検定
テキスト・参考書。
テキスト:鹿野繁樹 [2015]、第 3.3 章・第 3.4 章。 参考書:松原望 et al. [1991]。
前回の復習
1 統計的推測 2 標本平均の性質
鹿野繁樹 (大阪府立大学) 計量経済学#05 2017 年 10 月更新 2 / 28
Section 1
母数の推定
鹿野繁樹 (大阪府立大学) 計量経済学#05 2017 年 10 月更新 3 / 28
良い推定量をデザインする
ある母集団が持つ未知の母数(パラメータ)を、一般的にθ(シー タ)と表記。⇒ 標本 X1, X2, . . . , Xnからθ の値を突き止める作業 を、母数の推定と呼ぶ。
推定に用いる統計量を推定量と呼び, ˆθ(シータ・ハット)と 表記。
例:前回の正規母集団Xi ∼ N(µ, σ
2)。未知の母数 = 母平均 µ、その推定量 = 標本平均 ¯X。
.
鹿野繁樹 (大阪府立大学) 計量経済学#05 2017 年 10 月更新 4 / 28
いかなる基準で母数θ に関する推定量 ˆθ をデザインすべき?:開発 者(統計学者)の目線!
「推定量」とは平たく言えば、「推定方式」、「標本の使い方」。 推定量 ˆθ は、標本 X1, X2, . . . , Xnから造られるため、ランダ ムネスを伴う。
∴ ˆθ の確率的な性質に着目 ⇒ 採用基準(良い推定・悪い推定) を規定。
鹿野繁樹 (大阪府立大学) 計量経済学#05 2017 年 10 月更新 5 / 28
推定量の採用基準:不偏性と有効性
推定量 ˆθ の期待値が
E(ˆθ) = θ
を満たすとき、 ˆθ を母数 θ の不偏推定量と呼ぶ。偏りがない推定。 不偏性の意味: ˆθ は確率的に変動しつつも、θ 近辺の値が出や すい。「当たり(母数θ)が出やすいくじ引き」のようなもの。
∴ 不偏性を満たす推定方式は、望ましい!
Example 1
講義ノート#04 より E( ¯X) = µ。∴ 標本平均 ¯X は、母平均 µ の不 偏推定量。 ¯X の実現値は、µ ぐらいの値が事前に期待できる。
鹿野繁樹 (大阪府立大学) 計量経済学#05 2017 年 10 月更新 6 / 28
一つの母数θ に対し、複数の不偏推定量が存在する場合は?⇒ そ の中で分散Var(ˆθ) が最も小さい ˆθ を有効推定量と呼ぶ。
有効性の意味:θ を軸にしたブレが最も小さく、安定して いる。
有効性は、競合する不偏推定量たちの中から、より優れたも のを採用する基準。
Example 2
講義ノート#04 より Var( ¯X) = σn2。この分散は,µ の不偏推定量中 で最小であることが知られている。∴X は、µ の有効推定量。¯
鹿野繁樹 (大阪府立大学) 計量経済学#05 2017 年 10 月更新 7 / 28
母数の推定には、良い推定と悪い推定、正解と不正解がある!
Remark 1
標本X1, X2, . . . , Xnによる母数θ の推定量、ˆθ の採用基準。
1 不偏性E(ˆθ) = θ:第一関門。未知母数 θ 近辺の値が出やすく、 推定結果に偏りがない推定量。⇒ 不偏推定量が複数ある場 合は?
2 有効性(最小分散の不偏推定量):第二関門。θ から大きく外 れにくく、結果が安定した不偏推定量。
鹿野繁樹 (大阪府立大学) 計量経済学#05 2017 年 10 月更新 8 / 28
Section 2
母数の仮説検定
鹿野繁樹 (大阪府立大学) 計量経済学#05 2017 年 10 月更新 9 / 28
仮説検定の目的と考え方
分析者が、未知の母数θ に関し事前に仮説値θ = θ∗を抱いている 場合も。⇒ 仮説値 θ∗の真偽を統計的に判断する手順が、母数の仮 説検定。
「基準値はθ = θ∗である」、「理論上θ = θ∗でなければならな い」など。
推定と検定の、スタンスの違いに注意!
推定:全く無知・中立的な立場で、母数θの値を標本から推定。 仮説検定:あらかじめ持っている仮説値θ= θ∗の妥当性を、 標本を使ってチェック。
鹿野繁樹 (大阪府立大学) 計量経済学#05 2017 年 10 月更新 10 / 28
以下、正規母集団Xi ∼ N(µ, σ2) の母平均 µ に関する検定法を考え る。仮説値は一般に、帰無仮説(null hypothesis)
H0 : µ = µ∗ (1) として宣言。(H0 : µ − µ∗ = 0 でもよい。)
一定の手続きの結果、結果H0が疑わしいと判明したとき、
「H0は棄却される」と言う。
鹿野繁樹 (大阪府立大学) 計量経済学#05 2017 年 10 月更新 11 / 28
具体例:工場の品質管理問題。
Example 3
ある工場は、製品重量の基準をµ = 5(グラム)と置いている。 H0 : µ = 5.
この仮説値を検定するためn = 16 個の製品 Xiを抽出。 結果、標本平均X = 8、標本標準偏差 s¯ X = 3 だった。 X と仮説値の差は 8 − 5 = 3。... H¯ 0は棄却されるべき?
鹿野繁樹 (大阪府立大学) 計量経済学#05 2017 年 10 月更新 12 / 28
母平均µ は未知なので、仮説値との差 µ − µ∗もまた未知⇒ 標本平 均と仮説値の差、 ¯X − µ∗を見てH0の棄却を判断。
X は、µ の周りを確率的にブレる(講義ノート#04)。∴ 幅を¯ 持たせ、推定値と仮説値の差X − µ¯ ∗が「十分」ゼロから離れ たら、H0 : µ = µ∗を棄却。
差X − µ¯ ∗がいくら以上ならば、H0 : µ = µ∗をアウトにする か?:客観的な数値基準が必要。
鹿野繁樹 (大阪府立大学) 計量経済学#05 2017 年 10 月更新 13 / 28
Z 検定:母平均の仮説検定
正規母集団の標本平均X は、講義ノート#04 より正規分布に従う。¯
⇒ ¯X を標準化(講義ノート#04)すると、標準正規分布に従う X ∼ N¯
µ,σ
2
n
−−−→標準化 Z = X − µσ/¯ √
n ∼ N(0, 1) (2) となる。これをZ 統計量と呼ぶ。
いま問題となっている差X − µ¯ ∗を上式に換算するれば、Z 値 z∗ = X − µ¯
∗
σ/√n (3)
を得る。
鹿野繁樹 (大阪府立大学) 計量経済学#05 2017 年 10 月更新 14 / 28
−3 −2 −1 0 1 2 3
0.00.10.20.30.4
z
f(x)
A: Z ~ N(0,1)
0.00.10.20.30.4
z
f(x)
0 z=1.96 α=0.025 1−α
α B: α=Pr(Z>1.96)=0.025
図 1 : 標準正規分布(再掲)
鹿野繁樹 (大阪府立大学) 計量経済学#05 2017 年 10 月更新 15 / 28
Z の 2.5%臨界値は Pr(Z > 1.96) = 0.025(講義ノート#03、図 1):Z の尺度で考えれば,「1.96 ≈ 2」は非常に大きな値。
∴ まず、差 ¯X − µ∗を(3) 式の Z 値 z∗に換算。
|z∗| > 1.96 ≈ 2 なら「十分離れている」と判断し、帰無仮説 H0 : ¯X − µ∗を棄却。
この検定法をZ 検定と呼ぶ。
鹿野繁樹 (大阪府立大学) 計量経済学#05 2017 年 10 月更新 16 / 28
Remark 2
帰無仮説H0 : µ = µ∗のZ 検定の手順。
1 母平均の推定値と仮説値の差X − µ¯ ∗を、Z 値 z∗に換算。
2 |z∗| > 1.96 ≈ 2 なら、 ¯X − µ∗は十分離れていると判断。 H0 : µ = µ∗を棄却。
このルールでH0が棄却されば、「有意水準5%の両側 Z 検定 で、帰無仮説H0µ = µ∗は棄却される」と言う。
どうして2.5%臨界値 z = −1.96、z = 1.96 を基準にしている のに「有意水準5%」?
正の乖離X¯ − µ∗ >0(⇔ z∗ >0)と負の乖離X¯ − µ∗ <0
(⇔ z∗ <0)両方の可能性を考慮しているため。
事前にどちらの方向にズレるか分からないので、両ケース合わ せて5%という意味。
鹿野繁樹 (大阪府立大学) 計量経済学#05 2017 年 10 月更新 17 / 28
Example 4
(工場の品質管理、続き)サンプル数はn = 16、母集団の標準偏 差σ は未知なので、標本の標準偏差 s = 3 で代用。⇒ ¯X − µ∗ = 3 をZ 値に換算すると
z∗ = 8 − 5 3/√16 =
3
3/4 = 4 > 1.96. (4) Z の尺度に直すと、差 ¯X − µ∗ = 3 は大きな乖離。
∴ 帰無仮説H0 : µ = 5 は棄却される。 品質基準を満たしていると言えない。
鹿野繁樹 (大阪府立大学) 計量経済学#05 2017 年 10 月更新 18 / 28
Z 統計量など、臨界値の計算ができる(いくら以上なら「大きい」 か判断できる)統計量を検定統計量と呼び、S と置く。
仮説検定のポイント:推定値と仮説値の差 ˆθ − θ∗を、適当な 検定統計量S に換算し、帰無仮説 H0 : θ = θ∗をジャッジ。 母平均µ の Z 検定に限らず、計量経済学で登場するさまざま な仮説検定に通用する原理。
Remark 3
仮説検定の一般原理(発想法)。 H0 : θ − θ∗ = 0 −−−−−−−→推定値で代用 θ − θˆ ∗
検定統計量 Sに変換
−−−−−−−−−−→ S が十分大きければ H0棄却. (5)
鹿野繁樹 (大阪府立大学) 計量経済学#05 2017 年 10 月更新 19 / 28
t 検定
上の品質管理の例で行われた「ズル」:未知のσ の代わりに、標本 標準偏差s を使って Z 値を計算。
Z 統計量の σ を s で置き換えた「ニセ Z」
Z = X − µ¯
σ/√n ⇒ ニセZ =
X − µ¯ s/√n. 上式の分子・分母を、本物のσ で割れば
ニセZ = σ
s
X − µ¯ σ/√n =
σ sZ =
Z s/σ. これは本物Z と s/σ の比。
s は標本から求めた確率変数 ⇒ 上式は二つの確率変数 Z と s/σ の比。
鹿野繁樹 (大阪府立大学) 計量経済学#05 2017 年 10 月更新 20 / 28
この「ニセZ」をt 統計量と呼ぶ。 t = X − µ¯
s/√n . (6)
t 統計量と Z 統計量の違い:前者が偽物 s を、後者が本物 σ を 使っている点。
t 統計量はt 分布という、正規分布とは別の分布に従う。 t ∼ T(m), m = n − 1
ここでm = n − 1 は自由度、サンプル数n で決まる定数。
鹿野繁樹 (大阪府立大学) 計量経済学#05 2017 年 10 月更新 21 / 28
−3 −2 −1 0 1 2 3
0.00.10.20.30.4
t
f(t) 2.042 3.182
T(3) T(30)
図2 : 二つのt分布T(3)とT(30)
鹿野繁樹 (大阪府立大学) 計量経済学#05 2017 年 10 月更新 22 / 28
図2:自由度 m が異なる二つの t 分布、T(3) と T(30)。 図1の標準正規分布 N(0, 1) とよく似ている!
1 ゼロを中心に左右対称の釣鐘型。
2 およそ±2の範囲の確率をカバー。 ... T(m) は N(0, 1) の「ニセモノ」。
鹿野繁樹 (大阪府立大学) 計量経済学#05 2017 年 10 月更新 23 / 28
t 分布は、自由度 m = n − 1 に依存して分布の広がり(分散)が若 干変化し、2.5%臨界値の位置が動く。
テキストp305 のt 分布表:各m に応じた t 分布の臨界値をま とめた表。
図2の t 分布の 2.5%臨界値は、T(3) が ±3.182、T(30) が
±2.042。
鹿野繁樹 (大阪府立大学) 計量経済学#05 2017 年 10 月更新 24 / 28
σ を s に置き換えたならば、Z ではなくt 検定で棄却の判断をした 方が正確。
Remark 4
帰無仮説H0 : µ = µ∗のZ 検定の手順。
1 帰無仮説H0 : µ = µ∗を設定。標本平均と仮説値の差を、t 値に換算。
t∗ = X − µ¯
∗
s/√n .
2 t 分布表(テキスト p305)から自由度 m = n − 1 の 2.5%臨界 値、t0.025(m) を求め、|t∗| > t0.025(m) ならば H0 : µ = µ∗を 棄却。
棄却の判断材料がZ ∼ N(0, 1) の臨界値から t ∼ T(m) の臨界 値に変わっただけ。根底にある原理はZ 検定と同じ。
鹿野繁樹 (大阪府立大学) 計量経済学#05 2017 年 10 月更新 25 / 28
Example 5
(工場の品質管理、続き)(4) 式で求めた Z 値は、厳密には t 値 t∗ = 4 に相当。
自由度m = 16 − 1 = 15 の t 分布の 2.5%臨界値は、t 分布表
(テキストp305)より t0.025 = 2.131。
t∗ = 4 > 2.131 より,帰無仮説 H0 : µ = 5 は t 検定でも棄却さ れる。検定結果はZ 検定と変わらず。
鹿野繁樹 (大阪府立大学) 計量経済学#05 2017 年 10 月更新 26 / 28
今回の復習問題
次の設問に答えよ。各自用意した紙に解答し、退出時に提出せよ。 講義名、日付、学籍番号、氏名を明記すること。
1 テキスト第3 章復習問題 3.2。
2 テキスト第3 章復習問題 3.5。
鹿野繁樹 (大阪府立大学) 計量経済学#05 2017 年 10 月更新 27 / 28
References
鹿野繁樹. 新しい計量経済学. 日本評論社, 2015.
松原望, 縄田 和満, and 中井 検裕. 統計学入門. 東京大学出版会, 1991.
鹿野繁樹 (大阪府立大学) 計量経済学#05 2017 年 10 月更新 28 / 28