計量経済学#09
古典的回帰モデル (2)
鹿野繁樹
大阪府立大学
2017 年 11 月更新
Outline
1 OLS 推定量の分布
2 回帰係数の仮説検定
テキスト:鹿野繁樹 [2015]、第 5.3 章・第 5.4 章。
前回の復習
1 回帰分析の古典的仮定 2 回帰係数のOLS 推定
Section 1
OLS 推定量の分布
OLS 推定量の正規性
前回の復習:回帰モデル
Yi = α + βXi+ ui, ui ∼ N(0, σ2) (1) のパラメータ、α と β を OLS で推定。
仮定 1 ( 回帰分析の古典的仮定(再掲) )
非確率的な説明変数: X1, X2, . . . , Xnはn 個の定数, (CA1) 期待値はゼロ: E(ui) = 0, (CA2) 母分散の均一性: Var(ui) = E(u2i) = σ2, (CA3) 独立標本⇒ 無相関: Cov(ui, uj) = E(uiuj) = 0, (CA4) 正規性: ui ∼ N(0, σ2). (CA5)
OLS 推定量 ˆβ を OLS ウェイト wiの表現に変形すると
β =ˆ wiYi = β +wiui, wi = (Xi− ¯X) SXX
. (2)
古典的仮定(CA1) から (CA4) が成立すれば、以下が成立。 β の期待値・分散はˆ
E( ˆβ) = β, Var( ˆβ) = σ
2
SXX
. (3)
∴ ˆβ は β の不偏推定量。
さらに最小分散(ガウス・マルコフの定理)。
誤差項の正規性(CA5) は何のためにある?
正規分布の再生性(講義ノート#03)および OLS ウェイトの 性質(講義ノート#08)より
wiui ∼ N
0, σ2wi2
=1/SXX
⇒ wiui ∼ N
0, σ
2
SXX
. (4) β はˆ wiuiを定数β だけ横滑りさせた確率変数なので、
β ∼ Nˆ
β, σ
2
SXX
. (5)
∴uiの正規性から、 ˆβ は正規分布に従う!
公式 1
仮定(CA1) ∼ 仮定 (CA5) のもとで、OLS 推定量 ˆβ の分布は β ∼ Nˆ
β, σ
2
SXX
, E( ˆβ) = β, Var( ˆβ) = σ
2
SXX
. (6)
証明:前段で証明済み.
公式(6) を標準化(期待値を引き,その後標準偏差で割る)
⇒ ˆβ に関するZ 統計量 β ∼ Nˆ
β, σ
2
SXX
−−−→標準化 Z = β − βˆ
σ/√SXX ∼ N(0, 1). (7)
⇒ 回帰係数 β に対する仮説検定(講義ノート#05)が可能に。
Remark 1
表1:古典的仮定の各仮定と、 ˆβ の確率論上の性質・性能。 仮定の追加で、 ˆβ の性質がより具体的に。
仮定(CA5) によってはじめて、 ˆβ の分布型が正規分布に特定 される。
(CA1) と (CA2) (CA1) ∼ (CA4) (CA1) ∼ (CA5)
E( ˆβ) = β β β
Var( ˆβ) = ? Sσ2
XX
σ2 SXX
β ∼ˆ ? ? Nβ,SσXX2
表1 : 古典的仮定(CA1) ∼ (CA5)とOLS推定量βˆの性質
母分散の不偏推定と OLS の標準誤差
(7) 式の Z 統計量の分母、 ˆβ の標準偏差
Var( ˆβ) =
σ2 SXX
= √σ SXX
(8)
は、未知の母数・誤差項の母分散σ2(の平方根)に依存。 σ2を、次の推定量で推定。
s2 = 1 n − 2Q
∗ = 1
n − 2
uˆ2i
= 1 n − 2
(Yi− ˆYi)2. (9)
Q∗ = ˆu2i =(Yi− ˆYi)2はOLS で最適化された残差 2 乗和。
公式 2 ( 不偏分散 )
誤差項の母分散σ2は、s2で不偏推定できる。 s2 = 1
n − 2
(Yi− ˆYi)2, E(s2) = σ2. (10)
証明:テキストp93 ∼ 95 参照。
この性質から、s2を不偏分散と呼ぶ。
s2の分母n − 2 は自由度と呼ばれ、一定のルールに基づき定 まる。
自由度の考え方:自由度は、ある統計量を求める際の「実質的な サンプル数」と解釈するとわかりやすい。
通常のYiの標本分散を考える。 s2Y = 1
n − 1
(Yi − ¯Y )2. (11)
s2Y を求めるには、事前にY¯ が必要。
∴ ¯Y の計算のために、燃料(サンプル)を1だけ消費!⇒ s2
Y
を求める段階で、実質的なサンプル数・自由度はn− 1。 回帰モデルの不偏分散s2も同様。
(10)式のs2を求めるには、事前にαˆとβˆが必要。
∴αˆとβˆの計算のために、燃料(サンプル)を2だけ消費!
⇒ s2Y を求める段階で、実質的なサンプル数・自由度はn− 2。 統計量を何か1 つ計算する毎に、標本の自由度は 1 失われる。
(8) 式の σ2をs2で置き換えるた、 ˆβ の標準偏差の推定値
s.e.( ˆβ) =
s2 SXX
= √s SXX
(12)
を、 ˆβ の標準誤差(standard error)と呼ぶ。 s.e.( ˆβ) は ˆβ の確率的なブレを測る統計量。
s.e.( ˆβ)が小さい⇔ ˆβの精度が高い。
∴OLS を行った際は、推定値 ˆβ と共に必ず s.e.( ˆβ) を確認。
(統計ソフトを使えば自動出力。)
Section 2
回帰係数の仮説検定
回帰係数の t 検定
(7) 式分母の σ を (10) 式で求めた s で置き換え、t 統計量 Z = β − βˆ
σ/√SXX
σ を s で置換
−−−−−−−→ t = β − βˆ s/√SXX を得る(講義ノート#05)。
上式の分母は標準誤差(12) と同値なので、以下のように表記。 t = β − βˆ
s.e.( ˆβ). (13) t 統計量の確率は、t 分布(標準正規分布 N(0, 1) のニセモノ) で与えられる。
t ∼ T(m), m = n − 2.
回帰係数のt 検定:仮説検定の一般論(講義ノート#05)に従う。 分析者が未知のβ に関しあらかじめ仮説値β∗を置く。帰無仮 説として表現すれば
H0 : β = β∗ ⇔ H0 : β − β∗ = 0. (14) アイディア:β を推定値 ˆβ に置き換え、差 ˆβ − β∗が「十分」 大きければH0 : を棄却。
具体的には、 ˆβ − β
∗をt 値
β − βˆ ∗ 推定値と仮説値のズレ
⇒ t∗ =
β − βˆ ∗
s.e.( ˆβ) (15)
に換算し、|t∗| が t 分布の臨界値 t(m) を超えれば H0 : を棄却。 t∗は、 ˆβ と β∗のギャップを測る「ものさし」。
Remark 2
回帰係数β の t 検定の手順。
1 帰無仮説H
0 : β = β∗を設定⇒ 差 ˆβ − β∗を、t 値に換算。 t∗ = β − βˆ ∗
s.e.( ˆβ). (16)
2 t 分布表から自由度 m = n − 2 の 2.5%臨界値、t0.025(m) を求 め、|t∗| > t0.025(m) ならば H0 : β = β
∗を棄却。
Example 1
あるモデルの係数に関し、H0 : β = 100 を検定。サンプル数 n = 20 の標本による分析結果として、 ˆβ = 120、s.e.( ˆβ) = 20。
帰無仮説H0のもとでのt 値は 120 − 100 = 20 ⇒ t∗ =
120 − 100 20 =
20
20 = 1. (17) 一方、自由度m = n − 2 = 18 の t 分布の臨界値は
t0.025(18) = 2.101。
|t∗| < 2.101 より、H0は棄却されない。(β = 100 とみなして も問題ない。)
推定値と仮説値の差が20 で,何となく大きなズレに見える。 ... 推定のブレを考慮すれば、このズレは誤差の範囲内!
回帰係数の有意性検定
実証分析では、次の検定を必ず行う。
H0 : β = 0. (18) これを回帰係数β の(or 説明変数 Xiの)有意性検定と呼ぶ。
この仮説が正しければ、モデルはYi = α + ui。∴XiはYiに 影響しない。
有意性検定の意図:検定により、H0 : β = 0(Xiは効果がな い)という「疑い」が棄却されることを示せば、XiとYiの統 計的な関係性を裏付ける強力な証拠に。
有意性検定では仮説値がβ∗ = 0 ⇒ この場合 t 値は自動的に t∗ = β − 0ˆ
s.e.( ˆβ) = βˆ s.e.( ˆβ) =
OLS 推定値 標準誤差
.
|t∗| > t0.025(m) ならば H0 : β = 0 を棄却。
この検定手順でH0が棄却された場合、「β は(Xiは)統計的 に有意である」「β は有意にゼロと異なる」などと表現。 統計ソフトでOLS 推定を実行すると、仮説値を設定していな いのに推定値β と共に t 値が自動出力。コレは有意性検定の tˆ 値。
Example 2
生活保護受給率welfareiと失業率unempiのOLS 回帰(再掲)。 welfare i = − 1.07
(−1.07)+ 0.46(3.18)unempi, n = 19, R
2 = 0.37. (19)
カッコ内は有意性検定のt 値。
自由度m = 19 − 2 = 17 の t 分布の臨界値は、t 分布表より t0.025(17) = 2.110。
|3.18| > 2.11 ⇒ 失業率の係数 β は統計的に有意。
| − 1.07| < 2.11 ⇒ 定数項 α は有意でない。
t 検定のショートカット
t 分布の性質:m が十分大きい(m → ∞)とき、t 分布 t ∼ T (m) は標準正規分布z ∼ N(0, 1) に収束する。
m = n − 2 → ∞ ⇒ T (m) → N(0, 1). (20)
∴ 自由度m が(= サンプル数 n が)十分大きいならば、t 分布 の臨界値をt0.025(m) ≈ 2.00 ≈ 1.96 = z0,025と置いてよい! 実際、t 分布表より
m = 30 ⇒ t0.025(30) = 2.042, m = 40 ⇒ t0.025(40) = 2.021, m = 60 ⇒ t0.025(60) = 2.000.
通常、t 分布表にあまり大きな自由度の臨界値が載っていない
Remark 2
t 検定のショートカット:だいたい m = n − 2 ≥ 30 なら、t 分布の 右端2.5%臨界値を t0.025(m) ≈ 2.00 と置いてよい。
∴ サンプル数n が多いなら、t 分布表は不要。 例:回帰係数β の有意性検定
|t∗| =
βˆ s.e.( ˆβ)
≥ (<) 2 ⇒ β は有意(有意でない) (21)
t 分布表にあまり大きな自由度の臨界値が載っていないのは、 このため。
統計ソフトで回帰分析を行うと、たくさんの数値が!⇒ 何をレ ポートすべき?
Remark 3
回帰分析を行ったらレポートすべき数値.
1 回帰係数のOLS 推定値 ˆα, ˆβ.
2 サンプル数n と,モデルの当てはまりを測る決定係数 R2.
3 標準誤差か,有意性のt 値のうち,どちらか一方. Example 2 を参照。
今回の復習問題
次の設問に答えよ。各自用意した紙に解答し、退出時に提出せよ。 講義名、日付、学籍番号、氏名を明記すること。
1 OLS 推定の結果, ˆβ = 70,s.e.( ˆβ) = 10 を得た.サンプル数は n = 25.帰無仮説 H0 : β = 40 を t 検定したい.
1 H0 : β = 40のt値を求めよ.
2 t分布表から,自由度m= 25 − 2 = 23の右端2.5%臨界値を求 め,H0 : β = 40が棄却されるか否か判断せよ.
(テキスト第5 章復習問題 5.4 の類題。)
2 テキスト第5 章復習問題 5.5。
References
鹿野繁樹. 新しい計量経済学. 日本評論社, 2015.