計量経済学#20
標準誤差と検定の頑健化 (1)
鹿野繁樹
大阪府立大学
2017 年 12 月更新
Outline
1 OLS の頑健な標準誤差
2 漸近正規性に基づく仮説検定
テキスト:鹿野繁樹 [2015]、第 11.1 章・第 11.2 章。
前回の復習
1 根源的仮定とOLS 推定
2 OLS
Section 1
OLS の頑健な標準誤差
誤差項の不均一分散と非正規性
前回の結論:線形回帰モデル
Yi = α + βXi+ ui, i= 1, 2, . . . , n (1) に関し、根源的仮定が成立するデータならば、OLS
βˆ= SXY SXX
= (Xi− ¯X)(Yi− ¯Y)
(Xi− ¯X)2 (2) は係数β の一致推定量(plim ˆβ = β)。
仮定 2 (根源的仮定・再掲)
外生性: E(ui|Xi) = 0, (FA1)
今回の課題
β の分散は?ˆ ⇒ 標準誤差(推定の精度)を求めるのに必要。 β は正規分布に従うか?ˆ ⇒ 仮説検定に必要。
... これらは誤差項 uiの性質に強く依存。
古典的仮定では(簡単化のため)、誤差項の均一分散
Var(ui) = E(u2i) = σ2, i= 1, 2, . . . , n. (3) を想定。⇒ 実際のデータには適合しない?
∴ 根源的仮定は説明変数Xiに依存する不均一分散
Var(ui|Xi) = E(u2i|Xi) = v(Xi) = σi2, i= 1, 2, . . . , n (4) を前提。
観測個体によって分散σ
2
i が異なる。⇒ 添え字 i で区別。 独立標本の仮定より
E(u2i|Xi) = E(u2i|X1, X2, . . . , Xn) = σi2. (5)
古典的仮定は誤差項の正規性ui ∼ N(0, σ
2) を想定。
根源的仮定は、uiに特定の分布型を置かない。⇒ 正規母集団 を成さない被説明変数をカバー。
Remark 1
古典的仮定 vs. 根源的仮定:誤差項 uiの比較。
古典的仮定:均一分散Var(ui) = σ
2
、正規性ui ∼ N(0, σ
2)。 根源的仮定:不均一分散Var(ui|Xi) = σ
2
i、分布を特定せず
(= いかなる分布でも良い。)
∴ 根源的仮定は、古典的回帰分析と比べ、より広い範囲の データに適用可能。
一般に、定式化の誤り(misspecification)が分析結果へ響かな い統計手法を、「頑健(robust)である」と言う。
根源的仮定は、古典的仮定よりも前提条件が緩い、より頑健 なアプローチ!
不均一分散下の OLS の分散
誤差項uiの不均一分散(4) 式を前提に、OLS 推定量の分散を導出。 まず
A= 1 SXX
, B =(Xi− ¯X)ui (6)
と置き、OLS の誤差表現を次のように変形。
βˆ= β +wiui = β + AB ⇔ βˆ− β = AB. (7) A が X1, X2, . . . , Xnの関数である点に気づけば
Var( ˆβ|X1, X2, . . . , Xn) = E( ˆβ− β)2|X1, X2, . . . , Xn
= E(A2B2|X1, X2, . . . , Xn)
= A2E(B2|X1, X2, . . . , Xn). (8)
また標本の独立性から E(B2|X1, X2, . . . , Xn) = E
(Xi− ¯X)ui
2
|X1, X2, . . . , Xn
=E(Xi− ¯X)2u2i|X1, X2, . . . , Xn
=(Xi− ¯X)2E(u2i|X1, X2, . . . , Xn)
=(Xi− ¯X)2E(u2i|Xi)
=(Xi− ¯X)2σ2i. (9)
以上の結果をまとめれば、次の通り。
公式 1
根源的仮定(誤差項の不均一分散)のもとで、OLS の条件付き分 散は
Var( ˆβ|X1, X2, . . . , Xn) = 1 SXX2
(Xi − ¯X)2σi2. (10)
証明:前段で証明済み。
誤差項uiの不均一分散を許容したOLS 推定量の分散は、非常 に複雑!
... もし uiの分散が均一でσi2 = σ2ならば、(10) 式は Var( ˆβ|X1, X2, . . . , Xn) = 1
SXX2
(Xi− ¯X)2σ2
= σ
2
SXX2
(Xi− ¯X)2
SXX
= σ
2
SXX
. (11)
コレは見慣れたOLS の分散。
(10) 式が複雑になる原因は、誤差項の不均一分散にあり。
Section 2
漸近正規性に基づく仮説検定
OLS の漸近正規性
回帰係数β の仮説検定には、OLS ˆβ の分散だけでなく、 ˆβ の従う確 率分布の特定が必要。
(7) 式を、さらに次式に書き換え。
βˆ− β = AB ⇔ βˆ− β = nA√ 1 n√nB
⇔ √n( ˆβ− β) = nA√1
nB. (12)
右辺のnA は、A の定義に従えば nA= n
SXX
= n
(Xi− ¯X)2 = n (n − 1)
1 s2X ≈
1
s2X. (13)
∴ 近似的にXiの標本分散の逆数。
大数の法則(モーメントの収束)により plim nA = plim
n n− 1
=1
1 plim s2X =
1
σX2 . (14)
またJi = (Xi − ¯X)uiと置き、
1
√nB を次式で表現。
√1 nB =
√n1 n
(Xi− ¯X)ui =√n1 n
Ji =√n ¯J. (15)
コレはJi = (Xi− ¯X)uiの標本平均J に、¯
√n をかけた統計量。 テキストp200 より、Jiの期待値と分散は
E(Ji) = 0, c2 = Var(Ji) = E(Xi− µX)2σi2 . (16)
∴ 中心極限定理により
√1 nB =
√n ¯J → N(0, cd 2). (17)
以上の議論から、OLS 推定量 ˆβ と回帰係数 β の間には漸近的に βˆ= β + √1
n × 定数 × 正規確率変数
正規分布に従う推定誤差
(18)
が成立。
中心極限定理による
1
√nB の正規近似がポイント。
公式 2
根源的仮定のもとで、OLS は漸近正規推定量。
√n( ˆβ− β) → Nd
0, 1 σ4Xc
2
, c2 = E(Xi− ¯X)2σ2i . (19)
証明:前段で証明済み.
一方古典的仮定は、誤差項uiの正規性から ˆβ の正規性を保証。
ホワイトの頑健な標準誤差による検定
公式(19) を変形すれば、OLS の漸近分布は
βˆ ∼ Na β,Avar( ˆβ). (20) ここで漸近分散は
Avar( ˆβ) = 1
nσX4 E(Xi− ¯X)
2σ2i . (21)
(20) 式を標準化 ⇒ β に関する(漸近的な)Z 統計量 Z = βˆ− β
Avar( ˆβ)
∼ N(0, 1)a (22)
を得る。
残された問題:分母Avar( ˆβ) に含まれる、未知の σ2i をどうす るか?
近年の実証分析では、Avar( ˆβ) をホワイトの頑健な分散推定量 V = 1
ns4X 1 n
(Xi− ¯X)2uˆ2i = 1 n2s4X
(Xi− ¯X)2uˆ2i. (23)
で推定するのが一般的[White, 1980]。ここで ˆui = Yi− ˆα− ˆβXiは
OLS 残差。
上式は、未知である不均一分散E(u
2
i|Xi) = σ2i を、推定可能
なOLS 残差の 2 乗値 ˆu2i で置き換え。 (23) 式の平方根
s.e.( ˆβ) = √V = 1 ns2X
(Xi− ¯X)2uˆ2i (24)
はホワイトの標準誤差として知られる。
ホワイトの標準誤差は、計算が複雑。
... 統計ソフトの標準誤差オプションを使えば簡単。
例:gretl の OLS 変数設定ウィンドウで、左下端の「頑健標準 誤差を使用する」をチェック⇒OLS の標準誤差・t 値がホワイ トの方式に置き換わる。
Example 1
表1:中古マンション価格を表記の説明変数に OLS 回帰した結果。 比較のため、通常の方式とホワイトの方式による標準誤差・ 有意性のt 値(漸近的な Z 値)を併記。
通常は、二種類の標準誤差・t 値を併記しなくてよい。 誤差項分散の均一性という強い仮定に依らない、ホワイトの バージョンを載せればよい。
通常の分散 ホワイトの分散 係数 標準誤差 t 値 標準誤差 t 値 定数項 1896.26 189.09 10.03 159.32 11.90 駅までの時間 -36.79 10.01 -3.68 8.92 -4.13 築年数 -61.30 4.59 -13.35 3.62 -16.92 面積 60.14 2.21 27.19 2.69 22.36 ワンルーム -544.81 161.23 -3.38 111.23 -4.90 修正済みR¯
2 0.89
サンプル数n 194
表 1 : 標準誤差・t値の比較(被説明変数はマンション価格)
結局、何が変わったのか?
今回に至るまでの主題:古典的仮定よりも緩い前提条件、根源的 仮定のもとでのOLS 推定。
ここまで明らかに成ったこと:古典的仮定の分析の進め方を、 ほぼそのまま踏襲して良い。
OLS は、実はかなり広範囲のデータに適用可能なテクニック!
Remark 2
根源的仮定のもとでも、これまで通りOLS 推定を使って大丈夫。 回帰係数の推定:OLS で推定。OLS は不偏推定量・一致推 定量。
仮説検定:t 検定(漸近的な Z 検定)。ただし標準誤差をホワ イトの方式で求める。
今回の復習問題
次の設問に答えよ。各自用意した紙に解答し、退出時に提出せよ。 講義名、日付、学籍番号、氏名を明記すること。
1 テキスト第11 章復習問 11.1。
References
H. White. A heteroskedasticity-consistent covariance matrix
estimator and a direct test for heteroskedasticity. Econometrica, 48 (4):817–838, 1980.
鹿野繁樹. 新しい計量経済学. 日本評論社, 2015.