『新しい計量経済学』鹿野研究室 slide20

(1)

計量経済学_#20

標準誤差と検定の頑健化 ₍₁₎

鹿野繁樹

大阪府立大学

2017 年 12 月更新

(2)

Outline

1 OLS の頑健な標準誤差

2 漸近正規性に基づく仮説検定

テキスト：鹿野繁樹 [2015]、第 11.1 章・第 11.2 章。

前回の復習

1 _{根源的仮定と}_{OLS 推定}

2 _OLS

(3)

Section 1 OLS ^{の頑健な標準誤差}

(4)

誤差項の不均一分散と非正規性

前回の結論：線形回帰モデル

Yi = α + βXi+ ui, i= 1, 2, . . . , n (1) に関し、根源的仮定が成立するデータならば、_OLS

βˆ= ^S^XY SXX

= ^(Xⁱ^{− ¯}^X)(Yⁱ^{− ¯}^Y⁾

(Xi_{− ¯}X)² ⁽²⁾ は係数β の一致推定量（plim ˆβ = β）。

仮定 ₂ （根源的仮定・再掲）

外生性_{: E(u}_i_|X_i_{) = 0,} _(FA1)

(5)

今回の課題

β の分散は？ˆ ⇒ 標準誤差（推定の精度）を求めるのに必要。 β は正規分布に従うか？ˆ _{⇒ 仮説検定に必要。}

... これらは誤差項 ui^{の性質に強く依存。}

(6)

古典的仮定では（簡単化のため）、誤差項の均一分散

Var(ui) = E(u²_i) = σ², i= 1, 2, . . . , n. (3) を想定。⇒ 実際のデータには適合しない？

∴ 根源的仮定は説明変数_X_iに依存する不均一分散

Var(ui_|Xi) = E(u²_i_|Xi) = v(Xi) = σ_i², i= 1, 2, . . . , n (4) を前提。

観測個体によって分散_σ

2

i ^{が異なる。}⇒ 添え字 i で区別。独立標本の仮定より

E(u²_i_|Xi) = E(u²_i_|X¹, X², . . . , Xn) = σ_i². (5)

(7)

古典的仮定は誤差項の正規性_u_i _{∼ N(0, σ}

2) を想定。

根源的仮定は、_u_iに特定の分布型を置かない。_{⇒ 正規母集団} を成さない被説明変数をカバー。

(8)

Remark 1

古典的仮定 vs. 根源的仮定：誤差項 ui^の比較。

古典的仮定：均一分散_Var(u_i_{) = σ}

2

、正規性_u_i _{∼ N(0, σ}

2)。根源的仮定：不均一分散_Var(u_i_|X_i_{) = σ}

2

i^{、分布を特定せず}

（= いかなる分布でも良い。）

∴ 根源的仮定は、古典的回帰分析と比べ、より広い範囲のデータに適用可能。

一般に、定式化の誤り（misspecification）が分析結果へ響かない統計手法を、「頑健（robust）である」と言う。

根源的仮定は、古典的仮定よりも前提条件が緩い、より頑健なアプローチ！

(9)

不均一分散下の _OLS の分散

誤差項_u_iの不均一分散(4) 式を前提に、OLS 推定量の分散を導出。まず

A= ¹ SXX

, B =(Xi_{− ¯}X)ui (6)

と置き、OLS の誤差表現を次のように変形。

βˆ= β +wiui = β + AB _⇔ β^ˆ_{− β = AB.} (7) A が X¹, X², . . . , Xnの関数である点に気づけば

Var( ˆβ_|X1, X2, . . . , X_n) = E( ˆβ_{− β)}²_|X1, X2, . . . , X_n

= E(A²B²_|X¹, X², . . . , Xn)

= A²E(B²_|X¹, X2, . . . , Xn). (8)

(10)

また標本の独立性から E(B²_|X¹, X2, . . . , Xn) = E

(Xi_{− ¯}X)ui

²

|X¹^{, X}², . . . , Xn

=E(Xi_{− ¯}X)²u²_i_|X¹, X², . . . , Xn

=(Xi_{− ¯}X)²E(u²_i_|X¹, X², . . . , Xn)

=(Xi_{− ¯}X)²E(u²_i_|Xi)

=(Xi_{− ¯}X)²σ²_i. (9)

(11)

以上の結果をまとめれば、次の通り。

公式 ₁

根源的仮定（誤差項の不均一分散）のもとで、_{OLS の条件付き分} 散は

Var( ˆβ_|X¹, X², . . . , Xn) = ¹ S_XX²

(Xi _{− ¯}X)²σ_i². (10)

証明：前段で証明済み。

誤差項_u_iの不均一分散を許容したOLS 推定量の分散は、非常に複雑！

(12)

... もし ui^{の分散が均一で}σ_i² = σ²^ならば、(10) 式は Var( ˆβ_|X¹, X², . . . , Xn) = ¹

S_XX²

(Xi_{− ¯}X)²σ²

= ^σ

2

S_XX²

(Xi_{− ¯}X)²

S_XX

= ^σ

2

SXX

. (11)

コレは見慣れた_{OLS の分散。}

(10) 式が複雑になる原因は、誤差項の不均一分散にあり。

(13)

Section 2 漸近正規性に基づく仮説検定

(14)

OLS ^{の漸近正規性}

回帰係数β の仮説検定には、OLS ˆβ の分散だけでなく、 ˆβ の従う確率分布の特定が必要。

(7) 式を、さらに次式に書き換え。

βˆ_{− β = AB} _⇔ β^ˆ_{− β = nA}_√ ¹ n^√n^B

⇔ ^√^{n( ˆ}^β− β) = nA√¹

n^B. ⁽¹²⁾

(15)

右辺のnA は、A の定義に従えば nA= ⁿ

SXX

= ⁿ

(Xi_{− ¯}X)² ⁼ n (n − 1)

1 s²_X ^≈

1

s²_X^. ⁽¹³⁾

∴ 近似的に_X_iの標本分散の逆数。

大数の法則（モーメントの収束）により plim nA = plim

n n_{− 1}

=1

1 plim s²_X ⁼

1

σ_X² ^. ⁽¹⁴⁾

(16)

また_J_i _{= (X}_i _{− ¯}_X)u_iと置き、

1

√n^{B を次式で表現。}

√1 n^B ⁼

√n¹ n

(Xi_{− ¯}X)ui =^√n¹ n

Ji =^√n ¯J. (15)

コレは_J_i _{= (X}_i_{− ¯}_X)u_iの標本平均_{J に、}^¯

√_{n をかけた統計量。} テキスト_{p200 より、J}_iの期待値と分散は

E(Ji) = 0, c² = Var(Ji) = E(Xi_{− µ}X)²σ_i² . (16)

∴ 中心極限定理により

√1 n^B ⁼

√n ¯J _{→ N(0, c}^d ²). (17)

(17)

以上の議論から、_{OLS 推定量 ˆ}β と回帰係数 β の間には漸近的に βˆ= β + _√¹

n × 定数 × 正規確率変数

正規分布に従う推定誤差

(18)

が成立。

中心極限定理による

1

√nB の正規近似がポイント。

(18)

公式 ₂

根源的仮定のもとで、OLS は漸近正規推定量。

√n( ˆβ_{− β)} _{→ N}^d

0, ¹ σ⁴_X^c

2

, c² = E(Xi_{− ¯}X)²σ²_i . (19)

証明：前段で証明済み．

一方古典的仮定は、誤差項_u_iの正規性から ˆ_{β の正規性を保証。}

(19)

ホワイトの頑健な標準誤差による検定

公式(19) を変形すれば、OLS の漸近分布は

βˆ _{∼ N}^a β,Avar( ˆβ). (20) ここで漸近分散は

Avar( ˆβ) = ¹

nσ_X⁴ ^E^(Xⁱ^{− ¯}^X)

2σ²_i . (21)

(20) 式を標準化 ⇒ β に関する（漸近的な）Z 統計量 Z = ^β^ˆ^{− β}

Avar( ˆβ)

∼ N(0, 1)a ⁽²²⁾

を得る。

残された問題：分母_{Avar( ˆ}β) に含まれる、未知の σ²_i ^をどうするか？

(20)

近年の実証分析では、_{Avar( ˆ}_{β) を}ホワイトの頑健な分散推定量 V = ¹

ns⁴_X 1 n

(Xi_{− ¯}X)²uˆ²_i = ¹ n²s⁴_X

(Xi_{− ¯}X)²uˆ²_i. (23)

で推定するのが一般的[White, 1980]。ここで ˆui = Yi_{− ˆ}α_{− ˆ}βXi^は

OLS 残差。

上式は、未知である不均一分散_E(u

2

i|Xⁱ^{) = σ}²i ^{を、推定可能}

なOLS 残差の 2 乗値 ˆu²_i ^{で置き換え。} (23) 式の平方根

s.e.( ˆβ) = ^√V = ¹ ns²_X

(Xi_{− ¯}X)²uˆ²_i (24)

はホワイトの標準誤差として知られる。

(21)

ホワイトの標準誤差は、計算が複雑。

... 統計ソフトの標準誤差オプションを使えば簡単。

例：gretl の OLS 変数設定ウィンドウで、左下端の「頑健標準誤差を使用する」をチェック⇒OLS の標準誤差・t 値がホワイトの方式に置き換わる。

(22)

Example 1

表1：中古マンション価格を表記の説明変数に OLS 回帰した結果。比較のため、通常の方式とホワイトの方式による標準誤差・有意性のt 値（漸近的な Z 値）を併記。

通常は、二種類の標準誤差・t 値を併記しなくてよい。誤差項分散の均一性という強い仮定に依らない、ホワイトのバージョンを載せればよい。

(23)

通常の分散ホワイトの分散係数標準誤差 _{t 値} 標準誤差 _{t 値} 定数項 _1896.26 _189.09 _10.03 _159.32 _11.90 駅までの時間 _-36.79 _10.01 _-3.68 _8.92 _-4.13 築年数 _-61.30 _4.59 _-13.35 _3.62 _-16.92 面積 _60.14 _2.21 _27.19 _2.69 _22.36 ワンルーム _-544.81 _161.23 _-3.38 _111.23 _-4.90 修正済み_R^¯

2 0.89

サンプル数_n ₁₉₄

表 1 : 標準誤差・t値の比較（被説明変数はマンション価格）

(24)

結局、何が変わったのか？

今回に至るまでの主題：古典的仮定よりも緩い前提条件、根源的仮定のもとでの_{OLS 推定。}

ここまで明らかに成ったこと：古典的仮定の分析の進め方を、ほぼそのまま踏襲して良い。

OLS は、実はかなり広範囲のデータに適用可能なテクニック！

(25)

Remark 2

根源的仮定のもとでも、これまで通りOLS 推定を使って大丈夫。回帰係数の推定：OLS で推定。OLS は不偏推定量・一致推定量。

仮説検定：t 検定（漸近的な Z 検定）。ただし標準誤差をホワイトの方式で求める。

(26)

今回の復習問題

次の設問に答えよ。各自用意した紙に解答し、退出時に提出せよ。講義名、日付、学籍番号、氏名を明記すること。

1 _{テキスト第}11 章復習問 11.1。

(27)

References

H. White. A heteroskedasticity-consistent covariance matrix

estimator and a direct test for heteroskedasticity. Econometrica, 48 (4):817–838, 1980.

鹿野繁樹. 新しい計量経済学. 日本評論社, 2015.

『新しい計量経済学』 鹿野研究室 slide20

標準誤差と検定の頑健化 (1)

Outline

前回の復習

Section 1

OLS の頑健な標準誤差

誤差項の不均一分散と非正規性

仮定 2 （根源的仮定・再掲）

Remark 1

不均一分散下の OLS の分散

公式 1

Section 2

漸近正規性に基づく仮説検定

OLS の漸近正規性

公式 2