内生性バイアスと操作変数法計量経済学鹿野研究室 note23

(1)

担当：鹿野（大阪府立大学）

2013 年度後期

はじめに

前回の復習

説明変数の内生性：内生性バイアス_{⇒ OLS}が一致推定量でなくなる。

内生性が起こる例：観測不可能な個体差、同時方程式モデル。

今回学ぶこと

操作変数法（_IV）。

二段階最小₂乗法（_2SLS）。

テキスト該当箇所：_10.4、_10.5章。

1 ^{操作変数法}

1.1 ^{操作変数とは？}

内生性バイアス（講義ノート_#20）：回帰モデル

Yi = α + βXi+ ui (1)

の_OLS推定量は、漸近的に

plim ˆβ = β +^Cov(Xⁱ^,^uⁱ⁾

Var(X_i) ^. ⁽²⁾

⊲ Xi^{が外生的：}Cov(Xi^,ui) = 0 ⇒ plim ˆβ = β^。左辺第²^{項が消える。}

⊲ Xi^{が内生的：}Cov(Xi^,ui) 0 ⇒ plim ˆβ β^。 ^Cov(X_Var(Xⁱ^,uⁱ⁾

i) ^が発生。

⊲ ∴ X_iが内生変数となる分析では、_OLS推定が通用しない。_⇒別の推定法が必要に。

内生性バイアスのイメージ（再掲）

(Xi

)

ց

共振 ₍

Y_i)?

ր

(u_i)

(3)

1

(2)

⊲ ^{回帰モデル右辺の}ui^とXi^{が共振（正確には}Cov(Xi^,ui) 0^）⇒OLS^でXi→ Yi^への

振動が識別できない。

_Remark：_X_iが内生的であっても、もし次のような変数_Z_iが存在すれば、_X_i_{→ Y}_iへの振動を識別できるのでは？

(X_i)

ր ց

(Z_i) ^共振 (Y_i)!!

ր

(ui

)

(4)

⊲ Z_i^は ^{に作用し、} ^{には作用しない。}^∴Z_iはシステム（回帰モデル）の

外からやってくる。

⊲ Zi^が、ui^{とは独立な}Xi^{の変動を生む}^⇒^その結果Xi → Yi^{の変動が識別される！}

操作変数：次の条件を満たす変数_Z_iを、（instrumental variables^、 ^）と呼ぶ。（数字の₄ではない。）

⊲ IV1^：Z_i^はu_i^に関し ^（→ ^）^。

E(ui|Zi) = 0

外生性

⇒

⎧

⎪⎪

⎨

⎪⎪

⎩

E(u_i_{) = 0} E(uiZi) = 0

直行

⇒ Cov(ui^,Zi) = 0

無相関

. (5)

⊲ IV1^：Xi^はZi^と ^。

Cov(X_i,Z_i) 0. (6)

⊲ ^操作変数Z_i^がX_i,Y_iと共に観測されるとき、どうすれば推定に生かすことができるか？

1.2 ^{操作変数法（} IV)

「推定量を構築する」という側面から内生性問題を考えると？

⊲ X_i^が内生的⇒ ^{が成立しない。}

E(ui) = E(Yi− α − βXi) 0 (7) E(u_iX_i_{) = E}(Y_i− α − βX_i)X_i 0 (8)

∴モーメント推定₍講義ノート_#19）に使えない。

⊲ ^{一方、条件}IV1^より

E(ui) = E(Yi− α − βXi) = 0, ⁽⁹⁾ E(uiZi) = E^(Yi− α − βXi)Zi= 0. ⁽¹⁰⁾ 理論上、未知の係数_{α, β}は上式を満たす。∴ _X_iと_u_iの直行条件に代わり、₍₉₎式・₍₁₀₎ 式に基づくモーメント推定を行えば良い。

(3)

操作変数法；_Z_iの直行条件に基づく標本モーメントは 1

n

(Y_i− ˆα − ˆβX_i_{) = 0,} ¹ n

(Y_i− ˆα − ˆβX_i)Z_i_{= 0.} (11)

上式を解くと（解き方は_OLSと同じ：講義ノート_#06参照）、

ˆβ_IV₌ ^(Zⁱ^{− ¯}^Z)(Yⁱ^{− ¯}^Y)

(Zi^{− ¯}Z)(Xi^{− ¯}X)^, ^α^ˆ^IV^{= ¯}^{Y − ˆβ}^IV

X.¯ (12)

これをと呼ぶ。

⊲ ^{後々のため、}ˆβIVを次のように変形（講義ノート_#19参照）。 ˆβ_IV_{= β +}

1

n^(Zⁱ^{− ¯}^Z)(uⁱ^{− ¯u)} 1

n^(Zⁱ^{− ¯}^Z)(Xⁱ^{− ¯}^X)

= β + ^s^Zu

s_ZX^. ⁽¹³⁾

_IVの一致性：_IV推定量_βˆ_IVは、_βの。

plim ˆβ_IV_{= β.} (14)

⊲ ∴ Xiが内生変数でも、操作変数の条件_IV1、_IV2を満たす_Z_iがデータとして観測されるならば、_X_iの係数_βの一致推定が可能。

⊲ ^証明：n → ∞のとき、大数の法則（講義ノート_#18）により

plim s_Zu _{= Cov(u}_i,Z_i), plim s_ZX _{= Cov(X}_i,Z_i). (15)

よって₍₁₃₎式両辺の確率極限をとると、一般的に

plim ˆβ_IV_{= β +} ^Cov(uⁱ^,^Zⁱ⁾

Cov(Xi^,Zi)^. ⁽¹⁶⁾

操作変数の条件_IV1、_IV2が成立すれば

plim ˆβ_IV_{= β +}

=0

Cov(u_i,Z_i) Cov(X_i,Z_i)

₀

= β. ⁽¹⁷⁾

その他、_IVの漸近的性質

⊲ IVも（外生性が成立した場合の）_OLSと同様、漸近的にに従う。

ˆβ_IV∼ Nβ,Avar( ˆβIV). (18)

⊲

Avar( ˆβ_IV_{) =} ^C

nσ²_ZX^, ^{C = plim} 1 n

(Z_i− ¯Z)²u²_i (19)

は、ホワイトの分散推定（講義ノート_#20）で計算。

⊲ ∴OLSのときと同じやり方で、係数の有意性検定を行えばよい。

(4)

2 ^{二段階最小} 2 ^乗法（ 2SLS ^）

2.1 2SLS：操作変数のもう一つの使い方

構造型：₍₄₎式の模式図を、モデルで表せば

Xi = γ0+ γ1Zi+ vi^, (20)

Yi = α + βXi+ ui^. (21)

これを（こうぞうけい）と言う。誤差_v_iは、_Z_iで説明できない_X_iの変動。

⊲ (20)^式：Z_i^がX_iに作用するパート。条件_IV2より、_Cov(Z_i_,_X_i_{) 0 ⇒ γ}₁₀。

⊲ (21) 式：回帰モデル本体。条件 _IV1より、_Cov(Z_i_,_u_i_{) = 0}。一方 _X_i は内生的で、 Cov(Xi^,ui) 0^{（コレが諸悪の根源）}^。

_Remark：₍₂₀₎式より、次のロジックが成り立つ。

Cov(Z_i,u_i_{) = 0,} Cov(X_i,u_i) 0 ⇒

⎧

⎪⎪

⎨

⎪⎪

⎩

Cov(vi^,ui) 0,

Cov(v_i,Z_i_{) = 0} ⁽²²⁾

∴ _X_iと_u_iの相関（内生性）の原因は、の相関。

⊲ ∴ X_iは次のように分解できる。

Xi = γ0+ γ1Zi 外生的

+ ^vi 内生的

= X^e_i + vi^. (23)

Xi^{の変動のうち、}X_i^e^{の部分は外生的。}

⊲ Xi^の浄化^：(23)^式をOLS^推定し、Zi^によるXi^の予測値X^ˆi^{を作れば、}Xi^の

な変動を抽出できる！

ˆγ₁ ₌ ^S^XZ

S_ZZ^, ^ˆγ⁰^{= ¯}^{X − ˆγ}¹^Z^¯

OLS

⇒ X^ˆ_i_{= ˆ}γ₀_{+ ˆ}γ₁Z_i

外生的な変動

, i = 1.2, . . . , n. ⁽²⁴⁾

二段階最小₂乗法：まず₍₂₃₎の_OLS推定で_X_iの外生部分_Xˆ_iを求め、次いで_Y_iを_Xˆ_iに OLS^{回帰して得られる}

ˆβ2SLS= ^{( ˆ}^Xⁱ^{− ¯}^X)(Yⁱ^{− ¯}^Y) ( ˆX_i− ¯X)² ⁼

S_XYˆ

S_{X ˆ}ˆ_X

(25)

を、（two-stage least squares^、 ^{）と呼ぶ。}

⊲ (20)^を(21)^{に代入すれば}

Y_i_{= α + β(γ}₀_{+ γ}₁Z_i_{) + u}_i_{+ βv}_i _{= α + βX}_i^e_{+ u}^e_i. (26)

⊲ ^定義上Cov(X_iê,uê_i_{) = 0}^{。また漸近的に}plim ˆXi = X_iê^。

⊲ ∴Yi^をX^ˆi^{に回帰すれば、}OLSに内生性バイアスが発生しない。

(5)

2.2 2SLS と IV の同値性

_Remark：操作変数_Z_iの二つの使い方

⊲ ^{操作変数法}IV^：Z_iを、直接操作変数として使う。_{⇒ ˆ}_β_IV

⊲ ^{二段階最小}2^乗法2SLS^：Zi^を使ってXiの外生的な変動を抽出、その後_OLS推定。

⇒ ˆβ_2SLS

⊲ ^{どちらを使うべきか？}⇒^答え： ^。実はˆβ_IV_{= ˆ}β_2SLS...^{両者は同値！}

_S _ˆ

X ˆX ^と^SXY^ˆ ^{の別表現：}^2SLSの分母・分子は次の別表現を持つ。

S_{X ˆ}ˆ_X = ^, ^S_XYˆ = ^. ⁽²⁷⁾

⊲ ^証明：S_{X ˆ}ˆ_X^{に関しては、}(24)式からスタートし、次のように変形。

Xˆi = ¯X − ˆγ1Z + ˆγ^¯ 1Zi = ¯X + ˆγ1(Zi^{− ¯}Z) ⇔ X^ˆi^{− ¯}X = ˆγ1(Zi^{− ¯}Z)

両辺を_{2 乗}

−−−−−−−−−→ ( ˆXi^{− ¯}X)²_{= ˆ}γ₁²(Zi^{− ¯}Z)²

−−−−−−−両辺の和→ ( ˆX_i− ¯X)²

=S_{X ˆ}ˆ_X

= ˆ^γ²₁

(Z_i− ¯Z)²

=SZZ

.

(28)

S_XYˆ ^の証明^⇒^宿題#06^で。

_2SLSと_IVの同値性：_2SLSと_IVは、計算上同値である。

. (29)

∴どちらを採用しても、結果は同じ。

⊲ ^{統計ソフトでは、}IV^{推定のコマンドが「}2SLS」と表記されることが多い。（_gretl：

「モデル」_→「操作変数法（_IV）」_→「二段階最小₂乗法（_2SLS）」）

⊲ ^証明：(27)^式を2SLS^の(25)式分子・分母に代入し、整理すれば

ˆβ_2SLS₌ ^ˆγ¹^S^YZ ˆγ²₁SZZ

= Sˆ_YZ ˆγ₁S_ZZ ⁼

S_ZZ S_XZ

S_YZ S_ZZ ⁼

S_YZ

S_XZ ^{= ˆ}^β^IV^. ⁽³⁰⁾

2.3 ^{複数の操作変数による} 2SLS

もし条件_IV1、_IV2を満たす操作変数が複数（_L個）あったらどうする？

Z_1i,Z_2i, . . .Z_Li, Cov(Z_li,u_i_{) = 0}

IV1

, Cov(Z_li,X_i) 0

IV2

. (31)

⊲ 少なくとも一つあれば、_{IV or 2SLS}は実行可能。_⇒どれを使うのが一番良いか？

⊲ 捨てるのはもったいない。

(6)

_Remark：操作変数が複数ある場合、ですべての操作変数を統合して使える。

⊲ ^第1^{段階：内生的な}X_i^を、Z_1i,Z_2i, . . .Z_Li^に重回帰⇒^{外生的なパート}X^ˆ_i^を作る。

⊲ ^第2^段階：Yi^{を、浄化された}X^ˆi^に回帰。^{⇒ ˆ}^β2SLS^。

⊲ ^{操作変数の数が} ^ほど、2SLSの分散は小さくなること（有効性）が知られている。（入門レベルを超えるので、証明は省略。）

⊲ 注意：単一操作変数による_IVと、複数の操作変数による_2SLSは、。

例：短期雇用に就いた高校新卒者の割合を、失業率（景気）と県民所得に回帰。すべて対数値。₂₀₁₀年、₄₇都道府県データ。

OLS _IV=2SLS 2SLS

係数 _t値係数 _t値係数 _t値定数項 _-8.06 _-2.99 _-9.48 _-2.93 _-9.29 _-2.91 失業率（内生） _1.58 _3.38 _2.07 _3.98 _2.01 _3.84 県民所得 _1.98 _2.67 _2.29 _2.63 _2.25 _2.61

修正済み_R² _0.16 _0.16 _0.16

操作変数の数なし ₁ ₂

サンプル数_n ₄₇ ₄₇ ₄₇

⊲ 失業率を内生変数と考え、操作変数を当てる。

⊲ IV^：2005^{年の失業率。}

⊲ 2SLS^：2005^年と、2000^{年の失業率。}...^{結果は単一操作変数の}IV^{とさほど変わらず。}

⊲ OLSは、景気の影響を過小評価している可能性。内生性バイアス。

⊲ ^注意：を操作変数に使うのは、少々問題アリ。（ラグ変数も、今期の_u_iと相関している可能性があるため。）

まとめと復習問題

今回のまとめ

操作変数法（_IV）。内生性が疑われるとき、_OLSに代わる推定法。

二段階最小₂乗法（_2SLS）。操作変数が一つだけなら、_IVと_2SLSは同値。

復習問題

出席確認用紙に解答し（用紙裏面を用いても良い）、退出時に提出せよ。

1. 2^段階最小2^乗法2SLS^{に関する問い。}

(a) 2SLSの手順を、簡潔に説明せよ。

(b) ^なぜ2SLS^でβの一致推定ができるのか、簡潔に説明せよ。

内生性バイアスと操作変数法 計量経済学 鹿野研究室 note23