内生性バイアスと操作変数法計量経済学鹿野研究室 note22

(1)

担当：鹿野（大阪府立大学）

2013 年度後期

はじめに

前回の復習

比例的な不均一分散（不均一分散の特殊ケース）。

加重最小₂乗法（_WLS）による、不均一分散の除去。

今回学ぶこと

内生性問題。_OLSが使えなくなる、深刻な問題。

内生性が起こる具体例：観測不可能な個体差、同時方程式モデル。

テキスト該当箇所：_10.2、_10.3章。浅野・中村（₂₀₁₀）の₈章も参照。

1 ^{内生性問題}

1.1

^{外生的な説明変数と}

OLS の一致性

_OLSの一致性（講義ノート_#19）：回帰モデル

Y_i _{= α + βX}_i_{+ u}_i (1)

に関し，根源的仮定_FA1（外生性） E(ui|Xi) = 0 ^⇒

⎧

⎪⎪

⎨

⎪⎪

⎩

E(ui) = 0

E(uiXi) = 0 ^⇒ ⁽²⁾

および_FA2（独立な標本）が成立_⇒OLS推定量 _ˆβは回帰係数_βの一致推定量。

. (3)

⊲ nが十分多ければ、未知の_βは_ˆβで近似される。∴外生性が成立するデータでは、_OLS は望ましい推定法。

1

(2)

⊲ ^{証明の復習：}OLSの確率極限（サンプル数_nが十分多い状態）は、一般に plim ˆβ = β +^Cov(uⁱ^,^Xⁱ⁾

Var(Xi) ^. ⁽⁴⁾

X_i^{が外生なら}Cov(u_i,X_i_{) = 0}^なので

plim ˆβ = β + ⁰

Var(Xi) ^{= β.} ⁽⁵⁾

_Remark：なぜ_X_iと_u_iが無相関だと、_OLSがうまく働くのか？_⇒模式図で表すと… (Xi

) ... ց 独立な振動 ₍

Yi

)! ... ր

(u_i )

(6)

⊲ Yi^はXi^とuiからの「波」が伝わって、振動。

⊲ Xi^の変動とYi^{の変動は、観測可能。}ui^{は観測できない。}

⊲ ∴ u_i^とX_iが独立に動いていれば、_u_iが見えなくとも_X_iから_Y_iへの振動の大きさを識別できる！

1.2 OLS 推定の内生性バイアス

内生性：根源的仮定のうち_FA1が成立せず

Cov(u_i,X_i) 0 (7)

となるとき，_X_iをと呼ぶ。

⊲ OLS^{のはじめての「敗北」}^：X_i^{が内生ならば}

plim ˆβ = β +

₀

Cov(u_i,X_i)

Var(Xi) ^. ⁽⁸⁾

∴_OLSが、係数_βの一致推定量になってくれない！

⊲ ^{内生性バイアス}^：^{内生性により}OLS^{に発生するバイアス}^Cov(u_Var(Xⁱ^,Xⁱ⁾

i) ^を、

と呼ぶ。_OLSは内生性バイアスの分だけ、真の_βから外れた、見当違いの値に収束。

_Remark：なぜ_X_iと_u_iが相関すると、_OLSがうまく働かないのか？ (Xi

)

ց

共振 ₍

Y_i )?

ր

(u_i )

(9)

(3)

⊲ ui^とXi^{が共振し、かつ}uiが観測できないならば、_X_iの変動だけに注目しても_Y_iへの振動の大きさを識別できない。

⊲ ^{観測される}X_i → Y_i^{の振動は、}u_i→ Y_iの振動も含んでしまう。

⊲ ... 除外変数バイアス（講義ノート_#12）のメカニズムと酷似！

内生性のあるデータには、_OLSを使えない。

⊲ これまでで最も深刻な問題。はじめて_OLSを放棄。

⊲ OLS^{に代わる推定法}^⇒^{操作変数法（}IV^、次回）^。

どんなデータだと、内生性が発生するか？_⇒次のケースが典型的。 1. 観測不可能な個体属性（_→除外変数バイアス）。

2. ^{説明変数の観測誤差（}→^{希釈バイアス）}^{。この講義では省略。}⇒^テキストp^参照。 3. ^{同時方程式モデル（}→^{同時性バイアス）}^。

2 内生性の発生するケース

2.1

^{観測不可能な個体属性}

真の回帰モデルが、次式で与えられるとする。

Yi= α + βXi+ ai+ vi^. (10)

ここで_a_iは、_Y_iに影響する、データとして観測できない因子（な個体属性）。_v_iは通常の意味での誤差項。

⊲ ^{簡単化のため、}E(a_i_{) = 0}^と仮定。

⊲ X_i^は、v_i^{とは無相関だが}a_i^{とは相関すると仮定。}

Cov(vi^,Xi) = E(viXi) = 0, ^Cov(ai^,Xi) = E(aiXi) . (11)

_Remark：観測不可能な個体属性は、すべてに吸収される。

⊲ ∴分析者が直面する回帰モデルは

Yi = α + βXi+ ui^, ^ただし ui= ^. ⁽¹²⁾

⊲ この「汚染された」誤差項_u_iと_X_iの共分散は Cov(X_i,u_i_{) = E(X}_iu_i_{) = E(X}_ia_i)

=Cov(ai,Xi)

+ E(Xi^vi⁾

=0

= Cov(ai^,^Xi^{) 0.} ⁽¹³⁾

上式を₍₈₎式に代入すると

plim ˆβ = β + ^β. ⁽¹⁴⁾

∴_OLSに内生性バイアス発生。

(4)

除外変数バイアス：観測できない属性によって起こる _OLSの内生性バイアスを特に、と呼ぶ。

⊲ OLS^推定量 ˆβ^は、a_i^がY_iに与える影響を一部拾ってしまう。_{⇒ X}_iが_Y_iに与える真の影響_βを。バイアスの方向は、_Cov(a_i_,_X_i₎の符号で決まる。

⊲ ∴重回帰で、説明変数を一部除外することによる除外変数バイアス（講義ノート_#13）と、同じ構造。

⊲ ^{ここでの問題は、}a_i^{が観測できない点。}⇒観測できれば、説明変数のリストに加えてコントロールすれば良い。通常は、ムリ。

例：教育の収益の推定。労働者の年収_wage

i^{を、就学年数}^educⁱと、その他コントロール変数_others_i（年齢や性別など）に回帰。

wage_i = α + β1educi+ β2othersi+ ai+ ui (15) ここで_a_iは、個人_iの（認知能力やコミュ能力、家庭の財力など）。

⇒ othersiでコントロールしきれない。

⊲ ^一方a_i^と学歴educ_iは相関関係がある可能性。∴_OLSで_β₁を推定すると、除外変数バイアスが発生！

⊲ 生産性で測った教育のリターンは、公的教育の評価で重要。

∗ Cov(educ_i,a_i) 0^：「できる人は学歴も高い」_⇒高学歴者の高賃金は、その人の能力のおかげ。公的教育は無駄では？

∗ Cov(educi^,ai) 0^：「できない人ほど学歴を求める」_⇒公的教育は、_OLSの推定値以上の効果あり。

⊲ この問題を模式図で示せば

otheri

（コントロール可能）

ւ ց

educ_i −−−−−−−−−−−−−−^{OLS 推定値 ˆ}^β¹→

=教育の効果（？）

wage_i

տ ր

a_i

（コントロール不可能）

(16)

2.2

^{同時性バイアス}

同時方程式モデル：変数間の相互依存関係が、連立方程式を成す場合がある。例えば

Y_i _{= α + βX}_i_{+ u}_i, (17)

X_i _{= γ}₀_{+ γ}₀Y_i_{+ v}_i. (18)

これをと呼ぶ。

⊲ ^「Xi → Yi^、Yi → Xi」のフィードバックを表すモデル。_⇒観測される_(X_i_,_Y_i₎は、₍₁₇₎ 式と₍₁₈₎式で同時決定される均衡点。

(5)

⊲ ^{簡単化のため}E(ui) = E(vi) = 0と置く。また分散・共分散は

E(u_i_{) = σ}²_u, E(u_iv_i_{) = 0} (19) であると仮定（均一分散）。

_Remark：_X_iについて解けば X_i₌ ^γ⁰^{+ αγ}¹

1 − βγ₁ ⁺ 1

1 − βγ₁^(γ¹^uⁱ^{+ v}ⁱ^{) = π}⁰^{+ π}¹^(γ¹^uⁱ^{+ v}ⁱ^). ⁽²⁰⁾

⊲ ^{一つ目の回帰式}(17)^で、Xi^とui^{との共分散は}

Cov(X_i,u_i_{) = E(X}_iu_i_{) = E}π₀u_i_{+ π}₁(β₁u²_i _{+ u}_iv_i)

= π0E(ui)

=0

+π1^β1E(u²_i)

=σ²u

+π1E(uivi)

=0

= ^γ¹^σ

2u

1 − βγ1

_0. ₍₂₁₎

⊲ ^上式を(8)式に代入・整理すれば、

plim ˆβ = β + ^β, ^σ²X ^{= Var(X}ⁱ^). ⁽²²⁾

∴₍₁₇₎式の_βの_OLS推定量 _ˆβは、バイアスを伴う。

同時性バイアス：説明変数・被説明変数間の相互依存関係₍フィードバック）により、_OLS に同時性バイアスが生じる。

⊲ ^もしγ₁_{= 0}^、つまり(18)^式によるYi → Xiのフィードバックがなければ、_u_iと_X_iの共分散は

Cov(Xi^,ui) = ^γ¹^σ

2u

1 − βγ1 ⁼

0 · σ²_u

1 − β · 0 ^{= 0.} ⁽²³⁾

∴このとき同時性バイアスは生じない。

⊲ (18)^{側の係数推定も同様。}_{β = 0}^{でない限り、}γ₁^のOLS推定にバイアスが発生。

例：「警官数_police_iの増加は、犯罪_crime_iに対しがあるか」を実証したい分

析者が、次の回帰モデルを_OLSしたとする。

crime_i _{= α + β}₁police_i_{+ β}₂others_i_{+ u}_i. (24)

（_others_i₌失業率など、その他コントロール変数。）

⊲ ^一方で、「犯罪の多い地域ほど、警官が多く配備される」メカニズム（）も同時にあるはず。

police_i _{= γ}0+ γ1crimei+ γ3othersi+ vi^. (25) このフィードバックに気付かずに₍₂₄₎式を_OLS推定すると、_ˆβ₁の推定値に同時性バイアスが発生！

(6)

⊲ この問題を模式図で示せば

OLS 推定値 ˆβ1

−−−−−−−−−−−−→

=抑止効果（？）

police_i crime_i

フィードバック

←−−−−−−−−−−−−

警官への需要

տ ր

othersi

(26)

まとめと復習問題

今回のまとめ

内生性問題：内生性バイアス_{⇒ OLS}が一致推定量でなくなる。

内生性の例：観測不可能な個体差、同時方程式モデル。

復習問題

出席確認用紙に解答し（用紙裏面を用いても良い）、退出時に提出せよ。

1. 一致性を持たず、漸近的にバイアスを伴う推定量を推定に使うことの問題点を、簡単に説明せよ。

2. 「警官数と犯罪」以外で、相互依存関係（フィードバック）により同時方程式が生じる例を、一つ挙げよ。

内生性バイアスと操作変数法 計量経済学 鹿野研究室 note22