担当:鹿野(大阪府立大学)
2013 年度後期
はじめに
前回の復習
比例的な不均一分散(不均一分散の特殊ケース)。
加重最小2乗法(WLS)による、不均一分散の除去。
今回学ぶこと
内生性問題。OLSが使えなくなる、深刻な問題。
内生性が起こる具体例:観測不可能な個体差、同時方程式モデル。
テキスト該当箇所:10.2、10.3章。浅野・中村(2010)の8章も参照。
1 内生性問題
1.1
外生的な説明変数と
OLS の一致性OLSの一致性(講義ノート#19):回帰モデル
Yi = α + βXi+ ui (1)
に関し,根源的仮定FA1(外生性) E(ui|Xi) = 0 ⇒
⎧
⎪⎪
⎨
⎪⎪
⎩
E(ui) = 0
E(uiXi) = 0 ⇒ (2)
およびFA2(独立な標本)が成立⇒OLS推定量 ˆβは回帰係数βの一致推定量。
. (3)
⊲ nが十分多ければ、未知のβはˆβで近似される。∴外生性が成立するデータでは、OLS は望ましい推定法。
1
⊲ 証明の復習:OLSの確率極限(サンプル数nが十分多い状態)は、一般に plim ˆβ = β +Cov(ui,Xi)
Var(Xi) . (4)
Xiが外生ならCov(ui,Xi) = 0なので
plim ˆβ = β + 0
Var(Xi) = β. (5)
Remark:なぜXiとuiが無相関だと、OLSがうまく働くのか?⇒模式図で表すと… (Xi
) ... ց 独立な振動 (
Yi
)! ... ր
(ui )
(6)
⊲ YiはXiとuiからの「波」が伝わって、振動。
⊲ Xiの変動とYiの変動は、観測可能。uiは観測できない。
⊲ ∴ uiとXiが独立に動いていれば、uiが見えなくともXiからYiへの振動の大きさを 識別できる!
1.2 OLS 推定の内生性バイアス
内生性:根源的仮定のうちFA1が成立せず
Cov(ui,Xi) 0 (7)
となるとき,Xiを と呼ぶ。
⊲ OLSのはじめての「敗北」:Xiが内生ならば
plim ˆβ = β +
0
Cov(ui,Xi)
Var(Xi) . (8)
∴OLSが、係数βの一致推定量になってくれない!
⊲ 内生性バイアス:内生性によりOLSに発生するバイアスCov(uVar(Xi,Xi)
i) を、
と呼ぶ。OLSは内生性バイアスの分だけ、真のβから外れた、見当違いの値に収束。
Remark:なぜXiとuiが相関すると、OLSがうまく働かないのか? (Xi
)
ց
共振 (
Yi )?
ր
(ui )
(9)
⊲ uiとXiが共振し、かつuiが観測できないならば、Xiの変動だけに注目してもYiへ の振動の大きさを識別できない。
⊲ 観測されるXi → Yiの振動は、ui→ Yiの振動も含んでしまう。
⊲ ... 除外変数バイアス(講義ノート#12)のメカニズムと酷似!
内生性のあるデータには、OLSを使えない。
⊲ これまでで最も深刻な問題。はじめてOLSを放棄。
⊲ OLSに代わる推定法⇒操作変数法(IV、次回)。
どんなデータだと、内生性が発生するか?⇒次のケースが典型的。 1. 観測不可能な個体属性(→除外変数バイアス)。
2. 説明変数の観測誤差(→希釈バイアス)。この講義では省略。⇒テキストp参照。 3. 同時方程式モデル(→同時性バイアス)。
2 内生性の発生するケース
2.1
観測不可能な個体属性
真の回帰モデルが、次式で与えられるとする。
Yi= α + βXi+ ai+ vi. (10)
ここでaiは、Yiに影響する、データとして観測できない因子( な個体属 性)。viは通常の意味での誤差項。
⊲ 簡単化のため、E(ai) = 0と仮定。
⊲ Xiは、viとは無相関だがaiとは相関すると仮定。
Cov(vi,Xi) = E(viXi) = 0, Cov(ai,Xi) = E(aiXi) . (11)
Remark:観測不可能な個体属性は、すべて に吸収される。
⊲ ∴分析者が直面する回帰モデルは
Yi = α + βXi+ ui, ただし ui= . (12)
⊲ この「汚染された」誤差項uiとXiの共分散は Cov(Xi,ui) = E(Xiui) = E(Xiai)
=Cov(ai,Xi)
+ E(Xivi)
=0
= Cov(ai,Xi) 0. (13)
上式を(8)式に代入すると
plim ˆβ = β + β. (14)
∴OLSに内生性バイアス発生。
除 外 変 数 バ イ ア ス:観 測 で き な い 属 性 に よって 起 こ る OLSの 内 生 性 バ イ ア ス を 特 に 、 と呼ぶ。
⊲ OLS推定量 ˆβは、aiがYiに与える影響を一部拾ってしまう。⇒ XiがYiに与える真 の影響βを 。バイアスの方向は、Cov(ai,Xi)の符号で決まる。
⊲ ∴重回帰で、説明変数を一部除外することによる除外変数バイアス(講義ノート#13) と、同じ構造。
⊲ ここでの問題は、aiが観測できない点。⇒観測できれば、説明変数のリストに加え てコントロールすれば良い。通常は、ムリ。
例:教育の収益の推定。労働者の年収wage
iを、就学年数educiと、その他コントロール 変数othersi(年齢や性別など)に回帰。
wagei = α + β1educi+ β2othersi+ ai+ ui (15) ここでaiは、個人iの (認知能力やコミュ能力、家庭の財力など)。
⇒ othersiでコントロールしきれない。
⊲ 一方aiと学歴educiは相関関係がある可能性。∴OLSでβ1を推定すると、除外変数 バイアスが発生!
⊲ 生産性で測った教育のリターンは、公的教育の評価で重要。
∗ Cov(educi,ai) 0:「できる人は学歴も高い」⇒高学歴者の高賃金は、その人 の能力のおかげ。公的教育は無駄では?
∗ Cov(educi,ai) 0:「できない人ほど学歴を求める」⇒公的教育は、OLSの推 定値以上の効果あり。
⊲ この問題を模式図で示せば
otheri
(コントロール可能)
ւ ց
educi −−−−−−−−−−−−−−OLS 推定値 ˆβ1→
=教育の効果(?)
wagei
տ ր
ai
(コントロール不可能)
(16)
2.2
同時性バイアス
同時方程式モデル:変数間の相互依存関係が、連立方程式を成す場合がある。例えば
Yi = α + βXi+ ui, (17)
Xi = γ0+ γ0Yi+ vi. (18)
これを と呼ぶ。
⊲ 「Xi → Yi、Yi → Xi」のフィードバックを表すモデル。⇒観測される(Xi,Yi)は、(17) 式と(18)式で同時決定される均衡点。
⊲ 簡単化のためE(ui) = E(vi) = 0と置く。また分散・共分散は
E(ui) = σ2u, E(uivi) = 0 (19) であると仮定(均一分散)。
Remark:Xiについて解けば Xi= γ0+ αγ1
1 − βγ1 + 1
1 − βγ1(γ1ui+ vi) = π0+ π1(γ1ui+ vi). (20)
⊲ 一つ目の回帰式(17)で、Xiとuiとの共分散は
Cov(Xi,ui) = E(Xiui) = Eπ0ui+ π1(β1u2i + uivi)
= π0E(ui)
=0
+π1β1E(u2i)
=σ2u
+π1E(uivi)
=0
= γ1σ
2u
1 − βγ1
0. (21)
⊲ 上式を(8)式に代入・整理すれば、
plim ˆβ = β + β, σ2X = Var(Xi). (22)
∴(17)式のβのOLS推定量 ˆβは、バイアスを伴う。
同時性バイアス:説明変数・被説明変数間の相互依存関係(フィードバック)により、OLS に同時性バイアスが生じる。
⊲ もしγ1= 0、つまり(18)式によるYi → Xiのフィードバックがなければ、uiとXiの 共分散は
Cov(Xi,ui) = γ1σ
2u
1 − βγ1 =
0 · σ2u
1 − β · 0 = 0. (23)
∴このとき同時性バイアスは生じない。
⊲ (18)側の係数推定も同様。β = 0でない限り、γ1のOLS推定にバイアスが発生。
例:「警官数policeiの増加は、犯罪crimeiに対し があるか」を実証したい分
析者が、次の回帰モデルをOLSしたとする。
crimei = α + β1policei+ β2othersi+ ui. (24)
(othersi=失業率など、その他コントロール変数。)
⊲ 一方で、「犯罪の多い地域ほど、警官が多く配備される」メカニズム( ) も同時にあるはず。
policei = γ0+ γ1crimei+ γ3othersi+ vi. (25) このフィードバックに気付かずに(24)式をOLS推定すると、ˆβ1の推定値に同時性バ イアスが発生!
⊲ この問題を模式図で示せば
OLS 推定値 ˆβ1
−−−−−−−−−−−−→
=抑止効果(?)
policei crimei
フィードバック
←−−−−−−−−−−−−
警官への需要
տ ր
othersi
(26)
まとめと復習問題
今回のまとめ
内生性問題:内生性バイアス⇒ OLSが一致推定量でなくなる。
内生性の例:観測不可能な個体差、同時方程式モデル。
復習問題
出席確認用紙に解答し(用紙裏面を用いても良い)、退出時に提出せよ。
1. 一致性を持たず、漸近的にバイアスを伴う推定量を推定に使うことの問題点を、簡単に説 明せよ。
2. 「警官数と犯罪」以外で、相互依存関係(フィードバック)により同時方程式が生じる例 を、一つ挙げよ。