担当:鹿野(大阪府立大学)
2013 年度後期
はじめに
前回の復習
説明変数の内生性:内生性バイアス⇒ OLSが一致推定量でなくなる。
内生性が起こる例:観測不可能な個体差、同時方程式モデル。
今回学ぶこと
操作変数法(IV)。
二段階最小2乗法(2SLS)。
テキスト該当箇所:10.4、10.5章。
1 操作変数法
1.1 操作変数とは?
内生性バイアス(講義ノート#20):回帰モデル
Yi = α + βXi+ ui (1)
のOLS推定量は、漸近的に
plim ˆβ = β +Cov(Xi,ui)
Var(Xi) . (2)
⊲ Xiが外生的:Cov(Xi,ui) = 0 ⇒ plim ˆβ = β。左辺第2項が消える。
⊲ Xiが内生的:Cov(Xi,ui) 0 ⇒ plim ˆβ β。 Cov(XVar(Xi,ui)
i) が発生。
⊲ ∴ Xiが内生変数となる分析では、OLS推定が通用しない。⇒別の推定法が必要に。
内生性バイアスのイメージ(再掲)
(Xi
)
ց
共振 (
Yi)?
ր
(ui)
(3)
1
⊲ 回帰モデル右辺のuiとXiが共振(正確にはCov(Xi,ui) 0)⇒OLSでXi→ Yiへの
振動が識別できない。
Remark:Xiが内生的であっても、もし次のような変数Ziが存在すれば、Xi→ Yiへの振 動を識別できるのでは?
(Xi)
ր ց
(Zi) 共振 (Yi)!!
ր
(ui
)
(4)
⊲ Ziは に作用し、 には作用しない。∴Ziはシステム(回帰モデル)の
外からやってくる 。
⊲ Ziが、uiとは独立なXiの変動を生む⇒その結果Xi → Yiの変動が識別される!
操作変数:次の条件を満たす変数Ziを、 (instrumental variables、 )と 呼ぶ。(数字の4ではない。)
⊲ IV1:Ziはuiに関し (→ )。
E(ui|Zi) = 0
外生性
⇒
⎧
⎪⎪
⎨
⎪⎪
⎩
E(ui) = 0 E(uiZi) = 0
直行
⇒ Cov(ui,Zi) = 0
無相関
. (5)
⊲ IV1:XiはZiと 。
Cov(Xi,Zi) 0. (6)
⊲ 操作変数ZiがXi,Yiと共に観測されるとき、どうすれば推定に生かすことができるか?
1.2 操作変数法( IV)
「推定量を構築する」という側面から内生性問題を考えると?
⊲ Xiが内生的⇒ が成立しない。
E(ui) = E(Yi− α − βXi) 0 (7) E(uiXi) = E(Yi− α − βXi)Xi 0 (8)
∴モーメント推定(講義ノート#19)に使えない。
⊲ 一方、条件IV1より
E(ui) = E(Yi− α − βXi) = 0, (9) E(uiZi) = E(Yi− α − βXi)Zi= 0. (10) 理論上、未知の係数α, βは上式を満たす。∴ Xiとuiの直行条件に代わり、(9)式・(10) 式に基づくモーメント推定を行えば良い。
操作変数法;Ziの直行条件に基づく標本モーメントは 1
n
(Yi− ˆα − ˆβXi) = 0, 1 n
(Yi− ˆα − ˆβXi)Zi= 0. (11)
上式を解くと(解き方はOLSと同じ:講義ノート#06参照)、
ˆβIV= (Zi− ¯Z)(Yi− ¯Y)
(Zi− ¯Z)(Xi− ¯X), αˆIV= ¯Y − ˆβIV
X.¯ (12)
これを と呼ぶ。
⊲ 後々のため、ˆβIVを次のように変形(講義ノート#19参照)。 ˆβIV= β +
1
n (Zi− ¯Z)(ui− ¯u) 1
n (Zi− ¯Z)(Xi− ¯X)
= β + sZu
sZX. (13)
IVの一致性:IV推定量βˆIVは、βの 。
plim ˆβIV= β. (14)
⊲ ∴ Xiが内生変数でも、操作変数の条件IV1、IV2を満たすZiがデータとして観測さ れるならば、Xiの係数βの一致推定が可能。
⊲ 証明:n → ∞のとき、大数の法則(講義ノート#18)により
plim sZu = Cov(ui,Zi), plim sZX = Cov(Xi,Zi). (15)
よって(13)式両辺の確率極限をとると、一般的に
plim ˆβIV= β + Cov(ui,Zi)
Cov(Xi,Zi). (16)
操作変数の条件IV1、IV2が成立すれば
plim ˆβIV= β +
=0
Cov(ui,Zi) Cov(Xi,Zi)
0
= β. (17)
その他、IVの漸近的性質
⊲ IVも(外生性が成立した場合の)OLSと同様、漸近的に に従う。
ˆβIV∼ Nβ,Avar( ˆβIV). (18)
⊲
Avar( ˆβIV) = C
nσ2ZX, C = plim 1 n
(Zi− ¯Z)2u2i (19)
は、ホワイトの分散推定(講義ノート#20)で計算。
⊲ ∴OLSのときと同じやり方で、係数の有意性検定を行えばよい。
2 二段階最小 2 乗法( 2SLS )
2.1 2SLS:操作変数のもう一つの使い方
構造型:(4)式の模式図を、モデルで表せば
Xi = γ0+ γ1Zi+ vi, (20)
Yi = α + βXi+ ui. (21)
これを (こうぞうけい)と言う。誤差viは、Ziで説明できないXiの変動。
⊲ (20)式:ZiがXiに作用するパート。条件IV2より、Cov(Zi,Xi) 0 ⇒ γ10。
⊲ (21) 式:回 帰 モ デ ル 本 体 。条 件 IV1よ り、Cov(Zi,ui) = 0。一 方 Xi は 内 生 的 で 、 Cov(Xi,ui) 0(コレが諸悪の根源)。
Remark:(20)式より、次のロジックが成り立つ。
Cov(Zi,ui) = 0, Cov(Xi,ui) 0 ⇒
⎧
⎪⎪
⎨
⎪⎪
⎩
Cov(vi,ui) 0,
Cov(vi,Zi) = 0 (22)
∴ Xiとuiの相関(内生性)の原因は、 の相関。
⊲ ∴ Xiは次のように分解できる。
Xi = γ0+ γ1Zi 外生的
+ vi 内生的
= Xei + vi. (23)
Xiの変動のうち、Xieの部分は外生的。
⊲ Xiの浄化:(23)式をOLS推定し、ZiによるXiの予測値Xˆiを作れば、Xiの
な変動を抽出できる!
ˆγ1 = SXZ
SZZ, ˆγ0= ¯X − ˆγ1Z¯
OLS
⇒ Xˆi= ˆγ0+ ˆγ1Zi
外生的な変動
, i = 1.2, . . . , n. (24)
二段階最小2乗法:まず(23)のOLS推定でXiの外生部分Xˆiを求め、次いでYiをXˆiに OLS回帰して得られる
ˆβ2SLS= ( ˆXi− ¯X)(Yi− ¯Y) ( ˆXi− ¯X)2 =
SXYˆ
SX ˆˆX
(25)
を、 (two-stage least squares、 )と呼ぶ。
⊲ (20)を(21)に代入すれば
Yi= α + β(γ0+ γ1Zi) + ui+ βvi = α + βXie+ uei. (26)
⊲ 定義上Cov(Xie,uei) = 0。また漸近的にplim ˆXi = Xie。
⊲ ∴YiをXˆiに回帰すれば、OLSに内生性バイアスが発生しない。
2.2 2SLS と IV の同値性
Remark:操作変数Ziの二つの使い方
⊲ 操作変数法IV:Ziを、直接操作変数として使う。⇒ ˆβIV
⊲ 二段階最小2乗法2SLS:Ziを使ってXiの外生的な変動を抽出、その後OLS推定。
⇒ ˆβ2SLS
⊲ どちらを使うべきか?⇒答え: 。実はˆβIV= ˆβ2SLS...両者は同値!
S ˆ
X ˆX とSXYˆ の別表現:2SLSの分母・分子は次の別表現を持つ。
SX ˆˆX = , SXYˆ = . (27)
⊲ 証明:SX ˆˆXに関しては、(24)式からスタートし、次のように変形。
Xˆi = ¯X − ˆγ1Z + ˆγ¯ 1Zi = ¯X + ˆγ1(Zi− ¯Z) ⇔ Xˆi− ¯X = ˆγ1(Zi− ¯Z)
両辺を2 乗
−−−−−−−−−→ ( ˆXi− ¯X)2= ˆγ12(Zi− ¯Z)2
−−−−−−−両辺の和→ ( ˆXi− ¯X)2
=SX ˆˆX
= ˆγ21
(Zi− ¯Z)2
=SZZ
.
(28)
SXYˆ の証明⇒宿題#06で。
2SLSとIVの同値性:2SLSとIVは、計算上同値である。
. (29)
∴どちらを採用しても、結果は同じ。
⊲ 統計ソフトでは、IV推定のコマンドが「2SLS」と表記されることが多い。(gretl:
「モデル」→「操作変数法(IV)」→「二段階最小2乗法(2SLS)」)
⊲ 証明:(27)式を2SLSの(25)式分子・分母に代入し、整理すれば
ˆβ2SLS= ˆγ1SYZ ˆγ21SZZ
= SˆYZ ˆγ1SZZ =
SZZ SXZ
SYZ SZZ =
SYZ
SXZ = ˆβIV. (30)
2.3 複数の操作変数による 2SLS
もし条件IV1、IV2を満たす操作変数が複数(L個)あったらどうする?
Z1i,Z2i, . . .ZLi, Cov(Zli,ui) = 0
IV1
, Cov(Zli,Xi) 0
IV2
. (31)
⊲ 少なくとも一つあれば、IV or 2SLSは実行可能。⇒どれを使うのが一番良いか?
⊲ 捨てるのはもったいない。
Remark:操作変数が複数ある場合、 ですべての操作変数を統合して使える。
⊲ 第1段階:内生的なXiを、Z1i,Z2i, . . .ZLiに重回帰⇒外生的なパートXˆiを作る。
⊲ 第2段階:Yiを、浄化されたXˆiに回帰。⇒ ˆβ2SLS。
⊲ 操作変数の数が ほど、2SLSの分散は小さくなること(有効性)が知られて いる。(入門レベルを超えるので、証明は省略。)
⊲ 注意:単一操作変数によるIVと、複数の操作変数による2SLSは、 。
例:短期雇用に就いた高校新卒者の割合を、失業率(景気)と県民所得に回帰。すべて対 数値。2010年、47都道府県データ。
OLS IV=2SLS 2SLS
係数 t値 係数 t値 係数 t値 定数項 -8.06 -2.99 -9.48 -2.93 -9.29 -2.91 失業率(内生) 1.58 3.38 2.07 3.98 2.01 3.84 県民所得 1.98 2.67 2.29 2.63 2.25 2.61
修正済みR2 0.16 0.16 0.16
操作変数の数 なし 1 2
サンプル数n 47 47 47
⊲ 失業率を内生変数と考え、操作変数を当てる。
⊲ IV:2005年の失業率。
⊲ 2SLS:2005年と、2000年の失業率。...結果は単一操作変数のIVとさほど変わらず。
⊲ OLSは、景気の影響を過小評価している可能性。内生性バイアス。
⊲ 注意: を操作変数に使うのは、少々問題アリ。(ラグ変数も、今 期のuiと相関している可能性があるため。)
まとめと復習問題
今回のまとめ
操作変数法(IV)。内生性が疑われるとき、OLSに代わる推定法。
二段階最小2乗法(2SLS)。操作変数が一つだけなら、IVと2SLSは同値。
復習問題
出席確認用紙に解答し(用紙裏面を用いても良い)、退出時に提出せよ。
1. 2段階最小2乗法2SLSに関する問い。
(a) 2SLSの手順を、簡潔に説明せよ。
(b) なぜ2SLSでβの一致推定ができるのか、簡潔に説明せよ。