平成26年度 ミクロ計量経済学 講義ノート1 静学的パネルデータモデル
このノートでは、線形な静学的パネルデータ分析の手法を紹介する。パネルデータは、 観測が難しい個人間の異質性を制御することが可能であり、近年のミクロ計量分析では、広 くつかわれている。なお、動学モデルや非線形モデルは別のノートで扱う。
1.1 静学パネルデータモデル
パネルデータとして、(yit, xit), i = 1, . . . N かつt = 1, . . . T を観測する状況を考える。iは 個人を表し、tは時間を表すとする。ここでは、短期間のパネルデータを考える。つまり、 T固定で、N → ∞となる漸近理論を考える。また、データは、iに関しては無作為標本と なっているとする。
yitとxitの間には線形関係があると仮定する。
yit= β′xit+ uit (1)
ここで、観測できないuitは次の二つの項から成り立っているとする。 uit = ηi
観測できない個人間の異質性を表現|{z}
+ ϵit
いわゆる誤差項|{z}
. (2)
時間を通じて一定なηiは、xitと相関していてもよい。したがって、uitとxitはηiを通 じて相関している可能性を排除しない。誤差項と説明変数に相関があると、OLS推定量は、 バイアスを持ち、一致性もない。
• このようなモデルを考える目的は、欠落変数によるバイアスが、時間を通じて一定な ものによって、引き起こされているときに、パネルデータがあれば、そのようなバイア スを回避できるということを、示すことである。固定効果は、そのような、時間を通 じて一定な、観測できない、xitと相関しているかもしれないものを、表現している。 強外生の仮定(SE)
E(ϵit|xi, ηi) = 0, (3)
xi = (xi1, . . . , xiT)′ としている。ϵitは任意の時間におけるxitと無相関であると仮定して いる。この仮定を満たすモデルを静学的パネルデータモデルという。
• 強外生の仮定を満たさないモデルで重要なものとしては、先決変数を含むモデルがあ げられる。先決変数とは、E(ϵit|xi1, . . . xit, ηi) = 0の仮定を満たすxitである。強外生 の場合と異なり、ϵitは将来のxitとは相関をしている可能性がある。たとえば、yi,t−1 がxitに含まれる場合が相当する。先決変数を含むモデルは動学モデルと呼ばれる。
1.2 固定効果推定量
推定量は次のステップで得ることができる。 1. ηiを取り除く。
2. ηiを取り除いたデータに対して、回帰をかける。
固定効果ηiは、各個人ごとの平均を計算し、それを各変数から引くことで、消去できる。 まず、各個人の時間を通じた平均を考える。
¯
yi = β′x¯i+ ηi+ ¯ϵi. (4) この式を元の式から引くことによって、ηiを消去することができる。
yit− ¯yi= β′(xit− ¯xi) + ϵit− ¯ϵi (5) 上の式を次のように書く。
¨
yit= β′x¨it+ ¨ϵit (6) 強外生の仮定のもとで、上の式の回帰変数と誤差項は無相関であり、回帰をまわすと、
N → ∞でT が固定されているときに一致性のある推定量を得ることが出来る。推定量は
β =ˆ ( N
∑
i=1
∑T t=1
¨ xitx¨′it
)−1 N
∑
i=1
∑T t=1
¨
xity¨it (7)
と書ける。この推定量には、いくつかの名前がある。 1. Fixed Effects Estimator(固定効果推定量) 2. Within Group Estimator
3. Least squares dummy variables 仮定
• E(ϵit|xi1, . . . , xiT, ηi) = 0
• (xi1, . . . , xiT, ϵi1, . . . , ϵiT), i = 1, . . . , Nは個人間について、i.i.d.である。
• (x′it, ϵit) は少なくとも4次までのモーメントを持つ。
• 多重共線性の問題は存在しない。
漸近的性質 以上の仮定の下で、固定効果推定量は、一致性をもち、漸近正規である。一致 性の証明は省略する。
固定効果推定量の漸近分布を導出する。まず、
√N ( ˆβ − β) = (1
N
∑N i=1
∑T t=1
¨ xitx¨′it
)−1
√1 N
∑N i=1
∑T t=1
¨
xitϵ¨it (8)
= (1
N
∑N i=1
∑T t=1
¨ xitx¨′it
)−1
√1 N
∑N i=1
∑T t=1
¨
xitϵit (9)
という展開する。なお、ここでは、∑Tt=1x¨it¨ϵit=∑Tt=1x¨itϵitという性質を使った。 通常の漸近理論を使って、
1 N
∑N i=1
∑T t=1
¨
xitx¨′it→p E ( T
∑
t=1
¨ xitx¨′it
)
(10)
ならびに、
√1 N
∑N i=1
∑T t=1
¨
xitϵit→dN (
0, E ( T
∑
t=1
∑T s=1
ϵitϵisx¨itx¨′is ))
(11) は証明できる。
したがって、固定効果推定量の漸近分布は、
√N ( ˆβ − β) →dN (0, VF E) . (12) であり、漸近分散は、
VF E = (
E ( T
∑
t=1
¨ xitx¨′it
))−1
E ( T
∑
t=1
∑T s=1
ϵitϵisx¨itx¨′is ) (
E ( T
∑
t=1
¨ xitx¨′it
))−1
(13)
である。
• 強外生の仮定は、x¨itとu¨itあるいは、¨ϵitを無相関にするための十分条件である。単に xitとϵitが無相関であると言う仮定だけでは、不十分である。なぜなら、x¨itには過去 も未来もすべての時点でのxitを含み、¨ϵitも同様に過去と未来のすべての時点でのϵit
を含んでいるからである。
• 多重共線性の仮定は、固定効果を取り除いたデータに対しておかれている。従って、 固定効果変換をすることで、0になってしまう、時間を通じて一定な変数は、その係 数を推定することはできない。もし、時間を通じて一定な変数に興味がある場合には、 別の方法を使用する必要がある。
1.3 固定効果推定量の標準誤差
VF Eの推定を考える。VF Eは俗にいうサンドイッチ型をとり、二つの部分からなる。まず、 1
N
∑N i=1
∑T t=1
¨
xitx¨′it→p E ( T
∑
t=1
¨ xitx¨′it
)
(14)
なので、E(∑Tt=1x¨itx¨′it)は簡単に推定できる。 次に、
E ( T
∑
t=1
∑T s=1
ϵitϵisx¨itx¨′is )
(15) の推定の問題を考える。まず、残差項をとる。
ˆ¨
ϵit= ¨yit− ˆβ′x¨it (16) そして、誤差項の代わりに、残差項を使って、漸近分散の推定をする。
1 N
∑N i=1
∑T t=1
∑T s=1
ˆ¨
ϵitˆ¨ϵisx¨itx¨′is. (17)
一致性の証明はそれほど難しくない。 1
N
∑N i=1
∑T t=1
∑T s=1
ˆ¨ϵitˆ¨ϵisx¨itx¨′is→p E ( T
∑
t=1
∑T s=1
ϵitϵisx¨itx¨′is )
. (18)
• この推定量はCluster-RobustとかHeteroskedasticity and Autocorrelation Constent と呼ばれる。(Arellano (1987))
• その名の通り、この推定量は、各個人の時系列に系列相関があっても、分散不均一で も、一致性を持つ。
• 多くの計量用パッケージで、この漸近分散を基にした、標準誤差や、検定統計量を計 算することが可能。
• 通常は、この漸近分散推定量を使うべき。 なぜ、Cluster-Robustを使うべきか
• 分散不均一は、経済データの分析では、常に気にする必要がある。
• また、系列相関も、近年、重要な問題であると指摘されている。(Bertrand, Duflo and Mullainathan (2004))
系列相関がない場合 系列相関がない場合は、Cluster robust推定量よりも精度の高い分散 推定量を得ることができるように思うやもしれないが、話は意外と単純ではない。もし系列 相関がないなら、
E ( T
∑
t=1
∑T s=1
ϵitϵisx¨itx¨′is )
= E ( T
∑
t=1
ϵ2itx¨itx¨′it )
(19)
となる。これを単純に
1 N
∑N i=1
∑T t=1
ˆ¨
ϵ2itx¨itx¨′it (20)
として推定すると問題がおこる。注意すべきことに、この推定量は、多くの計量パッケージ で計算できてしまう。
問題 Stock and Watson (2008)は、N が無限にいき、Tが固定されているという漸近理論 の元では、
1 N
∑N i=1
∑T t=1
ˆ¨
ϵ2itx¨itx¨′it (21)
は、一致性を持たないことを証明した。一致性がない原因はηiを取り除く固定効果変換に ある。固定効果変換は、実質的には、ηtを推定することで、その影響を取り除いている。し かし、ηiの推定に使用可能な観測値はTしかなく、Tは小さい状況を考えているので、ηiの 推定はうまくいかない。
• T が無限に行くなら、一致性を持つ。
• Stock and Watson (2008)では、一致性を持つように、バイアス修正する方法を紹介 している。
なぜ一致性を持たないのかを、理解するために、βの推定誤差がない場合の、漸近分散 推定量の、期待値を計算する。まず、i.i.d.の仮定と、¨ϵitの定義により、
E ( 1
N
∑N i=1
∑T t=1
¨ ϵ2itx¨itx¨′it
)
= E ( T
∑
t=1
¨ ϵ2itx¨itx¨′it
)
(22)
= E
∑T t=1
( ϵit− 1
T
∑T s=1
ϵis )2
¨ xitx¨′it
(23)
となる。次に2次の項を展開して、系列相関がないという仮定を使うと、
E
∑T t=1
( ϵit− 1
T
∑T s=1
ϵis )2
¨ xitx¨′it
(24)
= E ( T
∑
t=1
ϵ2itx¨itx¨′it )
−T2E ( T
∑
t=1
∑T s=1
ϵitϵisx¨itx¨′it )
(25)
+ 1 T2E
( T
∑
t=1
∑T s=1
∑T r=1
ϵisϵirx¨itx¨′it )
(26)
= T − 2 T E
( T
∑
t=1
ϵ2itx¨itx¨′it )
+ 1 T2E
( T
∑
t=1
∑T s=1
ϵ2isx¨itx¨′it )
(27)
となる。まず、1/T のオーダーで、
2 TE
( T
∑
t=1
ϵ2itx¨itx¨′it )
(28)
の分の、バイアスがでる。この部分のバイアスは簡単に修正できるが、その大きさは、無視 できない。
また、
E ( T
∑
t=1
∑T s=1
ϵ2isx¨itx¨′it )
= E ( T
∑
s=1
ϵ2is
∑T t=1
¨ xitx¨′it
)
(29)
という推定が必要となる項も出てくる。
• 計算からわかるように、バイアスをもたらす原因は、¨ϵitには、¯ϵiが入っていることで ある。つまり、固定効果を取り除くことによって生じる誤差が、問題となっている。
• これは、いわゆる、Incidental Parameter Problem (Neyman and Scott (1948))の一 例である。
Tが大きい場合 Cluster-robustな漸近分散推定量は系列相関について、何の仮定もしてい ない。したがって、もし時系列が長い場合には、定常性を仮定しないため、この推定量がど のような振る舞いをするかは、それほど単純な問題ではない。
ここでは、Hansen (2007)の論文の結果を簡単に紹介する。Hansen (2007)によると
• もし、N, T → ∞なら、この漸近分散推定量は一致性を持つ。
• ただ、収束の速度は遅く、√Nでしかない。もっと速い収束がほしい場合は、他の推 定量を使う必要がある。
もし、T は無限に行くものの、N が固定されているなら、
• この漸近分散推定量は、一致性を持たず、ある乱数に収束する。
• しかし、この漸近分散推定量を基にした、t統計量は、√N −1N tN −1分布に従い、Wald 統計量は、 N −qN q Fq,N −q分布(qは制約の数)に従う。
• なお、√N −1N tN −1→dN (0, 1)であり、N −qN q Fq,N −q→d χ2qなので、t分布や、F 分布 を使って、統計的推測をすれば、いかなる状況でも、うまくいく。
漸近分散推定量については、以下の論文も参考になる。
• Kezdi (2004)
• Peterson (2009) 1.4 時間効果
時間を通じて変化するが個人間では同じ影響を与える観測できない変数も、パネルデータを 用いることで、その影響を取り除くことができる。まず、回帰モデルは
yit= x′itβ + µi+ ηt+ wit (30) である。µiは個人固定効果である。さらにηtという、時間とともに変化するが個人間では同 じである変数も入っている。このηtを時間効果(time effect)、あるいは時間固定効果(time fixed effect)と呼ぶ。
個人効果と時間効果の両者が存在しても、ある種の変数変換を用いることでこれら変数を 除去することできる。y¨it= yit− ¯yi− ¯yt+ ¯yとして変数変換を行う。ただし、y¯t=∑Ni=1yit/N、
¯
y =∑Ni=1∑Tt=1yit/(N T )である。すると、変換後の変数は
¨
yit = ¨x′itβ + ¨wit (31) をいうモデルを満たす。変換後の回帰式からは、µiもηtもなくなっている。E(¨xitw¨it) = 0 と仮定すると、
βˆF E2= ( N
∑
i=1
∑T t=1
¨ xitx¨′it
)−1 N
∑
i=1
∑T t=1
¨
xity¨it = β + ( N
∑
i=1
∑T t=1
¨ xitx¨′it
)−1 N
∑
i=1
∑T t=1
¨
xitw¨it (32)
という推定量は一致性をもつ。
1.5 交互作用効果
個人効果と時間効果が、先ほどのように加法的に入っているのではなく、交互作用をもって 入っている場合も考慮することができる。これは、いわゆる因子モデルの一例である。モデ ルは
yit= x′itβ + λ′iFt+ wit (33) である。λiが個人効果であるが、交互作用効果モデルでは、因子負荷(factor loading)とよ ばれる。Ftが時間効果である。これも交互作用効果も出るでは、共通因子(factor)と呼ばれ
る。加法モデルでは、一般性を失わずに個人効果や時間効果はスカラーであると仮定できた が、交互作用効果モデルでは、個人効果の数によってモデルの意味合いが違ってくる。これ らの用語は因子モデルから来ている。
このモデルでもλiを除去する変換方法は考案されている。Holtz-Eakin, Newey and Rosen (1988)、Ahn, Lee and Schmidt (2013)やHayakawa (2012)などを参照。なお、この変換で はFtは除去できない。しかしTが小さい場合を考えるためFtの数も少なく、そのことは問 題とならない。
まず、共通因子の数が一つの場合にモデルからλiを除去する変換を紹介する。モデルは、 yit= x′itβ + λiFt+ wit (34) である。λiもFtもスカラーであると仮定する。(34)の両辺から、ϕt+1 = Ft+1/Ftを掛け ると、
ϕt+1yit= ϕt+1x′itβ + λiϕt+1Ft+ ϕt+1wit= ϕt+1x′itβ + λiFt+1+ ϕt+1wit (35)
となる。yit− ϕtyi,t−1を計算してまとめると、
yit= ϕtyi,t−1+ x′itβ − ϕtx′i,t−1β + wit− ϕtwi,t−1 (36) となる。変換後のモデルからは、λiが消えている。ϕtは残るが、これはパラメータとして 扱い、推定する。
推定に関しての注意点
• Ftで割るので、Ft= 0となるtがある場合には問題が起こる。
• 説明変数にyi,t−1があり、これは誤差項のwit− ϕtwi,t−1は相関している。そのため、 最小二乗法は使えない。動学パネルデータモデルの推定のように、操作変数推定をす る必要が出てくる。
• xi,t−1の係数はϕtβであり、ここからも、βに関する情報を得ることができる。そのた
め、非線形な関係式を解くことで、さらに効率的な推定量を得ることが可能である。 共通因子の数が複数ある場合にも同様の変換を拡張できる。共通因子の数が二つの場合、 モデルは
yit= β′xit+ λi1Ft1+ λi2Ft2+ wit (37) と表される。なお、λi1、λi2、Ft1、Ft2は全てスカラーである。まずλi1を除去する。ϕt+1,1= Ft+1,1/Ft1とすると、
yit= ϕt1yi,t−1+ β′xit− ϕt1β′xi,t−1+ λi2(Ft2− ϕt1Ft−1,2) + wit− ϕt1wi,t−1 (38) と表すことができる。これは、Ft2− ϕt1Ft−1,2を共通因子とする、共通因子が一つのモデル となる。したがって、同じ変換をもう一度すれば、λi2を消すことができる。共通因子の数 が3以上の場合も、同様の変換を繰り返せばよい。
1.6 変量効果モデル
変量効果モデルは次の仮定をおく。
E(ηi|xi) = 0. (39)
この仮定のもとでは、通常のOLSによって、一致推定が可能になる。
• 変量効果モデルの欠点: 変量効果の仮定は強すぎるかもしれない。個人間の異質性に 起因する欠落変数のバイアスはないと仮定しているため。
• 固定効果モデルの欠点: 時間を通じて一定な変数の効果を推定できない。
• 一般に変量効果モデルのほうが有効な推定量を得ることができる。 変量効果推定量 次の表記を使う。
yi=
yi1
. . . yiT
, xi=
x′i1 . . . x′iT
, ui =
ui1
. . . uiT
, (40)
次の仮定を置く。(Balestra-Nerloveモデルと呼ばれるものである。)
var(ϵi|xi) = σϵ2IT (41)
var(ηi|xi) = ση2 (42)
var(ui|xi) = σϵ2IT + ση2J ≡ ω, (43) ここで、JはT × T の1の行列である。
変量効果推定量はGLS推定量として定義し、それは、
βˆRE = ( N
∑
i=1
x′iω−1xi
)−1 N
∑
i=1
x′iω−1yi (44) となる。ωがわからない場合は、推定量ωˆを使用して、FGLS推定量として、変量効果推定 量を定めることができる。
βˆRE = ( N
∑
i=1
x′iωˆ−1xi )−1 N
∑
i=1
x′iωˆ−1yi (45)
なお、変量効果推定量の一致性のためには、強外生の仮定は必要である。なぜなら、x′iωˆ−1ϵi の期待値が0出ないといけないため。通常のOLSでは必要がない。
ちなみに、σ2ϵ と、ση2は次のように推定することができる。まず、固定効果推定(OLS推 定量を使用する場合もある)をして、
ˆ
σϵ2= 1 N (T − 1) − k
∑n i=1
∑T t=1
ˆ¨ ϵ2it
|{z}
FEの残差
. (46)
として、推定する。次に、
¯
yi = β ¯xi+ ¯ui. (47) を考えると、
var(¯ui) = σ2η+ 1 Tσ
2
ϵ, (48)
であり、var(¯ui)は 1n∑ni=1u¯2i で推定できるので、
ˆ
σ2η = \var(¯ui) −
1 Tσˆ
2
ϵ. (49)
としてして推定できる。
変量効果と固定効果 どちらを使用するべきか?経済理論から、変量効果の仮定はあり得な いことも多い。
また、Hausman検定をすることもできる。 推定量 /モデル 変量効果 固定効果
変量効果 一致、有効 不一致 固定効果 一致、有効でない 一致
∆ = ˆβF E− ˆβREとする。変量効果モデルの仮定のもとで、
var(∆) = var( ˆβF E) − var( ˆβRE). (50) つまり、変量効果モデルが正しいという仮定の下で、
∆′{ \var(∆)}−1∆ →dχ2k, (51) となる。
• しかし、Guggenberger (2010)の研究によると、Hausman検定を行い、もし棄却でき ないなら変量効果推定量を使用することは、推奨されない。問題は、Hausman検定は あまり検出力が高くないため、誤って、変量効果モデルが正しいとしてしまうことが よくあり、その場合、変量効果推定量をもとにした検定は、検定の水準を正しく定め ることができなくなるということである。
References
[1] S. C. Ahn, Y. H. Lee, and P. Schmidt. Panal data models with multiple time-varying individual effects. Journal of Econometrics, 174:1–14, 2013.
[2] M. Arellano. Computing robust standard errors for within-groups estimators. Oxford Bulletin of Economics and Statistics, 49(4):431–434, 1987.
[3] M. Bertrand, E. Duflo, and S. Mullainathan. How much should we trust differences-in- differences estimates. The Quarterly Journal of Economics, 119:249–275, 2004.
[4] P. Guggenberger. The impact of a hausman pretest on the size of a hypothesis test: The panel data case. Journal of Econometrics, 156:337–343, 2010.
[5] C. B. Hansen. Asymptotic properties of a robust variance matrix estimator for panel data when T is large. Journal of Econometrics, 141:597–620, 2007.
[6] K. Hayakawa. GMM estimation of short dynamic panel data models with interactive fixed effects. Journal of Japan Statistical Society, 42(2):109–123, 2012.
[7] D. Holtz-Eakin, W. Newey, and H. S. Rosen. Estimating vector autoregressions with panel data. Econometrica, 56(6):1371–1395, 1988.
[8] G. K´ezdi. Robust standard error estimation in fixed-effects panel models. Hangarian Statistical Review, 9:95–116, 2004.
[9] J. Neyman and E. L. Scott. Consistent estimates based on partially consistent observations. Econometrica, 16:1–32, 1948.
[10] M. A. Peterson. Estimating standard errors in finance panel data sets: Comparing approaches. Review of Financial Studies, 22(1):435–480, 2009.
[11] J. H. Stock and M. W. Watson. Heteroskedasticity-robust standard errors for fixed effects panel data regression. Econometrica, 76(1):155–174, 2008.