平成26年度 ミクロ計量経済学
講義ノート4 非線形パネルデータモデルの固定効果推定
このノートでは、固定効果の入った非線形モデルの推定を考察する。特に、固定効果推定 量のバイアス修正法を紹介する。主なバイアス修正法は2つあり、一つはバイアスの式を解 析的に導出しバイアスの推定量を構築する方法で、もう一つは、ジャックナイフと呼ばれる 方法である。静学パネルデータモデルの場合と、動学パネルの場合とでは、ジャックナイフ の方法が異なることも解説する。
4.1 モデル
次のような、密度関数で書かれるモデルを考える。
fit(yit|θ, αi) = f (yit|xi1, . . . , xiT; θ, αi) (1) ここで、yitはxitは外生変数と考える。θが推定したいパラメーターであり、αiが固定効果 である。Nが大きくて、T がそれほど大きくない状況を分析の対象とする。ただT が小さ くても問題であり、以下で紹介する方法がうまくいくにはT ≥ 7程度は必要であると思わ れる。
• 例として、2項選択モデルを考える。この場合、yit ∈ {0, 1}で、Fをある分布関数と して、
E(yit|xit) = P (yit= 1|xit) = F (θ′xit+ αi) (2) とする。したがって、各観測値の尤度への貢献は、
fit(yit|θ, αi) = F (θ′xit+ αi)yit(1 − F (θ′xit+ αi))1−yit (3) と書ける。
固定効果推定量 αiを母数として扱った、最尤推定量を、固定効果推定量と呼ぶことにす る。推定量は、次のように
θˆT = arg max
θ
1 N
N
∑
i=1 T
∑
t=1
log f (yit|θ, ˆαi(θ)) (4) と定義する。ここで、
ˆ
αi(θ) = arg max
α T
∑
t=1
log f (yit|θ, α) (5)
であり、それぞれのαiを母数として取り扱っている。
固定効果推定量の問題は、N → ∞でT を固定とした漸近理論を考えたときに、θˆT は、 一致性を持たないことである。なぜこのような問題が起こるのかを考察する。まず、目的関 数は、
LT(θ) = E ( T
∑
t=1
log f (yit|θ, ˆαi(θ)) )
(6)
に収束する。ここでのポイントは、αˆi(θ)はそのままで、何かに収束するということはない ということである。通常の議論から、
θˆT →pθT = arg max
θ LT(θ) (7)
が成り立つ。しかし、一般的に、θT ̸= θ0であり、したがって、θˆT は、一致性を持たない。 不一致の原因は、αˆiの推定誤差が漸近的にも残ってしまうことである。ちなみに、
θ0= arg max
θ E
( T
∑
t=1
log f (yit|θ, αi) )
(8)
である。
この問題は付随パラメーター問題(Incidental Parameters Problem, Neyman and Scott (1948))の一種である。
解決法 この固定効果推定量の不一致性の問題の解決には主に2つ流儀がある。
• T が固定されていても、一致性を持つ推定量を考える。T が固定されている状況で、 一致性をもつような推定量は、これまでいろいろ研究があり、Arellano and Honore
(2001)にまとめられている。ただこの場合の問題は、
– 推定できないモデルが存在する。
– また、推定可能な場合でも、推定量の導出のやり方は、モデルに依存する。 – ある種のモデルでは、推定量の収束速度が√Nより遅くなる。たとえば、Honore
and Kyriazidou (2000)などである。
– また、実証研究で必要となるすべての母数を推定できるわけではないので、可能 な分析の幅が狭くなる。
• T が固定されているときの一致性はあきらめて、代わりに、Tがそれほど大きくなく てもうまくいくように、バイアス修正をかける。欠点は、Tが小さすぎるとうまくい かないことであり、利点は、
– このバイアス修正法は、一般的なモデルで使える。
– 最尤法のバイアス修正なので、推定量の分散は小さくななる。
– また、ジャックナイフなどの自動的にバイアス修正をかける方法もあり、簡単で ある。
4.2 固定効果推定量のバイアス
バイアス修正推定量を考えるために、まず、推定量のバイアスを考察する。
ここでは、N とT が同じ速度で、無限に行くような、漸近理論を使用する。さて、この とき、通常のモデルでは、
√N T (ˆθT − θT) →dN (0, Ω) (9)
となる。Ωは漸近分散であるが、ここの議論には直接関係しない。
さて、θT はθ0ではないが、Tが無限にいくとき、θ0に収束する。通常のモデルなら、
θT = θ0+B T + O
( 1 T2
)
(10) と書くことが出来る。よって、
√N T (ˆθT − θ0) = √N T (ˆθT − θT) +√N TB T + O
(√N T3
)
(11)
→d N
(
B lim√ N T , Ω
)
(12)
となり、漸近分布を考えると、T が無限にいく状況でも、漸近分布の平均は、0にならず、 バイアスが存在する。
4.3 バイアス修正推定量
ここで紹介する内容は、Hahn and Newey (2004)で紹介されている方法であり、Li, Lindsay and Waterman (2003)にその原点がある。
Bの推定量をBˆと表記し、B →ˆ p Bを仮定する。そして、バイアス修正推定量を θ˜T = ˆθT −Bˆ
T (13)
と定義する。すると、
√N T (˜θT − θ0) = √N T (ˆθT − θT) +√N TB − ˆB T + O
(√N T3
)
(14)
→d N (0, Ω) (15)
となり、バイアスを消すことができる。
• このバイアス修正法では、漸近分散はΩのままで変化しない。つまり、漸近的には分 散に影響を与えずバイアスを修正できる。そのような例は実はかなり稀でであり、通 常はバイアスを修正すると分散が大きくなる。
• また、最尤推定の場合は、Ωが最小分散、つまり、θ˜T が有効推定量であることを示す ことができる。Iwakura (2014)を参照。
• バイアスの推定量は、Hahn and Newey (2004)や、Arellano and Hahn (2007)に式が 載っているので、それを参考に。式はかなり複雑であるが、ただ計算が面倒なだけで、 難解でも、本質的な計算の難しさがあるわけではない。
• 実証研究では、限界効果(marginal effect)の推定も重要になる。限界効果のバイアス 修正推定法も同じように考えることができる。特定のモデルに焦点を絞った分析とし ては、2項選択モデルの場合を扱ったFernandez-Val (2009)などが重要な文献である。
他のアプローチ ここでは、推定量のバイアスを修正する方法を紹介したが、他にも次のよ うなやり方もある。
• 目的関数に修正をかける方法。 Arellano and Hahn (2007)を参照。
• スコア(一次の条件)に修正をかける方法。 Arellano and Hahn (2007)を参照。
• Arellano and Bonhomme (2009)に固定効果に関して積分を取ることで、バイアスを 消す方法が考案されている。
• Bonhomme (2012) は関数解析の手法を使い、固定効果を含むモーメント条件から固
定効果の影響を取り除く方法と、その方法が可能であるための条件を提示している。
4.4 ジャックナイフ法
ジャックナイフ法によるバイアス修正法を紹介する。この方法は、バイアスの解析的な式 を計算する必要がないため、簡単にいろいろなモデルに応用可能であり、非常に便利である。 ただ、推定量を何度も計算する必要があるため、計算時間の面では、劣るかもしれない。
まず、θˆ(t)をt期のデータを抜いて計算した推定量とする。つまり、
θˆ(t) = arg max
θ
1 N
N
∑
i=1
∑
s̸=t
log f (yis|θ, ˆαi(θ)) (16)
かつ、
ˆ
α(t)i (θ) = arg max
α
∑
s̸=t
log f (yis|θ, α) (17)
と定義する。
そして、バイアス修正推定量を、
θˇT = T ˆθT − (T − 1)
T
∑
t=1
θˆ(t)/T (18)
とする。
この推定量は、バイアスを次のBˇで修正した推定量である。つまり、 θˇT = ˆθT −Bˇ
T, (19)
Bˇ
T = (T − 1) (1
T
T
∑
t=1
θˆ(t)− ˆθT )
(20) として、バイアスを推定している。
次に、ジャックナイフ法により、なぜバイアス修正ができるのかを考察する。まず、θˆは B/T のバイアスがかかっている。同じようにθˆ(t)にはそれぞれ、B/(T − 1)のバイアスが かかっている。したがって、
(1 T
T
∑
t=1
θˆ(t)− ˆθ )
(21)
は
(
θ0+ B T − 1
)
− (
θ0+ B T
)
= B
T (T − 1) (22)
の推定量として使えるのである。
• ここでは、1期だけを省いてパラメーターを推定するジャックナイフを考えたが、2 つあるいは、より多くの期を省いて行うジャックナイフも考えることが可能である。
• また、ジャックナイフ法は、バイアスの式をコードに書く必要ないので、既存の計量 パッケージでも、計算することが可能である。
• 限界効果の推定のバイアス修正もジャックナイフを用いて行うことが可能である。
4.5 動学モデルの場合
動学モデルの場合には、バイアスの式はもっと複雑になり、またバイアスの推定法も変わ るが、基本となる考え方は、同じである。バイアス式の導出と、バイアスの推定法は、Hahn and Kuersteiner (2007)と、Hahn and Kuersteiner (2011)で議論されている。ジャックナイ フ法も、動学モデル用に少し変更を加える必要があり、Dhaene and Jachmans (2012)で議 論されている。
また、具体的なモデルを考えたものとしては、2項選択モデルで、動学的要素の入ったモ デルを、Fernandez-Val (2009) やCarro (2007)が分析している。他にも、Hospido (2012) が分散の時系列構造を表現するモデルを考察している。
非線形動学パネルデータモデルの例としては、説明変数に非説明変数のラグを含む2項選 択モデルがあげられる。他の説明変数はないモデルの場合の尤度への貢献は
fit(yit|θ, αi) = F (θyi,t−1+ αi)yit(1 − F (θyi,t−1+ αi))1−yit (23) である。このモデルも、固定効果推定を行い、バイアス修正をかけることができるが、バイ アスの形状は、かなり複雑になる。
また、動学モデルの場合、あるいはデータに自己相関がある場合には、ジャックナイフは、 そのまま適用することはできない。なぜなら、単純に標本から観測値を一つ除いた場合に は、データの動学構造が崩れてしまうからである。動学構造を維持したまま、ジャックナイ フのような方法を使用するには、データを系列に沿ってある固まりで観測値を除く作業をす る必要がある。
ここでは、特に有用な、half-panel jackknife法を紹介する。これは、動学パネルモデルに 適用可能なバイアス修正法である。非常に簡単に計算できるため、今後広く使用されるであ ろうと思われる。これは、時系列分析において、Quenouille (1949)によって提唱されたも のであり、Dhaene and Jockmans (2012)によって、動学パネルモデルに拡張された。
次のようにして、half-panel jackknife法は適用できる。パネルデータとして{{zit}ni=1}Tt=1
があるとする。まず、このパネルデータ全体を使用して、推定量θˆnT を計算する。次に、τ をT /2の整数部分として、パネルデータを前半{{zit}ni=1}t=1τ と、後半{{zit}ni=1}Tt=τ +1にわ
ける。二つに分けたパネルデータから、推定量を計算し、それぞれ、θˆnT,1とθˆnT,2とする。 half-panel jackknifeによるバイアス修正推定量は、
2ˆθnT −θˆnT,1+ ˆθnT,2
2 (24)
である。
このhalf-panel jackknife法がバイアスを消すことができるのは、通常のleave-one-out
jackknifeの場合と基本的に同じ原理による。固定効果推定量のT が固定された上での極限
をθT とすると、
θT = θ0+B T + O
( 1 T2
)
(25) と書ける。従って、half-panelでの推定量の極限は、
θT /2= θ0+2B T + O
( 1 T2
)
(26) となる。従って、half-panel jackknifeによるバイアス推定量は、B/T のバイアスがなくな るのである。この議論から、half-panel jackknife法は、動学が定常であることに強く依存し ていることもわかる。
4.6 個人効果と時間効果の入ったモデル
ここでは、個人効果に加えて、時間効果も入ったモデルを考察する。こうした動学モデル の固定効果推定と、バイアス修正はFernandez-Val and Weidner (2013)によって考察され
ている。N, T → ∞という状況を考えているため、標本のサイズに応じて増えていく母数
が、個人効果と時間効果の二つあることになり、その理論分析は、かなり複雑なものになる。 さらに、時間効果がもたらすバイアスも出るため、バイアスの式はかなり複雑である。一方 で、half-panel jackknife法は、少し変えるだけで適用可能であるが、適用の仕方には曖昧な 部分が残る。
ここで考えるモデルは、
fit(yit|θ, αi+ λt) = f (yit|xit, θ, αi+ λt) (27) と書けるモデルである。ここで、αi+ λtと固定効果と時間効果が加法的にモデルに入って いることが重要である。加法的に入っていないモデルは、さらに分析が複雑になり、現在の ところ、決定的な解決法は見つかっていないと思われる。
Fernandez-Val and Weidner (2013)は次の罰則付き尤度を最大化することで推定量を得、 その推定量をバイアス修正することを提唱した。
N
∑
i=1 T
∑
t=1
log f (yit|xit, θ, αi+ λt) − b
( N
∑
i=1
αi− T
∑
t=1
λt
)
, (28)
ここで、b > 0である。この関数を、θ, α1, . . . , αN, λ1, . . . , λT について最大化する。この罰 則項は、すべてのαiとλtが識別できないので、∑i=1N αi=∑Tt=1λtという制約を自動的に 置くためのものである。したがって、bの値は何でもよい。
この推定量は、漸近的に、個人効果からものと時間効果からものの、二種類のバイアスが でる。つまり、
√N T (ˆθ − θN T) →dN (0, V ) (29)
と、ある分散V を用いてかけるが、分布の中心はθ0でなく、 θN T = θ0+B
T + D
N (30)
と、個人効果からのバイアスB/T と時間効果からのバイアスD/N の二つを含む。BとD を推定することでバイアス修正はできるが、バイアス修正の式はかなり複雑である。
バイアス修正はhalf-panel jackknifeの変格で行うこともできる。zit = (yit, xit)とする。 まず、通常のhalf-panel jackknifeのように{{zit}T /2t=1}Ni=1と{{zit}Tt=T /2+1}Ni=1からθˆN T,11と θˆN T,12を計算する。そして、横断面方向に標本を分割して、{{zit}Tt=1}N/2i=1 と{{zit}Tt=1}Ni=N/2+1
からθˆN T,21とθˆN T,32を計算する。そして、バイアス修正済み推定量を
3ˆθ − θˆN T,11+ ˆθN T,12
2 −
θˆN T,21+ ˆθN T,22
2 (31)
とする。
このjackknifeによるバイアス修正の問題は2点あり、一つは、定常性の仮定に強く依存
していること、もう一つは横断面の分割の仕方がよくわからないことである。特に横断面に ついては、観測値の並べ方に特に決まりなどがあるわけではないので、二つに分割するやり 方を正当化するのは難しい。とはいえ、非常に実装が簡単であるため、実用上は魅力的で ある。
参考文献
[1] M. Arellano and S. Bonhomme. Robust priors in nonlinear panel data models. Econometrica, 77(2):489–536, 2009.
[2] M. Arellano and J. Hahn. Understanding bias in nonlinear panel models: Some recent de- velopments. In R. Blundell, W. K. Newey, and T. Persson, editors, Advances in Economics and Econometrics: Theory and Applications, Ninth World Congress, volume III, chapter 12, pages 381–409. Cambridge University Press, 2007.
[3] M. Arellano and B. Honor´e. Panel data models: Some recent development. In J. J. Heckman and E. Leamer, editors, Handbook of Econometrics, volume 5, chapter 53, pages 3229–3296. Elsevier Science B. V., 2001.
[4] S. Bonhomme. Functional differencing. Econometrica, 80(4):1337–1385, 2012.
[5] J. M. Carro. Estimating dynamic panel data discrete choice models with fixed effects. Journal of Econometrics, 140:503–528, 2007.
[6] G. Dhaene and K. Jockmans. Split-panel jackknife estimation of fixed effects models. mimeo, 2012.
[7] I. Fern´andez-Val. Fixed effects estimation of structural parameters and marginal effects in panel probit models. Journal of Econometrics, 150:71–85, 2009.
[8] I. Fern´andez-Val and M. Weidner. Individual and time effects in nonlinear panel models with large N , T . mimeo, 2013.
[9] J. Hahn and G. Kuersteiner. Bandwidth choice for bias estimators in dynamic nonlinear panel models. mimeo, 2007.
[10] J. Hahn and G. Kuersteiner. Bias reduction for dynamic nonlinear panel models with fixed effects. Econometric Theory, 27:1152–1191, 2011.
[11] J. Hahn and W. Newey. Jackknife and analytical bias reduction for nonlinear panel models. Econometrica, 72(4):1295–1319, 2004.
[12] B. E. Honor´e and E. Kyriazidou. Panel data dicrete choice models with lagged dependent variables. Econometrica, 68(4):839–874, 2000.
[13] L. Hospido. Modelling heterogeneity and dynamics in the volatility of individual wages. Journal of Applied Econometrics, 27:386–414, 2012.
[14] H. Iwakura. Deriving the information bounds for nonlinear panel data models with fixed effects. mimeo, 2014.
[15] H. Li, B. G. Lindsay, and R. P. Waterman. Efficiency of projected score methods in rectangular array asymptotics. Journal of the Royal Statistical Society, Series B, 65:191–208, 2003. [16] J. Neyman and E. L. Scott. Consistent estimates based on partially consistent observations.
Econometrica, 16:1–32, 1948.
[17] M. Quenouille. Approximation tests of correlation in time series. Journal of Royal Statistical Society, B, 11:18–84, 1949.