非線形パネルの固定効果推定教育 OKUI, Ryo

(1)

平成²⁶年度ミクロ計量経済学

講義ノート⁴ 非線形パネルデータモデルの固定効果推定

このノートでは、固定効果の入った非線形モデルの推定を考察する。特に、固定効果推定量のバイアス修正法を紹介する。主なバイアス修正法は2つあり、一つはバイアスの式を解析的に導出しバイアスの推定量を構築する方法で、もう一つは、ジャックナイフと呼ばれる方法である。静学パネルデータモデルの場合と、動学パネルの場合とでは、ジャックナイフの方法が異なることも解説する。

4.1 _モデル

次のような、密度関数で書かれるモデルを考える。

fit(yit_{|θ, α}i) = f (yit_|xi1, . . . , x_iT; θ, αi) (1) ここで、yitはxitは外生変数と考える。θが推定したいパラメーターであり、αiが固定効果である。Nが大きくて、T がそれほど大きくない状況を分析の対象とする。ただT が小さくても問題であり、以下で紹介する方法がうまくいくには_{T ≥ 7}程度は必要であると思われる。

• ^{例として、}²項選択モデルを考える。この場合、yit _{∈ {0, 1}}で、Fをある分布関数として、

E(yit_|xit) = P (yit_{= 1|x}it) = F (θ^′xit+ αi) (2) とする。したがって、各観測値の尤度への貢献は、

f_it(y_it_{|θ, α}_i) = F (θ^′x_it+ α_i)^y^it_{(1 − F (θ}^′x_it+ α_i))^1−y^it (3) と書ける。

固定効果推定量 ^αiを母数として扱った、最尤推定量を、固定効果推定量と呼ぶことにする。推定量は、次のように

θˆ_T = arg max

θ

1 N

N

∑

i=1 T

∑

t=1

log f (y_it_{|θ, ˆ}α_i(θ)) (4) と定義する。ここで、

ˆ

α_i(θ) = arg max

α T

∑

t=1

log f (y_it_{|θ, α)} (5)

であり、それぞれのα_iを母数として取り扱っている。

固定効果推定量の問題は、_{N → ∞}でT を固定とした漸近理論を考えたときに、θ^ˆ_T は、一致性を持たないことである。なぜこのような問題が起こるのかを考察する。まず、目的関数は、

L_T(θ) = E ( _T

∑

t=1

log f (y_it_{|θ, ˆ}α_i(θ)) )

(6)

(2)

に収束する。ここでのポイントは、αˆ_i(θ)はそのままで、何かに収束するということはないということである。通常の議論から、

θˆ_T _→_pθ_T = arg max

θ ^L^T^(θ) ⁽⁷⁾

が成り立つ。しかし、一般的に、θ_T _{̸= θ}₀であり、したがって、θ^ˆ_T は、一致性を持たない。不一致の原因は、αˆ_iの推定誤差が漸近的にも残ってしまうことである。ちなみに、

θ₀= arg max

θ ^E

( _T

∑

t=1

log f (y_it_{|θ, α}_i) )

(8)

である。

この問題は付随パラメーター問題(Incidental Parameters Problem, Neyman and Scott (1948))の一種である。

解決法この固定効果推定量の不一致性の問題の解決には主に²つ流儀がある。

• T が固定されていても、一致性を持つ推定量を考える。T が固定されている状況で、一致性をもつような推定量は、これまでいろいろ研究があり、Arellano and Honore

(2001)にまとめられている。ただこの場合の問題は、

– 推定できないモデルが存在する。

– また、推定可能な場合でも、推定量の導出のやり方は、モデルに依存する。 – ある種のモデルでは、推定量の収束速度が^√Nより遅くなる。たとえば、Honore

and Kyriazidou (2000)などである。

– また、実証研究で必要となるすべての母数を推定できるわけではないので、可能な分析の幅が狭くなる。

• T が固定されているときの一致性はあきらめて、代わりに、Tがそれほど大きくなくてもうまくいくように、バイアス修正をかける。欠点は、Tが小さすぎるとうまくいかないことであり、利点は、

– このバイアス修正法は、一般的なモデルで使える。

– 最尤法のバイアス修正なので、推定量の分散は小さくななる。

– また、ジャックナイフなどの自動的にバイアス修正をかける方法もあり、簡単である。

4.2 固定効果推定量のバイアス

バイアス修正推定量を考えるために、まず、推定量のバイアスを考察する。

ここでは、N とT が同じ速度で、無限に行くような、漸近理論を使用する。さて、このとき、通常のモデルでは、

√N T (ˆθ_T _{− θ}_T_{) →}_dN (0, Ω) (9)

となる。Ωは漸近分散であるが、ここの議論には直接関係しない。

(3)

さて、θ_T はθ₀ではないが、Tが無限にいくとき、θ₀に収束する。通常のモデルなら、

θ_T = θ₀+^B T ^{+ O}

( 1 T²

)

(10) と書くことが出来る。よって、

√N T (ˆθ_T _{− θ}₀) = ^√N T (ˆθ_T _{− θ}_T) +^√N T^B T ^{+ O}

(√N T³

)

(11)

→d ^N

(

B lim^{√ N} T ^{, Ω}

)

(12)

となり、漸近分布を考えると、T が無限にいく状況でも、漸近分布の平均は、0にならず、バイアスが存在する。

4.3 _{バイアス修正推定量}

ここで紹介する内容は、Hahn and Newey (2004)で紹介されている方法であり、Li, Lindsay and Waterman (2003)にその原点がある。

Bの推定量をB^ˆと表記し、_{B →}^ˆ p ^Bを仮定する。そして、バイアス修正推定量を θ˜_T = ˆθ_T ₋^B^ˆ

T ⁽¹³⁾

と定義する。すると、

√N T (˜θ_T _{− θ}₀) = ^√N T (ˆθ_T _{− θ}_T) +^√N T^{B − ˆ}^B T ^{+ O}

(√N T³

)

(14)

→^d ^{N (0, Ω)} ⁽¹⁵⁾

となり、バイアスを消すことができる。

• このバイアス修正法では、漸近分散はΩのままで変化しない。つまり、漸近的には分散に影響を与えずバイアスを修正できる。そのような例は実はかなり稀でであり、通常はバイアスを修正すると分散が大きくなる。

• また、最尤推定の場合は、Ωが最小分散、つまり、θ^˜_T が有効推定量であることを示すことができる。Iwakura (2014)を参照。

• ^{バイアスの推定量は、}Hahn and Newey (2004)や、Arellano and Hahn (2007)に式が載っているので、それを参考に。式はかなり複雑であるが、ただ計算が面倒なだけで、難解でも、本質的な計算の難しさがあるわけではない。

• 実証研究では、限界効果(marginal effect)の推定も重要になる。限界効果のバイアス修正推定法も同じように考えることができる。特定のモデルに焦点を絞った分析としては、２項選択モデルの場合を扱ったFernandez-Val (2009)などが重要な文献である。

(4)

他のアプローチここでは、推定量のバイアスを修正する方法を紹介したが、他にも次のようなやり方もある。

• 目的関数に修正をかける方法。 Arellano and Hahn (2007)を参照。

• スコア（一次の条件）に修正をかける方法。 Arellano and Hahn (2007)を参照。

• Arellano and Bonhomme (2009)に固定効果に関して積分を取ることで、バイアスを消す方法が考案されている。

• Bonhomme (2012) は関数解析の手法を使い、固定効果を含むモーメント条件から固

定効果の影響を取り除く方法と、その方法が可能であるための条件を提示している。

4.4 _{ジャックナイフ法}

ジャックナイフ法によるバイアス修正法を紹介する。この方法は、バイアスの解析的な式を計算する必要がないため、簡単にいろいろなモデルに応用可能であり、非常に便利である。ただ、推定量を何度も計算する必要があるため、計算時間の面では、劣るかもしれない。

まず、θ^ˆ^(t)をt期のデータを抜いて計算した推定量とする。つまり、

θˆ^(t) = arg max

θ

1 N

N

∑

i=1

∑

s̸=t

log f (y_is_{|θ, ˆ}α_i(θ)) (16)

かつ、

ˆ

α^(t)_i (θ) = arg max

α

∑

s̸=t

log f (yis_{|θ, α)} (17)

と定義する。

そして、バイアス修正推定量を、

θˇ_T = T ˆθ_T _{− (T − 1)}

T

∑

t=1

θˆ^(t)/T (18)

とする。

この推定量は、バイアスを次のB^ˇで修正した推定量である。つまり、 θˇ_T = ˆθ_T ₋^B^ˇ

T^, ⁽¹⁹⁾

Bˇ

T ^{= (T − 1)} (1

T

∑

t=1

θˆ^(t)_{− ˆ}θ_T )

(20) として、バイアスを推定している。

次に、ジャックナイフ法により、なぜバイアス修正ができるのかを考察する。まず、θ^ˆは B/T のバイアスがかかっている。同じようにθ^ˆ^(t)にはそれぞれ、_{B/(T − 1)}のバイアスがかかっている。したがって、

(1 T

T

∑

t=1

θˆ^(t)_{− ˆ}θ )

(21)

(5)

は

(

θ0+ ^B T − 1

)

− (

θ0+ ^B T

)

= ^B

T (T − 1) ⁽²²⁾

の推定量として使えるのである。

• ここでは、１期だけを省いてパラメーターを推定するジャックナイフを考えたが、２つあるいは、より多くの期を省いて行うジャックナイフも考えることが可能である。

• また、ジャックナイフ法は、バイアスの式をコードに書く必要ないので、既存の計量パッケージでも、計算することが可能である。

• 限界効果の推定のバイアス修正もジャックナイフを用いて行うことが可能である。

4.5 _{動学モデルの場合}

動学モデルの場合には、バイアスの式はもっと複雑になり、またバイアスの推定法も変わるが、基本となる考え方は、同じである。バイアス式の導出と、バイアスの推定法は、Hahn and Kuersteiner (2007)と、Hahn and Kuersteiner (2011)で議論されている。ジャックナイフ法も、動学モデル用に少し変更を加える必要があり、Dhaene and Jachmans (2012)で議論されている。

また、具体的なモデルを考えたものとしては、2項選択モデルで、動学的要素の入ったモデルを、Fernandez-Val (2009) やCarro (2007)が分析している。他にも、Hospido (2012) が分散の時系列構造を表現するモデルを考察している。

非線形動学パネルデータモデルの例としては、説明変数に非説明変数のラグを含む2項選択モデルがあげられる。他の説明変数はないモデルの場合の尤度への貢献は

f_it(y_it_{|θ, α}_i) = F (θy_i,t−1+ α_i)^y^it_{(1 − F (θy}_i,t−1+ α_i))^1−y^it (23) である。このモデルも、固定効果推定を行い、バイアス修正をかけることができるが、バイアスの形状は、かなり複雑になる。

また、動学モデルの場合、あるいはデータに自己相関がある場合には、ジャックナイフは、そのまま適用することはできない。なぜなら、単純に標本から観測値を一つ除いた場合には、データの動学構造が崩れてしまうからである。動学構造を維持したまま、ジャックナイフのような方法を使用するには、データを系列に沿ってある固まりで観測値を除く作業をする必要がある。

ここでは、特に有用な、half-panel jackknife法を紹介する。これは、動学パネルモデルに適用可能なバイアス修正法である。非常に簡単に計算できるため、今後広く使用されるであろうと思われる。これは、時系列分析において、Quenouille (1949)によって提唱されたものであり、Dhaene and Jockmans (2012)によって、動学パネルモデルに拡張された。

次のようにして、half-panel jackknife法は適用できる。パネルデータとして_{{zit}ⁿi=1}^Tt=1

があるとする。まず、このパネルデータ全体を使用して、推定量θ^ˆ_nT を計算する。次に、τ をT /2の整数部分として、パネルデータを前半_{{zit}ⁿi=1}t=1^τ ^と、後半{{zit}ⁿi=1}^Tt=τ +1^にわ

ける。二つに分けたパネルデータから、推定量を計算し、それぞれ、θ^ˆ_nT,1とθ^ˆ_nT,2とする。 half-panel jackknifeによるバイアス修正推定量は、

2ˆθ_nT ₋^θ^ˆ^nT,1^{+ ˆ}^θ^nT,2

2 ⁽²⁴⁾

(6)

である。

このhalf-panel jackknife法がバイアスを消すことができるのは、通常のleave-one-out

jackknifeの場合と基本的に同じ原理による。固定効果推定量のT が固定された上での極限

をθT とすると、

θ_T = θ0+^B T ^{+ O}

( 1 T²

)

(25) と書ける。従って、half-panelでの推定量の極限は、

θ_{T /2}= θ0+^2B T ^{+ O}

( 1 T²

)

(26) となる。従って、half-panel jackknifeによるバイアス推定量は、B/T のバイアスがなくなるのである。この議論から、half-panel jackknife法は、動学が定常であることに強く依存していることもわかる。

4.6 個人効果と時間効果の入ったモデル

ここでは、個人効果に加えて、時間効果も入ったモデルを考察する。こうした動学モデルの固定効果推定と、バイアス修正はFernandez-Val and Weidner (2013)によって考察され

ている。_{N, T → ∞}という状況を考えているため、標本のサイズに応じて増えていく母数

が、個人効果と時間効果の二つあることになり、その理論分析は、かなり複雑なものになる。さらに、時間効果がもたらすバイアスも出るため、バイアスの式はかなり複雑である。一方で、half-panel jackknife法は、少し変えるだけで適用可能であるが、適用の仕方には曖昧な部分が残る。

ここで考えるモデルは、

f_it(y_it_{|θ, α}_i+ λ_t) = f (y_it_|x_it, θ, α_i+ λ_t) (27) と書けるモデルである。ここで、αi+ λtと固定効果と時間効果が加法的にモデルに入っていることが重要である。加法的に入っていないモデルは、さらに分析が複雑になり、現在のところ、決定的な解決法は見つかっていないと思われる。

Fernandez-Val and Weidner (2013)は次の罰則付き尤度を最大化することで推定量を得、その推定量をバイアス修正することを提唱した。

N

∑

i=1 T

∑

t=1

log f (yit_|xit, θ, αi+ λt_{) − b}

( _N

∑

i=1

αi₋ T

∑

t=1

λt

)

, (28)

ここで、b > 0である。この関数を、θ, α1, . . . , αN, λ1, . . . , λT について最大化する。この罰則項は、すべてのαiとλtが識別できないので、^∑_i=1^N αi=^∑^T_t=1λtという制約を自動的に置くためのものである。したがって、bの値は何でもよい。

この推定量は、漸近的に、個人効果からものと時間効果からものの、二種類のバイアスがでる。つまり、

√N T (ˆ_{θ − θ}_{N T}_{) →}_dN (0, V ) (29)

(7)

と、ある分散V を用いてかけるが、分布の中心はθ₀でなく、 θ_{N T} = θ₀+^B

T ⁺ D

N ⁽³⁰⁾

と、個人効果からのバイアスB/T と時間効果からのバイアスD/N の二つを含む。BとD を推定することでバイアス修正はできるが、バイアス修正の式はかなり複雑である。

バイアス修正はhalf-panel jackknifeの変格で行うこともできる。z_it = (y_it, x_it)とする。まず、通常のhalf-panel jackknifeのように_{{zit_}^{T /2}_t=1_}^N_i=1と_{{zit_}^T_{t=T /2+1}_}^N_i=1からθ^ˆN T,11と θˆ_{N T,12}を計算する。そして、横断面方向に標本を分割して、_{{zit}^Tt=1}^N/2i=1 ^と{{zit}^Tt=1}^N_i=N/2+1

からθ^ˆ_{N T,21}とθ^ˆ_{N T,32}を計算する。そして、バイアス修正済み推定量を

3ˆ_{θ −} ^θ^ˆ^{N T,11}^{+ ˆ}^θ^{N T,12}

2 ⁻

θˆ_{N T,21}+ ˆθ_{N T,22}

2 ⁽³¹⁾

とする。

このjackknifeによるバイアス修正の問題は2点あり、一つは、定常性の仮定に強く依存

していること、もう一つは横断面の分割の仕方がよくわからないことである。特に横断面については、観測値の並べ方に特に決まりなどがあるわけではないので、二つに分割するやり方を正当化するのは難しい。とはいえ、非常に実装が簡単であるため、実用上は魅力的である。

参考文献

[1] M. Arellano and S. Bonhomme. Robust priors in nonlinear panel data models. Econometrica, 77(2):489–536, 2009.

[2] M. Arellano and J. Hahn. Understanding bias in nonlinear panel models: Some recent de- velopments. In R. Blundell, W. K. Newey, and T. Persson, editors, Advances in Economics and Econometrics: Theory and Applications, Ninth World Congress, volume III, chapter 12, pages 381–409. Cambridge University Press, 2007.

[3] M. Arellano and B. Honor´e. Panel data models: Some recent development. In J. J. Heckman and E. Leamer, editors, Handbook of Econometrics, volume 5, chapter 53, pages 3229–3296. Elsevier Science B. V., 2001.

[4] S. Bonhomme. Functional differencing. Econometrica, 80(4):1337–1385, 2012.

[5] J. M. Carro. Estimating dynamic panel data discrete choice models with fixed effects. Journal of Econometrics, 140:503–528, 2007.

[6] G. Dhaene and K. Jockmans. Split-panel jackknife estimation of fixed effects models. mimeo, 2012.

[7] I. Fern´andez-Val. Fixed effects estimation of structural parameters and marginal effects in panel probit models. Journal of Econometrics, 150:71–85, 2009.

[8] I. Fern´andez-Val and M. Weidner. Individual and time effects in nonlinear panel models with large N , T . mimeo, 2013.

[9] J. Hahn and G. Kuersteiner. Bandwidth choice for bias estimators in dynamic nonlinear panel models. mimeo, 2007.

[10] J. Hahn and G. Kuersteiner. Bias reduction for dynamic nonlinear panel models with fixed effects. Econometric Theory, 27:1152–1191, 2011.

[11] J. Hahn and W. Newey. Jackknife and analytical bias reduction for nonlinear panel models. Econometrica, 72(4):1295–1319, 2004.

(8)

[12] B. E. Honor´e and E. Kyriazidou. Panel data dicrete choice models with lagged dependent variables. Econometrica, 68(4):839–874, 2000.

[13] L. Hospido. Modelling heterogeneity and dynamics in the volatility of individual wages. Journal of Applied Econometrics, 27:386–414, 2012.

[14] H. Iwakura. Deriving the information bounds for nonlinear panel data models with fixed effects. mimeo, 2014.

[15] H. Li, B. G. Lindsay, and R. P. Waterman. Efficiency of projected score methods in rectangular array asymptotics. Journal of the Royal Statistical Society, Series B, 65:191–208, 2003. [16] J. Neyman and E. L. Scott. Consistent estimates based on partially consistent observations.

Econometrica, 16:1–32, 1948.

[17] M. Quenouille. Approximation tests of correlation in time series. Journal of Royal Statistical Society, B, 11:18–84, 1949.

非線形パネルの固定効果推定 教育 OKUI, Ryo

参考文献

非線形パネルの固定効果推定教育 OKUI, Ryo