• 検索結果がありません。

パネル二項選択モデル 教育 OKUI, Ryo

N/A
N/A
Protected

Academic year: 2018

シェア "パネル二項選択モデル 教育 OKUI, Ryo"

Copied!
9
0
0

読み込み中.... (全文を見る)

全文

(1)

平成24年度 ミクロ計量経済学

講義ノート5 パネルデータにおける2項選択モデル

このノートでは、パネルデータの分析に使用する2項選択モデルの紹介と、その注意すべ き点を考察する。パネルデータ分析は、個人間の異質性を制御できることが利点であるが、 2項選択モデルのような非線形モデルでその利点を活かすのは、それほど自明ではない。ま た動学モデルの場合は、初期条件の定式化が必要となるが、いかにしてその定式化を行うか には議論の余地がある。

5.1 パネルデータ2項選択モデル

次のような単純な2項選択モデルを考える。

yit= 1{xitβ + vit≥ 0} (1)

i = i, . . . , n (n → ∞); t = 1, . . . T (T は固定)とする。ここで、 vit|Xi ∼ F

|{z}

正規分布やロジット分布など

(2)

と仮定し、iについては無作為標本を仮定する。vitは時系列方向には相関があることを許容 するモデルである。

このモデルの場合、「部分的」最尤推定量を使用することができる。つまり、目的関数を l =

n i=1

T t=1

[yitlog F (xitβ) + (1 − yit) log{1 − F (xitβ)}] (3)

として、β = arg min lˆ を推定量とするものである。なお、vitの時系列方向での相関を無視 しているため、lは真の尤度ではないかもしれない。しかし、βˆが一致性をもつことは、比 較的容易に示すことができる。

• この方法の問題点は、一致性があっても有効性は担保できていないことがあげられる。 またより本質的な問題として、個人間の異質性をvitに含めてしまっているため、個人 間の異質性を固定した上でのxitの効果を表現できていないことがある。実際、個人 間の異質性が変量効果で表現でき、モデルが正しいとしても、推定したβの値は、変 量効果の部分を制御したxitの効果にはならない。

なお、vitの相関を考慮するため、標準誤差の計算には、自己相関に頑健な標準誤差の 式を使用するべきである。

他にも、線形モデルを使用することもある。モデルは、

yit = xitβ + vit (4)

である。この方法の利点は、線形モデルの手法がそのまま使え、vitが固定効果を含む場合 や、動学モデルの推定も容易であることである。しかし、線形モデルであるので、yit= 1と なる確率が01の間に収まらないなどの問題を起こす可能性が高い。

(2)

5.2 観測できない異質性を考慮したモデル

パネルデータ分析の利点である、個人間の異質性の制御を行うため、

yit= 1{xitβ + µi+ vit≥ 0} (5) として、個人効果µiをモデルに含める。ここで、vit|Xiの分布は仮定しておく。

変量効果 まず、µiXiと独立であり、その分布がわかっている変量項効果モデルを考え る。つまり、追加的なじょうけんとして、

µi|Xi ∼ N (0, σµ2) (6)

と仮定する。なお、必ずしも正規分布を仮定する必要はない。また、

vi|Xi ∼ N (0, σv2I) (7)

を仮定する。

識別のために、σv2= 1という標準化をする。

ここで考えているモデルは、変量効果プロビットモデルという。

この場合、一致で有効な推定が可能になる。尤度関数の導出のために、µiについて条件 づけた確率を考察する。それは、

Pr(yi|Xi, µi) =

T t=1

Φ(xitβ + µi)yit(1 − Φ(xitβ + µi))1−yit (8)

と書ける。しかし、µiの密度は、ϕ(µiµ)/σµと仮定したので、µiについて積分をして、 Pr(yi|Xi) =

T

t=1

Φ(xitβ + µi)yit(1 − Φ(xitβ + µi))1−yit 1 σµ

ϕ( µi σµ

)

i (9)

という確率の表現を得る。 つまり、尤度関数は、

l =

n i=1

log Pr(yi|Xi) (10)

と書ける。また最尤推定量β = arg min lˆ は有効である。

ここでは、var(vit|xi, µi) = 1と仮定した。しかし、時点ごとに異なる分散を許容する ことができる。つまり、var(vit|xi, µi) = σ2vtと仮定する。ただし、識別のための標準 化として、σ2v1 = 1と仮定する。

(3)

Chamberlainのモデル 変量効果モデルでは、Xiµiが独立であることが仮定されてい た。これは、経済学上の応用では、正当化しにくい仮定である。この問題を緩和するため、 Chamberlain (1980)µi

µi = π + ΠXi+ ai, (11)

とモデル化することを提案した。ここで、aiiではない)が変量効果であると仮定する。例 えば、

ai|Xi ∼ N (0, σ2a) (12)

と仮定する。なお、πΠは誘導形の係数と解釈し、特に経済学的な意味づけを行わない。 この場合、確率は、

Pr(yit= 1|Xi, µi) = Φ(βxit+ µi) = Φ(βxit+ π + ΠXi+ ai) (13)

と書ける。つまり、

Pr(yit = 1|Xi) =

Φ(βxit+ π + ΠXi+ ai) 1 σaϕ

( a σa

)

da (14)

であり、尤度関数は、 l =

n i=1

log

T

t=1

Φ(βxit+ π + ΠXi+ ai)yit{1 − Φ(βxit+ π + ΠXi+ ai)}(1−yit(15))

× 1 σa

ϕ( a σa

)

da (16)

となる。つまり、aは積分をとることで消している。尤度関数を最大化して、(β, π, Π, σa) 推定する。

• 識別が可能である理由は、Xiがそれぞれのiについて同じように影響を与える一方で、 xitは時間とともに変動することである。したがって、時間を通じて変動しない回帰変 数の係数は識別できない。

• π + ΠXiの代わりに、π + Πi を使用することもよくある。Mundlak (1978)による 提案である。推定すべき変数の数を減らすことが可能であり、またバランスのとれて いないパネルデータの場合にも有用である。

• vitの分散不均一性も考慮できる。例えば、

vi1 ∼ N (0, 1) (標準化) (17)

vi2 ∼ N (0, σ22) (18)

. . . (19)

viT ∼ N (0, σT2) (20)

と仮定する。

(4)

5.3 固定効果ロジットモデル

次に、µiについては何も仮定しない、固定効果(FE)モデルを考える。 F vの分布として、尤度関数は

l =

n i=1

T t=1

[yitlog F (xitβ + µi) + (1 − yit) log{1 − F (xitβ + µi)}] (21)

を考える。しかし、一般に、この関数からµiを取り除いて推定することはできない。これ はモデルの非線形性による。

• 静学的ロジットモデルにおいては、固定効果を取り除くことができるが、それは、特殊 な状況であり、またロジットモデルでないと取り除くことはできない。Chamberlain (2010)ならびに、Magnac (2004)を参照せよ。

もし、T が固定されている状況で、(β, µ1, . . . , µn)について、lを最大化しても、一致性の ある推定量は得られない。これは、母数のうちµiの次元が無限であることから来る問題で あり、“incidental parameter problem (付随パラメーター問題)”あるいは、‘Neyman-Scott (1948)問題と呼ばれる。

なお、線形モデル、

yit = βxit+ µi+ vit (22)

の場合は、yitxitに回帰しその時に各人ごとに定数項ダミーを加えると固定効果推 定量を得られる。これは一致性をもつ。しかし、µiを一致性をもって推定することは できない。

T が無限に行く状況では、固定効果推定をすることができる。これは次のノートで議論 する。

ただし、ロジットモデルの場合には、固定効果を入れたモデルの推定をすることができ る。ここでは、条件付きロジットモデル(Chamberlain (1980))を考える。

一般理論 まず、一般的な固定効果を消去する方法から議論する。 今、次のような尤度関数があるとする。

l( y

|{z}

{yi1,...,yiT}

|X, θ, {µi}ni=1). (23)

重要なポイントは、i}n

i=1の十分統計量(S)を得ることである。つまり、

l(y|X, S, θ, {µi}ni=1) = l(y|X, S, θ) (24) となるような統計量Sがあるとよい。

• 例えば、誤差項が正規分布に従う線形モデル、 yit= βxit+ µi+ vit

|{z}

正規乱数

(25)

の場合は、

T

t=1yit = Siµiの十分統計量となる。このモデルの場合、固定効果推 定量が、条件付き最尤推定量となる。

(5)

パネル固定効果ロジットモデル 次に、今の議論の焦点である、2項選択モデルについて考 える。次のパネル固定効果ロジットモデル、

Pr(yit= 1|Xi, µi) = e

βxiti

1 + eβxiti (26)

を考察する。Tは固定と仮定する。 このモデルでは、

T

t=1yitµiの十分統計量となる。

簡単化のために、T = 2の場合を考える。つまり、Si = yi1+ yi2となる。以下では、Xiµiとに条件づけていることは省略する。次の確率を計算する。

Pr{(yi1, yi2) = (∗, ∗)|Si}. (27) もし、Si= 0あるいは、2の時は、それぞれ、(yi1, yi2) = (0, 0)あるいは、(1, 1)となる。つ まり、この時は分布は退化すし、尤度への貢献はない。

したがって、Si= 1の場合のみを考える。すると、

Pr{(yi1, yi2) = (0, 1)|Si = 1} (28)

= Pr{(yi1, yi2) = (0, 1)}

Pr{(yi1, yi2) = (0, 1), (1, 0)} (29)

=

1 1 + eβxi1i

eβxi2i 1 + eβxi2i 1

1 + eβxi1i

eβxi2i 1 + eβxi2i +

eβxi1i 1 + eβxi1i

1 1 + eβxi2i

(30)

= e

βxi2i

eβxi2i+ eβxi1i (31)

= e

β˙xi2

1 + eβ˙xi2 (32)

となり、µiは消える。なお ˙xi2= xi2− xi1としている。よって、条件付き対数尤度関数は、 l =

n i=1

[

1{(yi1, yi2) = (0, 1)} log

( eβ˙xi2 1 + eβ˙xi2

)

+ 1{(yi1, yi2) = (1, 0)} log

( 1

1 + eβ˙xi2 )]

(33)

となる。β = arg max lˆ は一致性をもつ。なお、βˆは固定効果を母数とした固定効果推定で はない。その違いについては、Abrevaya (1997)を参照せよ。

以上の方法では、βˆのみを得ることででき、µiについは未知のままである。βのみが わかっている状況ではどのような分析が可能であるかが、ここでの論点である。以下 で示すように、オッズ比については、βのみの知識で、分析が可能になる。オッズ比は

オッズ比=

Pr(yit= 1) Pr(yit= 0) = e

βxiti

(34)

である。よって、

log(オッズ比) = βxit+ µi (35)

から

∂xit

log(オッズ比) = β (36)

(6)

となり、オッズ比にxitの与える影響はβで表現できることがわかる。 しかし、限界効果

∂xit

Pr(yit = 1) (37)

を得ることはできない。そのためには、µiを既知とするか、µiの分布を仮定(つまり 変量効果にする)し、積分をとって消してしまうしかない。

5.4 動学的離散選択モデル

この節では、動学的なモデルを考える。具体的には、

Pr(yit= 1|xi, yi,t−1, . . . µi) = F (xitβ + αyi,t−1+ µi) (38) のように、ラグ付き被説明変数が説明変数としてつかわれるモデルである。このようなモデ ルを考える目的は、状態依存と個人の異質性とを区別したいことである。

• α: (真の)状態依存を表現している。

• µi: 見せかけの状態依存を表現している。

このモデルを推定する際に問題となるのは、初期値のyi0をどのように取り扱うかである。 変量効果推定 まずµiを固定されているものとして扱い、そして後ほど積分をとって消すとい

う、これまで考えてきた方法を考える。まず、各個人の尤度への貢献は、f (yi0, yi1, . . . , yiT|xi, yi0, µi) = f (yi1, . . . , yiT|xi, yi0, µi)f (yi0|xi, µi)である。このうち最初の項は

f (yi1, . . . , yiT|xi, yi0, mui) (39)

= f (yiT|yi1, . . . , yi,T−1, xi, yi0, µi) × f (yi1, . . . , yi,T−1|xi, yi0, µi) (40)

=

T t=1

f (yit|yi0, yi1, . . . yi,t−1, xiµi) (41)

=

T t=1

F (xitβ + αyi,y−1+ µi)yit × (1 − F (xitβ + αyi,y−1+ µi))1−yit (42)

≡ A(µi) (43)

と書ける。ここで、Gµiの分布として、単に

A(µ)dG(µ), (44)

として積分を取る方法は、正当化されない可能性がある。なぜなら、初期値の分布f (yi0|xi, µi) を無視しているからである。この方法でうまくいくのは、µiyi0が独立の時である。もし そうでないなら、最尤推定量は一致性をもたない。

(7)

1: マルコフ連鎖

y=0 y=1

1-F(c+mu)

1-F(c+alpha+mu)

F(c+alpha+mu) F(c+mu)

初期値の取り扱い方 したがって、初期値がµiと相関がある場合も考慮する必要がある。以 下の議論は、Heckman (1981)Hsiao (2003)を参考にしている。二つの方法を紹介する。

1. yの定常分布を使用する方法。いま、

Pr(yit= 1|yi,t−1, . . . , µi) = F (c + αyi,t−1+ µi) (45) であるとする。この時、µiを固定すると、yitはマルコフ連鎖になっている。したがっ て、その定常分布をp(c, α, µ¯ i)あるいはp¯とすると、それは、

(1 − ¯p)F (c + µi) + ¯pF (c + α + µi) = ¯p (46)

→ ¯p = F (c + µi)

1 + F (c + µi) − F (c + α + µi) (47) である。よって、

n i=1

log

A(µ)¯p(c, α, µ)yi0(1 − ¯p(c, α, µ))1−yi0dG(µ) = l (48)

として尤度を計算する。

この方法の欠点は、共変量のxiがあった時に、どうやって定常分布を見つけるのかが 自明ではないことである。

2. Chamberlain式のやり方(Heckmanの方法である。) 次の誘導形を考える。

Pr(yi0 = 1|Xi, µi) = F (π + ΠXi+ γµi), (49) ここで、(π, Π, γ)は誘導形の係数である。

すると、

n i=1

log

AF (π + Πxi+ γµi)yi0(1 − F )1−yi0dG(µi) (50)

となり、尤度が計算できる。

(8)

応用例 Hyslop (1999)による女性の労働参加の研究は、動学パネルモデルの重要な応用例 である。なお、Hyslopvit

vit= δvi,t−1+ ηit. (51)

のようにAR(1)に従うモデルも考える。この場合、尤度関数を得るのは難しい。なぜなら、

ϵi = (ϵi1, . . . , ϵi,T)についても積分をとる必要がある。T = 4なら、数値積分も難しく、シ ミュレーション推定をする必要がある。

動学的パネルロジットモデル Chamberlain (1985)Honore and Kyriazidou (2000)に動 学的固定効果パネルロジットモデルの推定が議論されている。

5.5 シミュレーション推定

パネルデータにおける離散選択モデルの推定にはシミュレーションが必要となることが多 い。この問題の場合には、前のノートで紹介したGHKシミュレーターが有用である。

考えるモデルは、

yit = 1{xitβ + ϵit> 0}, (52) ϵi =

 ϵi1 . . . ϵiT

 ∼ N (0, Ω) (53)

であり、(yit, xit)が観測される。このモデルは、を適切に定義することにより、変量効果 の入ったモデルも含んでいる。ここで、Ji ≡ (yi1, . . . , yiT)かつθ = (β, Ω)と表記して、次 の確率

Pr{Ji|Xi, θ} (54)

を評価する必要がある。

いま、Jiという事象と整合的なϵitの値は、

(2yit− 1)ϵit≥ (1 − 2yit)xitβ (55) を満たす必要がある。そこで、シミュレーションに当たっては、上の不等式を満たすような 分布からGHKシミュレーターによって加重サンプリングする。

v(1−2yitit+(1−2yit)xitβt番目の要素としてもつベクトルとすると、v ∼ N (a, Σ) である。なおaはそのt番目の要素が(1 − 2yit)xitβであるベクトルである。vは正規分布で

あり、v ≤ 0となる条件の下での加重サンプリングはGHKシミュレーターがまさにしてい

ることであるので、前回のノートの議論がそのまま成り立つ。

参考文献

[1] J. Abrevaya. The equivalence of two estimators for the fixed effects logit model. Economics Letters, 55:41–43, 1997.

[2] G. Chamberlain. Analysis of covariance with qualitative data. Review of Economic Studies, 47(1):225–238, 1980.

(9)

[3] G. Chamberlain. Heterogeneity, omitted variable bias, and duration dependence. In J. Heck- man and B. Singer, editors, Longitudinal Analysis of Labor Market Data, pages 3–38. Cam- bridge University Press, 1985.

[4] G. Chamberlain. Binary response models for panel data: Identification and information. Econometrica, 2010(1):159–168, 2010.

[5] C. Gourieroux and A. Monfort. Simulation-based inference: A survey with special reference to panel data models. Journal of Econometrics, 59:5–33, 1993.

[6] J. J. Heckman. The incidental parameters problem and the problem of initial conditions in estimating a discrete time-discrete data stochastic process and some monte carlo evidence. In C. Manski and D. McFadden, editors, Structural Analysis of Discrete Data with Econometric Applications. MIT Press, 1981.

[7] B. E. Honor´e and E. Kyriazidou. Panel data dicrete choice models with lagged dependent variables. Econometrica, 68(4):839–874, 2000.

[8] C. Hsiao. Analysis of Panel Data. Cambridge University Press, 2003.

[9] D. Hyslop. State dependence, serial correlation and heterogeneity in intertemporal labor force participation of married women. Econometrica, 67(6):1255–1294, 1999.

[10] T. Magnac. Panel binary variables and sufficiency: Generalizing conditional logit. Economet- rica, 72(6):1859–1876, 2004.

[11] Y. Mundlak. On the pooling of time series and cross section data. Econometrica, 46:69–85, 1978.

[12] J. Neyman and E. L. Scott. Consistent estimates based on partially consistent observations. Econometrica, 16:1–32, 1948.

図 1: マルコフ連鎖 y=0 y=1 1-F(c+mu) 1-F(c+alpha+mu) F(c+alpha+mu)F(c+mu) 初期値の取り扱い方 したがって、初期値が µ i と相関がある場合も考慮する必要がある。以 下の議論は、 Heckman (1981) や Hsiao (2003) を参考にしている。二つの方法を紹介する。 1

参照

関連したドキュメント

Under the proposed condition, the exponential stabilization problem of discrete-time singular time-delay systems subject actuator saturation is solved by designing a stabilizing

The angular velocity decreases with increasing the material parameter, the slip parameter, the buoyancy parameter, and the heat generation parameter, while it increases with

She reviews the status of a number of interrelated problems on diameters of graphs, including: (i) degree/diameter problem, (ii) order/degree problem, (iii) given n, D, D 0 ,

In this paper, under some conditions, we show that the so- lution of a semidiscrete form of a nonlocal parabolic problem quenches in a finite time and estimate its semidiscrete

Reynolds, “Sharp conditions for boundedness in linear discrete Volterra equations,” Journal of Difference Equations and Applications, vol.. Kolmanovskii, “Asymptotic properties of

[25] Nahas, J.; Ponce, G.; On the persistence properties of solutions of nonlinear dispersive equa- tions in weighted Sobolev spaces, Harmonic analysis and nonlinear

It is known that if the Dirichlet problem for the Laplace equation is considered in a 2D domain bounded by sufficiently smooth closed curves, and if the function specified in the

Indeed, when using the method of integral representations, the two prob- lems; exterior problem (which has a unique solution) and the interior one (which has no unique solution for