平成24年度 ミクロ計量経済学 講義ノート8 内生変数を含む離散選択モデル
このノートでは、回帰変数に内生変数を含む離散選択モデルと、その操作変数による推定 を考察する。線形確率モデルを使用する場合には、通常の2段階最小二乗法などにより推定 が可能であるが、プロビットなどの非線形モデルにおいては、2段階最小二乗法に対応する 推定量の構築が自明でなく、また離散選択モデル一般に適用可能な方法というものもない。 さらに、離散な内生変数からなる同時方程式体系は、ゲームの構造になっており、複数均衡 の問題がモデルの数学的性質を自明でないものにしており、推定上の問題を起こす。
8.1
内生変数が連続な場合の制御変数法
2項選択問題において、連続な回帰変数の一つに内生性が疑われる場合を考える。 観測可能な変数を(y1, y2, z1, z2)とし、次のモデルを考える。
y1 = 1{z1′δ1+ α1y2+ u ≥ 0}, (1) y2 = z1′δ21+ z2′δ22+ v. (2)
また、標準化の為にvar(u) = 1とする。このモデルを、Rivers and Voung (1988)の制御変 数法を用いて推定する。推定時には、横断面での無作為標本が利用可能であるとする。
まず、
u = θv + e (3)
と書くことができる。なお、θ = η/τ2、η = cov(u, v)、τ2 = var(v)である。すると、vとe は無相関である。そして、
y1 = 1{z1′δ1+ α1y2+ θv + e}, (4)
とかける。従って、vを何らかの方法で推定し、さらに、eの分布を仮定することにより、モ デルの推定が可能である。具体的には、
1. y2をz1とz2に回帰し、残差vˆを得る。
2. y1をz1, y2, ˆvを回帰変数とするプロビットを行う。
という作業を行う。ただし、2段階目のプロビットから得られた推定量は、係数の推定量に はなっていない。誤差項であるeの分散が1でなく1 − (η2)/(τ2)であるので、元の係数の 推定量を得るためには、標準化を行う必要がある。これは、βˆρを2段階目の推定からえら れたある係数推定量とすると、
β =ˆ βˆρ
(1 + θ2ρτˆ2)1/2 (5)
とすることにより、元の係数の推定量を得ることができる。
• 必要な仮定は、u|vの分布が正規分布であることである。vの分布そのものには仮定は いらない。
1
• vの分布も仮定することにより、最尤推定が可能である。しかし、2段階推定の方が便 利である。
• H0 : θ = 0の検定は、内生性の検定と解釈できる。
• より一般的な指標が線形でないモデルにも拡張できる。たとえば、
y1 = 1{g1(z, y2) + u ≥ 0} (6)
y2 = g2(z) + v (7)
とうモデルの推定も、同じように制御変数法により行うことが可能である。
• 内生変数が二つ以上ある場合にも簡単に拡張できる。上の議論でのvがベクトルにな るだけである。
8.2
多項選択モデルの制御変数法による推定
被説明変数をy1とし、それが3つ以上の値をとるが、それらの値には序数的な意味はない とする。このとき、説明変数のうちy2に内生性が疑われるとする。しかし、Pr(y1= j|z1, y2) をモデル化するのは、簡単ではない。そのため、簡単化の為に、制御変数がすでに入ったモ デル、つまり、内生変数が
y2= z1π1+ z2π2+ v (8)
とかけるとすると、
Pr(y1 = j|z1, y2, v) (9)
を直接モデル化してしてしまうのである。この方法は、Kuksov and Villas-Boas (2008)や Petrin and Train (2010)によって提唱されている。
この方法の難点は、モデルに含まれる係数の解釈が難しくなることである。従って、係数 の解釈はあきらめて、代わりに、平均構造関数(average structural function, ASF)を求め、 ある変数の変化の平均的な効果を求めることに焦点が置かれる。つまり、
ASF (z[ 1 = a, y2= b) = 1 N
∑Pr(yˆ 1 = j|a, b, ˆvi) (10)
として、ASFの推定を行い、それをもとにデータ分析を行うのである。
8.3
内生変数が2項の場合の最尤推定
この節では、内生変数が2項変数の場合を考える。具体的には、
y1 = 1{z1′δ1+ α1y2+ u ≥ 0}, (11) y2 = 1{z1′δ21+ z2′δ22+ v ≥ 0} (12) というモデルを考える。このモデルの推定には、2SLSの方法も、制御関数法も使えない。
従って、(u, v)の分布を仮定して、最尤推定を行う。
(u v
)
∼ N (
0,
(1 ρσ ρσ σ2
))
(13)
2
と仮定する。z = (z1, z2)かつz′δ2 = z′1δ21+ z2′δ22を定義する。
まず、はじめに、Pr(y1 = 1|z, v, y2)を導出する。なお、この作業は制御関数法で行う導 出に似ているが、vはどうやっても推定することはできないため、この式を直接推定に使用 できる訳ではない。さて、その確率は、
Pr(y1 = 1|z, v, y2) = Φ
(z1′δ1+ α1y2+ ρv
√1 − ρ2 )
(14)
となる。ここから、Pr(y1 = 1|z, y2 = 1)を計算する。y2 = 1という条件のもとで、vの分 布は
φ(v)
Φ(z′δ2) (15)
となり、サポートは、(−z′δ2, ∞)となるので、
Pr(y1 = 1|z, y2 = 1) = 1 Φ(z′δ2)
∫ ∞
−z′δ2
Φ
(z1′δ1+ α1y2+ ρv
√1 − ρ2 )
φ(v)dv (16)
と計算できる。Pr(y2 = 1|z)は通常のプロビットであるので、Pr(y1 = 1, y2 = 1|z)を計算 することができた。ほかの3つの確率も同様に計算することができ、尤度関数を定義するこ とができる。
8.4
同時方程式体系、あるいはゲームの推定
最後に離散変数の同時方程式体系のモデルを考察する。具体的には、
y1 = 1{z′1δ1+ α1y2+ u1 ≥ 0} (17) y2 = 1{z′2δ2+ α2y1+ u2 ≥ 0} (18) というモデルである。これは、例えば、ゲームの推定の場合に使われるモデルである。重要 な例としては、Bresnahan and Reiss (1991)がある。しかし、ゲームの構造をしていること からわかる通り、このモデルには、いくつかの問題がある。
1. 複数均衡の問題: 上のモデルでは、均衡が一意に決まらない可能性がある。つまり、 z1, z2, u1, u2などの変数をすべて固定しても観測できるy1, y2の値がどうなるかがわか らないことである。これは、u1, u2の同時分布を定めても、Pr(y1, y2|z1, z2)を計算す ることができない可測性の問題と考えることができる。
2. 関連したことであるが、上のモデルでは、パラメーターが識別できるかどうかが定か ではない。従って、母数が集合識別になる場合でも使える手法を使用した方が無難で ある。
Yoshimura (2011)は特に複数均衡の問題に焦点をあてて、その解決法の観点から、既存
の推定法の分類を行った。Yoshimura (2011)によると、主なやり方は次の3つである。 1. 均衡選択メカニズムを導入する。Bajari, Hong and Ryan (2010)など。
2. 複数均衡が出る場合はそれらをまとめて一つの事象とする。Tamer (2003)など。 3. 均衡選択の確率の最大値と最小値は計算することはできるので、それらからモーメン
ト不等式の条件を作り、それをもとに推定する。Ciliberto and Tamer (2009)など。 これらの方法については、この講義ではこれ以上は考察しない。
3
参考文献
[1] P. Bajari, H. Hong, and S. P. Ryan. Identification and estimation of a discrete game of complete information. Econometrica, 78(5):1529–1568, 2010.
[2] T. F. Bresnahan and P. C. Reiss. Empirical models of discrete games. Journal of Econometrics, 48:57–81, 1991.
[3] F. Ciliberto and E. Tamer. Market structure and multiple equilibria in airline markets. Econo- metrica, 77(6):1791–1828, 2009.
[4] D. Kuksov and J. M. Villas-Boas. Endogeneity and individual consumer choice. Journal of Marketing Research, 45:702–714, 2008.
[5] A. Petrin and K. Train. A control function approach to endogeneity in consumer choice models. Journal of Marketing Research, 47:3–13, 2010.
[6] D. Rivers and Q. H. Voung. Limited information estimators and exogeneity tests for simulta- neous probit models. Journal of Econometrics, 39:347–366, 1988.
[7] E. Tamer. Incomplete bivariate discrete response model with multiple equilibria. Review of Economic Studies, 70:147–167, 2003.
[8] A. Yoshimura. Identification and estimation of simultaneous discrete games: A survey. mimeo, 2011.
4