平成24年度 ミクロ計量経済学
講義ノート7 動学パネルデータモデルの集合推定
非線形動学パネルデータモデルでは、初期条件と個人効果に仮定をおかないと、識別が できず、推定もできないことがわかっている。しかし、そうした仮定をおいた分析がどの程 度、その仮定に依存しているのか、あるいは、仮定をおかずに、どこまでデータの性質を分
析できるのかを調べることは近年の重要な研究テーマである。このノートでは、Honore and
Tamer (2006)とChernozhukov, Fern´andez-Val, Hahn and Newey (2010)の論文の内容を 紹介する。
7.1
モデル
次の共変量のない、動学2項選択モデルを考える。
yit=1{γyi,t−1+αi+eit≥0}. (1)
観測されるデータは、{yit}のみとする。共変量のある場合は、それぞれの共変量の値に条
件つけたモデルを考えているものとする。ここでは、eitの分布はわかっているものとする。
例えば、正規分布を仮定してプロビットとする。モデルのパラメータは、
1. γ: 興味のある母数である。
2. Pr(α =am) = ρm: αの分布、離散分布と仮定する。m = 1, . . . , M。amの値は所与
とし、未定パラメーターはρmである。
3. Pr(yi0= 1|α) =p0(α): 初期値の分布。
である。さて、このモデルでは、ρmとp0に追加的な仮定をおかないと、γの値は識別でき
ない。つまり、データが仮に無限にあったとして、データと整合的なγの値を一意に決める
ことができない。一方で、そうした追加的な仮定がなくとも、データと整合的なγの値と、
整合的でないγの値を分けることはできる。このようなときγは集合識別されるという。ま
た、データと整合的なγの値の集合を、識別可能集合と呼ぶことにする。このノートでは、
ρmとp0に追加的な仮定をおかないときの、γ の識別可能集合を求める方法を紹介する。
7.2
線形計画法による識別可能集合の導出
Honore and Tamer (2006)による識別可能集合の導出を紹介する。Aをあるyitの系列が
とる値とし、π(A|γ,{ρm}, p0)をパラメーターの値を与えたときの、モデルから計算できる
Aをとる確率とする。AをAとしてあり得るすべての要素を集めた集合とする。なお、2
項選択モデルなので、{0,1}T である。P(A)をデータから計算できるAの確率とする。こ
こでは、識別問題を考えるため、P(A)が測定誤差なしで観測できている場合を考える。
識別可能な集合は、
π(A|γ,{ρm}, p0) =P(A), ∀A∈ A (2)
を満たすような、母数の集合である。Π(A|γ, y0, am)を初期値がy0で個人効果の値がamの 時のAをとる確率とする。(これは、eitの分布がわかっていれば計算できる。) さて、
π(A|γ,{ρm}, p0) (3)
=
M
∑
m=1
ρm(p0(am)Π(A|γ, y0= 1, am) + (1−p0(am))Π(A|γ, y0= 0, am)) (4)
である。ここで、
zm=ρmp0(am), zM+m =ρm(1−p0(am)) (5)
とかくと、上の確率は、
M
∑
m=1
zmΠ(A|γ, y0 = 1, am) + M
∑
m=1
zM+mΠ(A|γ, y0 = 0, am) (6)
とかける。従って、識別可能な母数の集合は、
M
∑
m=1
zmΠ(A|γ, y0 = 1, am) + M
∑
m=1
zM+mΠ(A|γ, y0 = 0, am) =P(A), ∀A, (7)
2M
∑
m=1
zm = 1 (8)
zm ≥0, ∀m (9)
を満たすような、{zm}2mM=1が存在するような、母数の集合となる。
そのような{zm}2mM=1の存在は、次の線形計画問題、
max {zm}2mM=1,{vi}i∈A∪{0}
∑
i∈A∪{0}
−vi (10)
P(A)− M
∑
m=1
zmπ(A|γ, y0 = 1, am)− M
∑
m=1
zM+mπ(A|γ, y0 = 0, am) =vA, ∀A,(11)
1−
2M
∑
m=1
zm=v0, (12)
zm ≥0, ∀m (13)
vi≤0, ∀i (14)
の解がvi = 0,∀iとなることと同値である。 また上の目的関数をQ(γ) = max{zm},{vi}
∑
−viと書くと、識別可能な集合とは、Q(γ)の 最小値(0である)をとるような、γの集合であるとわかる。
実際に識別可能集合を計算してみると、仮定が緩いにも関わらずかなり狭い識別可能集合 を得られることが分かる。初期分布の仮定などは、なかなか説得的なものがなく、議論の種 になりやすいので、そのような仮定を置かずに精度の高い分析ができるのであれば、非常に 有用である。実際の計算結果などは、Honore and Tamer (2006)を参照せよ。
• 推定は、上のP(A)をデータから得られる経験分布に置き換えて行う。しかし、Aの
取りうる値が大きいときには、推定される集合が空集合であることが十分にあり得る。
• 共変量があり、それが離散変数である場合は、各変量の値ごとに上の線形計画問題を 解く必要がある。そのため、計算がかなり煩雑となりうる。
• 連続な共変量がある場合の対処法は今のところ未開発。
• 個人効果の分布が離散と仮定しているが、Chernozhukov, Fern´andez-Val, Hahn and
Newey (2010)によると、Aの取りうる値(今の例では、2T)が有限の時は、個人効果
の分布を離散と仮定しても、一般性を失わない。今の例では、2T+1
−1個以上の値を とる離散分布であれば、一般性を失うことはない。最もこの値は非常に大きくなりう るので、実際には、もっと少ない数の点を考える。
• ATE(平均処置効果)の識別可能集合は、上で求めたありうるγの値それぞれについ
て、線形計画法で、ATEの識別可能集合を求め、それらを組み合わせることで可能で
ある。
7.3
2
次計画法を使用した識別可能集合の導出とその推定
上で紹介した、Honore and Tamer (2006)による線形計画法には、共変量がある場合の計 算の煩雑さや、推定を行う際に空集合を得る可能性が高いといった問題があった。この節で は、そうした欠点を克服したChernozhukov, Fern´andez-Val, Hahn and Newey (2010)によ る方法を紹介する。なお、この論文では、初期値の分布の取り扱い方が、あまり明確に書い ていないが、以下の通りに自然に初期値の分布も考慮した分析を行うことができる。
基本的に先程と同じ表記を使用する。ただし共変量の存在も考える。共変量はKの異な
る値をとるものとする。つまり、離散な共変量の場合を考える。上添字kを用いて、共変量
の各値ごとの確率などを表現する。例えば、共変量の値がk番目である時のzmの値をzmk
とする。そして、次の関数、
Tλ(γ,{zmk}, M) =
∑
A∈A K
∑
k=1
wkj (Pk(A)−Pk(A|γ))
2
+λ 2M
∑
m=1 z2
m (15)
を考える。なお、
Pk(A|γ) =
M
∑
m=1
zmkΠk(A|γ, y0 = 1, am) + M
∑
m=1
zMk +mΠk(A|γ, y0 = 0, am) (16)
であり、Pk(A)はデータから計算できる、共変量がk番目の値のときの、Aでる条件付き確
率とする。なお、wk
j は前もって決めておく重みであり、Pr(X=k)/Pk(A)等を使用する。
λはペナルティーであるが、これは、次の最小化問題が解をもつようにおくものである。
そして、識別可能集合を、あるϵM をとって、
B(M) ={γ : min
zk m:
∑ mz
k m=1
Tλ(γ,{zkm}, M)≤ϵM} (17)
として定める。M → ∞,λ→0かつϵM →0であれば、B(M)は識別可能集合に収束する。
ただし、実用上はMはかなり小さくてもよい。
• 推定は、上のPk(A)を推定量Pˆk(A)で置き換えることにより可能である。
• ATE(平均処置効果)の識別可能集合も、前の時と同じように構築可能である。
参考文献
[1] V. Chernozhukov, I. Fern´andez-Val, J. Hahn, and W. Newey. Average and quantile effects in nonseparable panel models. mimeo, 2010.
[2] B. E. Honore and E. Tamer. Bound on parameters in panel dynamic discrete choice models.
Econometrica, 74(3):611–629, 2006.