パネルデータを用いた個人間の異質性の分析
- 変量係数モデルの近年の展開 -
奥井亮
VU University Amsterdam, 京都大学
第18回労働経済学コンファレンス 一橋大学
平成27年9月12日
目次
始めに
変量係数モデル - 平均の分析と同質性の検定 静学モデル
動学モデル
係数の同質性の検定
係数の分布の推定 平均以外の統計量 Deconvolution法 グループ化
終わりに
目次
始めに
変量係数モデル - 平均の分析と同質性の検定 静学モデル
動学モデル
係数の同質性の検定 係数の分布の推定
平均以外の統計量 Deconvolution法 グループ化 終わりに
チュートリアルの内容
• この計量経済学チュートリアルでは、パネルデータを用いて、 どのように個人間の異質性を分析していくのかを紹介する。
• 前半では、変量係数モデルを扱い、係数の個人間での平均値 の推定法ならびに、個人間で係数が異なるのかあるいは同じ なのかを検定する方法を紹介する。
前半の内容は、基本的にWooldridgeの教科書 “Econometric Analysis of Cross Section and Panel Data” (2010, 2nd
edition)の11章に載っている内容ならびに、それらの補足的 な事柄からなる。
• 後半では、やはり変量係数モデルを中心に据えるが、係数の 分布全体を分析する方法を紹介する。
これは、近年の計量経済学界でよく研究されている分野であ り、最新の研究結果を紹介する。
背景
• 計量経済学は、統計データを利用して、ある変数から別の変 数への影響を調べる手法を中心としている。
• 多くの研究では、この影響は全ての観測個体で同じである、 あるいは多項式や交差項を使用することで表現できると、暗 黙に仮定している。
• しかし近年、こうした影響が観測個体ごとに異なるとした場 合に、どのように統計分析の結果を解釈するのか、あるい は、どのようにして影響の個体ごとの違いを調べることがで きるのかについての研究が進んでいる。
異質性に向き合う手法
個体間の影響の異質性を考慮するために、計量経済学では主に次 の二つの手法が考えられている。
1. 変量係数モデル 2. プログラム評価法
• もちろん、この二つの方法は相反する物ではない。
• 変量係数モデルもプログラム評価法の観点から解釈していく ことで、変量係数モデルにおける係数の意味がより明確にな るであろう。
• また、プログラム評価法の観点から分析対象となる変数間の 関係を統計モデルに落とし込むと変量係数モデルとなること もよくあることである。
このチュートリアルではパネルデータ分析のための変量係数モデ ルの近年の研究を概説する。
目次
始めに
変量係数モデル - 平均の分析と同質性の検定 静学モデル
動学モデル
係数の同質性の検定
係数の分布の推定 平均以外の統計量 Deconvolution法 グループ化 終わりに
変量係数モデル
• 係数の値が個人ごとに異なる変量係数モデルを議論する。
yit = αi+ xit′bi+ uit (1)
• 静学的な線形パネルモデルの変量係数の平均値の推定法
• 動学モデルの場合の、変量係数モデルの難しさ
• 係数に異質性があるかどうかの検定法
固定効果推定量は何を推定しているのか
通常の固定効果推定量が、変量係数の平均を一致推定量となるた めの条件を解説する。
モデル:
yit= αi + xit′bi + uit (2)
• 固定効果変換すると、y¨it = yit−PTt=1yit/T として、
¨
yit= ¨xit′bi + ¨uit (3) となる。
• 固定効果推定量は、変換後のモデルのOLS推定量である。
固定効果モデルを書き換える
• β = E (bi)として、di = bi − βと書く。
• 固定効果変換後のモデルは、
¨
yit = ¨xit′β + ¨xit′di+ ¨uit (4) とかける。
• 従って、新しい誤差項である、x¨it′di+ ¨uitとx¨itの相関がなけ れば、固定効果推定量はβの一致推定量となる。
条件
固定効果推定量が変量係数の平均の一致推定量となる条件は、変 量係数と回帰変数の間に相関が無いことである。
• 求める条件は、通常の固定効果推定の条件に加えて、
E(¨xitx¨it′di) = 0 (5) である。
• この条件の十分条件は、
E(bi|Xi) = E (bi) = β (6)
• biとXiの間に関係がなければよい。
係数の平均の推定
より一般的な場合に係数の平均を推定する方法を紹介する。 説明変数が2種類あり、(wit′, xit′)′とする。witの係数は個人ごと に異なり、xitの係数はすべての個人で共通であるとする。
yit= wit′ai+ xit′β + uit (7)
• uitには固定効果は含まれていない。
• 固定効果がある場合には、witが定数項を含んでいると解釈 するとよい。
推定するパラメーターはµa = E (ai)とβである。
共通係数の推定
βの推定は、aiをモデルから消す変換による。
• Yi = (yi1, yi2, . . . , yiT)′として、各観測値をiごとにまとめた ベクトルと行列を作る。
Yi = Wiai + Xiβ + Ui (8)
• Mi = I − Wi(Wi′Wi)−1Wi とする。MiWi = 0であるので、
各変数の左側からMi をかけることで、モデルからaiを消す ことができる。
• Y¨i = MiYi とすると、
Y¨i = ¨Xiβ + ¨Ui (9) である。このモデルをOLSで、推定することにより、βの推 定値を得ることができる。
共通変数の推定のための条件
次に示す条件の下で、βˆは一致性をもち、漸近正規になる。 1. (Yi, Wi, Xi)はi.i.d.(横断面について)
2. ( ¨Ui, ¨Xi)は4次までのモーメントを持つ。 3. E(uit|Wi, Xi, ai) = 0。
4. E( ¨Xi′X¨i)は正則。
この中で、特に重要な条件は、3と4である。
• 3は強外生の仮定である。条件付き期待値の条件の中身は、 すべてのtに渡っての説明変数の値が入っていることに注意 すること。
• 4は多重共線性がないと言う仮定である。この背後には、 (Wi′Wi)の逆行列がとれるという仮定が暗にあることに注意。 この点についてはGraham and Powell (2012)に議論がある。
変量係数の期待値
µa = E (ai)の推定は、まず、各aiを推定し、それらの推定値の標 本平均をとることで行う。
• 各ai の推定から始める。aiの推定値は、Yi− XiβˆをWiにi ごとに回帰すると得られる。
ˆ
ai = (Wi′Wi)−1Wi′(Yi − Xiβ)ˆ (10)
• 続いて、µaをaˆiの平均から推定する。
ˆ µa = 1
N
N
X
i=1
ˆ ai = 1
N
N
X
i=1
(Wi′Wi)−1Wi′(Yi − Xiβ)ˆ (11)
• なお、ここで紹介した推定量は、効率的なものではない。効 率的な推定量は、Chamberlain (1992)に記載がある。
動学モデル
動学パネルデータモデルの場合には、変量係数の取り扱いには一 気に難しくなる。
• 係数と回帰変数には、モデルの構造上、相関がでる。
• 固定効果推定タイプの手法がTが有限では一致をもたない。 そのためT → ∞の状況について、これまでの文献では研究 されてきた。
パネル AR(1) モデル
簡単化のため、動学パネルデータモデルの一例であるパネル
AR(1)モデルの係数が、変量係数になっているモデルを考える。
yit = ρiyi,t−1+ ǫit (12)
• このモデルは、Pesaran and Smith (1995)の研究を嚆矢と する。
• ここで考えているモデルにで、個人効果は入っていない。個 人効果が入るモデルはさらに分析が難しくなる。
問題点
動学モデルの場合は、係数が個人ごとに異なると、OLSでは、係 数の平均を推定することは、できなくなる。
• もし係数が一定であれば、個人効果が入っていない場合は、 T が固定でも、OLSにより係数の一致推定ができる。
• なお、個人効果が入っている場合にはOLSでは係数の一致 推定はできない。
• しかし、係数が個人ごとに異なると、OLS推定量の解釈が難 しくなる。
• 変量係数とyitの間には、相関が出てしまうので。この問題 は、T → ∞の場合にも発生する。
変量係数と y
i,t−1の相関
変量係数とyi,t−1の相関を見るには、yitを展開するとよい。 通常のARモデルの場合と同じように、yitを展開すると、
yit = (ρi)tyi0+
t−1
X
j=0
ρjiǫi,t−j (13)
となる。
この式から、yitとρi には相関関係があることが見て取れる。
• OLS推定では、ρi の平均を一致推定することはできない。
• なお、一致推定できるのは、E(yityi,t−1)/E (yi2,t−1)である。 これは自己共分散の平均と、分散の平均の比である。
Pesaran and Smith (1995)
各個人ごとのOLS推定量の平均をとる推定量である。 つまり、ρˆi を
ˆ ρi =
T
X
t=2
yi2,t−1
!−1 T X
t=2
yi,t−1yit (14)
として、E(ρi)の推定量を
ˆ ρ = 1
N
N
X
i=1
ˆ
ρi (15)
とする者である。
• T → ∞が必要。T が小さいとバイアスが大きい。
• Hsiao, Pesaran and Tahmiscioglu (1999)はバイアス問題を解 決するため、Bayes型の推定量を提唱した。それでも、 T → ∞という条件は必要となっている。
同質性の検定
係数が個人ごとに異なるか、すべての個人が同じ係数をもってい るかを検定する方法を紹介する。
• Swamy (1970)
• Pesaran and Yamagata (2008)
• これらの検定が、比較的有名だと思われる。
設定
固定効果モデルを考える。
yit = αi+ xit′βi+ ǫit (16) 帰無仮説は、あるβについて
H0 : βi = β, ∀i, (17)
である。βiの次元をkとする。
ここで紹介する検定は、個人ごとに誤差項の分散が異ってもよい とする。
E(ǫ2it) = σi2 (18) と表記する。
基本的な考え方
係数の異質性の検定の基本的な考え方は、個人ごとに推定した係 数と、標本全体で計算した係数を比較することである。
• 次の行列を定義する。
M0 = IT − ιTι′T/T (19) ただしιT は1を並べたT 次元のベクトル、を定義する。
• 各個人のβi のOLS推定量は、
βˆi = Xi′M0Xi−1Xi′M0Yi (20) である。ただし、Xi = (xi1, . . . , xiT)、Yi = (yi1, . . . , yiT)で ある。
表記
• 標本全体のβの推定量は、GLS(厳密には固定効果推定量の 重み付け版である)を使用する。
βˆGLS =
N
X
i=1
Xi′M0Xi ˆ σi2
!−1 N X
i=1
Xi′M0Yi ˆ
σi2 (21)
• 分散推定量のσˆ2i は
ˆ
σi2= (Yi− Xiβˆi)
′M
0(Yi − Xiβˆi)
T− k − 1 (22)
として、各個人でのOLSから計算する。
Swamy (1970)
Swamy (1970)の検定統計量:
S =
N
X
i=1
ˆβi − ˆβGLS′ Xi′M0Xi ˆ σi2
ˆβi − ˆβGLS (23)
である。
帰無仮説の下で、Nが固定で、T → ∞のとき、
S →d χ2k(N−1) (24)
となる。
Pesaran and Yamagata (2008)
Pesaran and Yamagata (2008)はNがT よりもかなり大きくとも 検定が機能するように、Swamy検定に改良を加えた。
• 現時点での標準的な検定といっても良いと思われる。
• Swamy検定統計量とは、分散の推定法が異なる。
分散の推定
• 各個人の分散を
˜
σi2= (Yi− XiβˆFE)
′M
0(Yi− XiβˆFE)
T − 1 (25)
と、固定効果推定の残差を使用して計算する。
• GLS推定量も
β˜GLS =
N
X
i=1
Xi′M0Xi
˜ σ2i
!−1 N X
i=1
Xi′M0Yi
˜
σ2i , (26) とσ˜2i を使う。
検定統計量
Pesaran-Yamagata検定統計量は、
PY =√N N
−1S˜− k
√2k
!
(27)
ただし、
S˜=
N
X
i=1
ˆβi − ˜βGLS′ Xi′M0Xi
˜ σi2
ˆβi − ˜βGLS (28)
N, T → ∞かつN/T4 → 0のとき、帰無仮説のもとで、
PY →dN(0, 1) (29)
• なお、この検定は、動学モデルでも使用可能である。ただ し、N/T → κ、0 ≤ κ < ∞という条件が必要。
他の検定
他にも、Pesaran and Yamagata (2008)の検定では扱えない状況 に対処するために、様々な検定法が近年に提唱されている。
• Juhl and Lugovskyy (2014)では、T が固定されている状況 や、もう少し柔軟に不均一分散を許しても、機能する検定が 提唱されている。
• Lin (2011)でも同じような状況で使用可能な検定が提唱され
ている。またLin (2011)は動学モデルの場合も考慮している。
目次
始めに
変量係数モデル - 平均の分析と同質性の検定 静学モデル
動学モデル
係数の同質性の検定 係数の分布の推定
平均以外の統計量 Deconvolution法 グループ化
終わりに
係数の分布を推定する 3 つの方法
• 各個人ごとに計算した統計量の分布を分析する
• Deconvolution法
• グループ化
平均以外の統計量
変量係数モデルに関しては、近年も重要な研究がいくつか発表さ れている。
始めに、各個人ごとに推定した係数の統計量を計算する方法を紹 介する。
• Arellano and Bonhomme (2012)は、変量係数の平均分散の識 別推定を議論している。なお、この論文は変量係数の分布も 考えているがそれについては後述。
• Fern´andez-Val and Lee (2013)はモーメント条件で定義され るモデルの変量係数の平均や分散などの推定方法を議論して いる。
• 変量係数モデルとは少し異なるが、動学構造を示す係数の分 布を求める方法をOkui and Yanagi (2015)は考案している。
Arellano and Bonhomme (2012)
先に見た一部の変数の係数が変量係数になっているモデルを考 える。
yit= wit′ai+ xit′β + uit (30) 各aiの推定量は
ˆ
ai = (Wi′Wi)−1Wi′(Yi− Xiβ)ˆ (31) となる。
• 既に平均の推定については紹介したので、ここでは、分散の 推定に焦点を合わせる。
変量係数の分散の推定
ˆ
ai の分散はai の分散の一致推定量にはなっておらず(非線形バイ アス)、バイアス修正が必要になる。
Var(ˆai) = Var (ai) + Var ((Wi′Wi)−1Wi′Ui) (32) したがって、
(Var (a\i)) = 1 N
N
X
i=1
(ˆai− ˆµa)(ˆai − ˆµa)′−Var((Wi\′Wi)−1Wi′Ui) (33) として、分散の推定ができる。
しかし、Var((Wi\′Wi)−1Wi′Ui)を推定するためにはUiの相関構造 に制約が必要である。
分散の推定 : 誤差項が均一分散の場合
誤差項Uiが均一分散で系列相関がないなら、
ˆ
σ2 = 1 N(T − q)
N
X
i=1
(Yi− Xiβ)ˆ ′Mi(Yi− Xiβ)ˆ (34)
として、
Var((Wi\′Wi)−1Wi′Ui) = ˆσ21 N
N
X
i=1
(Wi′Wi)−1 (35)
を使うと良い。
Fernand´ez-Val and Lee (2013)
モーメント条件で定義されるモデルに変量係数が入っている場合
E(g (zit, θ0, αi0)) = 0 (36)
• g は既知の関数
• θ0は個人間で共通の係数θの真値
• αi0は個人間で異なる係数αi の真値
• この論文ではN, T → ∞の元での推定を考えている。
FE-GMM 推定
推定はGMMの様な推定量で行う。
(ˆθ, {ˆαi}Ni=1) = arg inf
(θ,{αi}Ni=1) N
X
i=1
ˆ
gi(θ, αi)′Wigˆi(θ, αi) (37)
ただし、
ˆ
gi(θ, αi) = 1 T
T
X
t=1
g(zit, θ, αi) (38)
かつWi は重み付け行列である。
• 各個人ごとにGMMの目的関数を作って、その和を取る形で 目的関数が定義されている。
変量係数のモーメントの推定
αiの平均や分散は、αˆiの平均や分散を取ることで推定できる。例 えば、αi の平均は
ˆ µα = 1
N
N
X
i=1
ˆ
αi (39)
とする。
• この方法は、N, T → ∞の漸近理論のもとで一致性をもつ。
• T がNに比べて非常に大きくない場合には、推定量にバイア スがでるので、バイアス修正が必要となる。
• この論文では、バイアスの式を明示的に導出し、その式を元 にバイアスをanalyticalに推定する方法を提唱している。 Dhaene and Jochmans (2015)のハーフパネルジャックナイフ も使用可能。
Okui and Yanagi (2015)
動学構造が個人ごとに異なる場合に、平均や自己共分散などの分 布を分析する手法である。
設定は、以下の通りである。
• まず、αi をある分布から個人ごとの独立に抽出する。
• そして、{yit}Tt=1の値を、αiに依存する分布L({yit}Tt=1; αi) から抽出する。
• µi = E (yit|αi)が個人ごとに異なる平均になる。 wit = yit− µi とおく。
• γk,i = E (witwi,t−k|αi)が個人iにとっての自己共分散になる。
個人ごとの平均と自己共分散
まず、個人ごとの平均と自己共分散を計算する。
ˆ
µi := ¯yi := 1 T
T
X
t=1
yit,
と
ˆ
γk,i := 1 T − k
T
X
t=k+1
(yit− ¯yi)(yi,t−k − ¯yi).
と定義する。
そして、µˆi とγˆk,iの分布を用いて、µiとγk,i の分布を推定する。
分布と分位点
分布や分位点の推定量は、µˆi あるいはγˆk,iの経験分布から得ら れる。
例えば、µi の分布は、
FµNˆ(a) := 1 N
N
X
i=1
1(ˆµi ≤ a),
として推定する。ただし、 1(·)は指示関数でありa∈ Rである。 また、µiのτ 分位点は、
ˆ
qτ := inf{a : FmuNˆ (a) ≥ τ}. として、推定する。
ある関数の期待値
興味のある数量が、µi あるいはγk,iの滑らかな関数の期待値とし て書ける場合は、T がそれほど大きくなくとも、バイアスが小さ いことが証明できる。
θi をµiとγk,i のベクトルとする。 hを滑らかな関数とする。
H := E (h(θi))の推定は、
Hˆ := 1 N
N
X
i=1
h(ˆθi).
として出来る。HˆはN/T2 → 0のとき、漸近的にバイアスが ない。
• 例1:µi の平均の場合は、h(θi) = µi。
• 例2:µi とγ1,iの共分散は、h(θi) = (µiγ1,i, µi, γ1,i)として、 Hˆを推定し、E(µiγ1,i) − E (µi)E (γ1,i)の推定量を求める。
ハーフパネルジャックナイフ
Dhaene and Jochmans (2015)によるハーフパネルジャックナイフ
(HPJ)を使用して、バイアス修正を行う。
T が偶数の場合を考える。(奇数の場合は論文を参照)
1. まず、パネルデータを前半と後半の二つのパネルデータに分 ける。({{yit}T/2t=1}Ni=1と{{yit}T
t=T /2+1}Ni=1)
2. H(1)ˆ とH(2)ˆ を、それぞれ、{{yit}T/2t=1}Ni=1あるいは
{{yit}Tt=T /2+1}Ni=1を使った推定量とする。 3. HPJ推定量は、
H˜HPJ = 2 ˆH−1
2 ˆH(1) + ˆH(2)
.
となる。この推定量は、バイアスの最大項を消すことがで きる。
Deconvolution 法
変量係数の分布を、Deconvolution法を用いて推定する方法が、近 年提唱されている。
• T → ∞の状況では、先に見たように直接的に分布を推定す ることができる。
• しかし、T が固定の場合は、変量係数の分布を推定するため には、Deconvolution法、あるいはそれを一般化した線形作 用素の逆作用素を取る方法が必要になる。
Deconvolution 法の基本的なアイデア
Deconvolution法の基本的なアイデアを説明するために、次の簡
単な例を考える。
X1=u + e1 (40)
X2=u + e2 (41)
X1とX2の分布は分かっており、u, e1 ,e2は独立に分布しe1とe2 は同じ対称な分布を持つとする。
確率変数uの特性関数を
φu(τ ) = E (exp(juτ )) (42) と定義する。ただしjは虚数単位である。
またe1とe2の特性関数を
φe(τ ) = E (exp(je1τ )) = E (exp(je2τ )) (43) とする。
Deconvolution 法による識別
X1とX2の分布は分かっているので、その特性関数も分かる。 φX(τ ) = E (exp(jX1τ )) = φu(τ )φe(τ ) (44) またX1− X2= e1− e2 の特性関数からeの特性関数も分かる。
φe(τ ) = (φe(τ )φe(τ ))1/2 = E (exp(j(e1− e2)))1/2 (45) したがって、
φu(τ ) = φX(τ )
φe(τ ) (46)
として、uの特性関数も識別出来る。
• Deconvolution法はKotlarski (1967)が初期の重要な研究とし てあげられる。その後、数学的にも応用上も大きな進展を遂 げた。
Deconvolution 推定量
uやe1, e2の分布は、X1とX1− X2の特性関数を推定し、それを 逆フーリエ変換することで得られる。
たとえば、uの密度関数は、 fˆu(a) = 1
2π Z ∞
−∞
K(τ ) exp(−jaτ) ˆφX(τ )/ ˆφe(τ )dτ (47)
ただし、K(τ )はトリミング関数であり、大きい値のτ を計算から 除く。
• K(τ )を入れないと、推定はうまく行かない。
• Deconvolution問題は、ill-posed inverse問題を起こす代表的 な例であり、トリミングなどといったregularizationがかなり 重要な役割を果たす。
経済学での応用
• Deconvolution法は、Horowitz and Markatou (1996)によって 経済学界で知られるようになったと思われる。かれらは、パ ネルデータへの応用を行っている。
• 近年、多くの分野で使用されるようになった。
• ファクターモデル: Cunha, Heckman and Schennach (2010) 測定誤差のある変数を含むモデルの分析: Schennach (2007) オークション: Krasnokutskaya (2011)
マッチング(ミクロ経済学の意味での。学校選択など): Agarwal and Diamond (2014)
• ここでは、Deconvolution法を応用による、個人間の異質性 を分析する手法を紹介する。
Arellano and Bonhomme (2012)
先に見た一部の変数の係数が変量係数になっているモデルを考 える。
yit= wit′ai+ xit′β + uit (48) 各aiの推定量は
ˆ
ai = (Wi′Wi)−1Wi′(Yi− Xiβ)ˆ (49) となる。
ˆ
ai = ai+ (Wi′Wi)−1Wi′Ui (50) という式から、(Wi′Wi)−1Wi′Uiの分布が分かると、aiの分布が分 かる。
• 実際の方法は論文を参照のこと。
Mavroedis, Sasaki and Welch (2015)
パネルAR(1)モデルで、変量係数になっている場合の識別と推定
を考察している。
yit = αi+ βiyi,t−1+ ǫit (51)
ただし、ǫit ∼ N(0, σ2i) というモデルを考える。
• おそらく、ここで議論されている方法はDeconvolution法と は呼ばれないだろう。より一般的な線形作用素の逆変換の議 論を用いている。
変量係数からデータへの線形作用素
変量係数の分布F(α, β, σ2|y1)からデータの分布F(yT, . . . , y2|Y1) は、次の線形作用素で表現できる。
L(ξ)(yT, . . . , y2) (52)
= Z Z Z
ξ(a, b, s)
" s1−T
T
Y
t=2
φ yt− a − byt−1 s
#
da· db · ds (53) データの分布F(yT, . . . , y2|y1)は識別できるので、L作用素の逆 変換をとることができれば変量係数の分布の識別が出来る。
• この論文の本論では、F(α, β, σ2|y1)が正規分布と仮定し、 local maximum likelihoodでの推定を考えている。Sieve近似 を用いたnonparametericな方法はAppendixにある。
グループ化
個人を数個のグループにわけて、各グループ内では係数の値は同 じだが、グループが異なると係数の値も異なるというモデル。
• いわゆる構造推定の分野では、広く使われてきた。Keane and Wolpin (1997)など。
• 動学的離散選択モデルでは標準的な手法であり、計量経済学 での研究の蓄積も多い。Kasahara and Shimotsu (2009)など。
• ただし、これまではいわゆる有限混合モデルが中心である。
• ここでは、線型モデルで、機械学習的な手法を使ってグルー プ分けを行う方法を紹介する。
Bonhomme and Manresa (2015)
次の切片が個人ごとにも時間を通じても異なるモデルを考える。
yit = xit′β + αgit+ vit (54) ただし、全ての個人が異なる切片をもつわけではなく、各個人は G 個あるグループのどれかに属し、グループ内では、同じ切片を 持つものとする。
• これをグループ固定効果(Grouped fixed effects)と呼ぶ。
• いわゆる“kmeans”と呼ばれる手法の拡張になる。
• N/Tν → 0があるv> 0に成り立つとよいという弱い条件の もとで正当化できる。ただしT → ∞は必要。
• 係数がグループ構造を持つモデルもOnline Appendixで議論 されている。
推定量
推定はOLSで可能(STATAコードも存在する)
( ˆβ, ˆα, ˆγ) = arg min
N
X
i=1 T
X
t=1
(yit− xit′β − αgit)2 (55)
ただし、γはN個体をG 個のグループに配分するやり方である。
• N, T → ∞かつN/Tν → 0があるv > 0に成り立つ、という 条件が必要。
• ただし、標準誤差はT が固定の元で求めた分散の推定量を使 用するとよい。
アルゴリズム
1. βとαの初期値を決める。(β(0), α(0))とする。s = 0とおく。 2. すべてのiをグループ分けする。
gi(s+1)= arg min
g∈{1,...,G } T
X
t=1
(yit− xit′β(s)− α(s)git)2 (56)
3. βとαの値を更新する。
(β(s+1), α(s+1)) = arg min
β,α T
X
t=1
(yit− xit′β − αg(s+1)
i t
)2 (57)
• 論文によると、この方法はG = 3までうまくいく。
• しかし、kmeans法はより速く安定した手法が現在も開発さ
れており、それらを応用することで、グループが多い場合も 計算が可能になる。
Su, Shi and Phillips (2014)
変量係数モデルを考える。
yit= xit′βi+ αi + vit (58) ただし、βiは個体ごとに異なるが、個体はG個のグループのどれ かに属するし、グループ内では係数の値は同じとする。
• G 個の異なる係数を(θ1, . . . , θG)とする。
• αiは個人ごとに異なってもよい。
CLasso 推定
固定効果変換を行った変数に次のCLasso (classfier Lasso)を使用 する。
( ˆβ, ˆθ) = arg min
β,θ
1 NT
N
X
i=1 T
X
t=1
(¨yit− ¨xit′βi)2+ λ N
G
Y
g=1
kβi − θgk (59)
• λはtuning parameter。
• L1罰則の性質により、βˆi = ˆθg があるg について漸近的に確 率1で成り立つ。
• N, T → ∞が必要。T の大きさの条件はλの大きさによる。
補足
Su, Shi and Phillips (2014)では他にも多くの分析がなされて いる。
• 動学パネルデータモデルのCLassoによるGMM推定
• グループの数を情報量基準から選択する方法
• グループの数を検定する方法はLu and Su (2014)で紹介され ている。
目次
始めに
変量係数モデル - 平均の分析と同質性の検定 静学モデル
動学モデル
係数の同質性の検定 係数の分布の推定
平均以外の統計量 Deconvolution法 グループ化 終わりに
終わりに
• 個体間の異質性の問題は、これからの経済学の実証分析での 重要な課題であろう。
• このチュートリアルでは、異質性の問題に対処する統計手法 の一つである変量係数モデルのこれまでの研究成果の概観を 行った。
• 前半で紹介した手法は、現時点でも標準的な手法と考えても よいだろう。
• 後半では、最新の研究成果を紹介した。これらの手法は計算 量の問題があるものや理論的にさらに詳細な検討が必要なも のもあるが、今後標準的な手法となる可能性を秘めている。