pdf 教育 OKUI, Ryo panel hetero v2

(1)

パネルデータを用いた個人間の異質性の分析

_- 変量係数モデルの近年の展開 _-

奥井亮

VU University Amsterdam, ^京都大学

第₁₈回労働経済学コンファレンス一橋大学

平成₂₇年₉月₁₂日

(2)

チュートリアルの内容

• この計量経済学チュートリアルでは、パネルデータを用いて、どのように個人間の異質性を分析していくのかを紹介する。

• 前半では、変量係数モデルを扱い、係数の個人間での平均値の推定法ならびに、個人間で係数が異なるのかあるいは同じなのかを検定する方法を紹介する。

前半の内容は、基本的に_Wooldridgeの教科書 “Econometric Analysis of Cross Section and Panel Data” (2010, 2nd

edition)^の11章に載っている内容ならびに、それらの補足的な事柄からなる。

• 後半では、やはり変量係数モデルを中心に据えるが、係数の分布全体を分析する方法を紹介する。

これは、近年の計量経済学界でよく研究されている分野であり、最新の研究結果を紹介する。

(5)

背景

• 計量経済学は、統計データを利用して、ある変数から別の変数への影響を調べる手法を中心としている。

• 多くの研究では、この影響は全ての観測個体で同じである、あるいは多項式や交差項を使用することで表現できると、暗黙に仮定している。

• しかし近年、こうした影響が観測個体ごとに異なるとした場合に、どのように統計分析の結果を解釈するのか、あるいは、どのようにして影響の個体ごとの違いを調べることができるのかについての研究が進んでいる。

(6)

異質性に向き合う手法

個体間の影響の異質性を考慮するために、計量経済学では主に次の二つの手法が考えられている。

1. ^{変量係数モデル} 2. ^{プログラム評価法}

• もちろん、この二つの方法は相反する物ではない。

• 変量係数モデルもプログラム評価法の観点から解釈していくことで、変量係数モデルにおける係数の意味がより明確になるであろう。

• また、プログラム評価法の観点から分析対象となる変数間の関係を統計モデルに落とし込むと変量係数モデルとなることもよくあることである。

このチュートリアルではパネルデータ分析のための変量係数モデルの近年の研究を概説する。

(7)

変量係数モデル

• 係数の値が個人ごとに異なる変量係数モデルを議論する。

y_it = α_i+ x_it^′b_i+ u_it (1)

• 静学的な線形パネルモデルの変量係数の平均値の推定法

• 動学モデルの場合の、変量係数モデルの難しさ

• 係数に異質性があるかどうかの検定法

(9)

固定効果推定量は何を推定しているのか

通常の固定効果推定量が、変量係数の平均を一致推定量となるための条件を解説する。

モデル_:

y_it= αi + x_it^′b_i + uit (2)

• ^{固定効果変換すると、}y¨_it = yit₋^P^T_t=1^yit/T ^として、

¨

y_it= ¨x_it^′b_i + ¨u_it (3) となる。

• 固定効果推定量は、変換後のモデルの_OLS推定量である。

(10)

固定効果モデルを書き換える

• β = E (bi)^として、d_i = bi _{− β}^と書く。

• 固定効果変換後のモデルは、

¨

y_it = ¨x_it^′β + ¨x_it^′d_i+ ¨u_it (4) とかける。

• 従って、新しい誤差項である、_x_¨_it^′_d_i_{+ ¨}_u_itと_x_¨_itの相関がなければ、固定効果推定量は_βの一致推定量となる。

(11)

条件

固定効果推定量が変量係数の平均の一致推定量となる条件は、変量係数と回帰変数の間に相関が無いことである。

• 求める条件は、通常の固定効果推定の条件に加えて、

E(¨x_itx¨_it^′d_i) = 0 (5) である。

• この条件の十分条件は、

E(bi_|Xi) = E (bi) = β (6)

• ^bi^と^Xiの間に関係がなければよい。

(12)

係数の平均の推定

より一般的な場合に係数の平均を推定する方法を紹介する。説明変数が₂種類あり、_(w_it^′_{, x}_it^′₎^′とする。_w_itの係数は個人ごとに異なり、_x_itの係数はすべての個人で共通であるとする。

y_it= w_it^′a_i+ x_it^′β + uit (7)

• ^uitには固定効果は含まれていない。

• 固定効果がある場合には、_w_itが定数項を含んでいると解釈するとよい。

推定するパラメーターは_µ_a _{= E (a}_i₎と_βである。

(13)

共通係数の推定

β^{の推定は、}aiをモデルから消す変換による。

• ^Yi = (yi1, yi2, . . . , yiT)^′^{として、各観測値を}i^{ごとにまとめた} ベクトルと行列を作る。

Y_i = Wi^ai + Xiβ + Ui (8)

• ^Mi = I − Wi^(W_i^′^Wi⁾⁻¹^Wi ^とする。^Mi^Wi ^{= 0}^{であるので、}

各変数の左側から_M_i をかけることで、モデルから_a_iを消すことができる。

• ^Y^¨i = Mi^Yi ^{とすると、}

Y¨_i = ¨X_iβ + ¨U_i (9) である。このモデルを_OLSで、推定することにより、_βの推定値を得ることができる。

(14)

共通変数の推定のための条件

次に示す条件の下で、_β^ˆは一致性をもち、漸近正規になる。 1. (Yi, Wi, Xi)^はi.i.d.(^{横断面について})

2. ( ¨Ui, ¨Xi)^は4次までのモーメントを持つ。 3. E(uit_|Wi, Xi, ai) = 0^。

4. E( ¨X_i^′X^¨_i)^は正則。

この中で、特に重要な条件は、₃と₄である。

• 3は強外生の仮定である。条件付き期待値の条件の中身は、すべての_tに渡っての説明変数の値が入っていることに注意すること。

• 4は多重共線性がないと言う仮定である。この背後には、 (W_i^′Wi)の逆行列がとれるという仮定が暗にあることに注意。この点についてはGraham and Powell (2012)^{に議論がある。}

(15)

変量係数の期待値

µa = E (ai)^{の推定は、まず、各}a_iを推定し、それらの推定値の標本平均をとることで行う。

• ^各^ai ^{の推定から始める。}^ai^{の推定値は、}^Yi_{− X}iβ^ˆ^をW_i^にi ごとに回帰すると得られる。

ˆ

a_i = (W_i^′W_i)⁻¹W_i^′(Yi _{− X}iβ)^ˆ (10)

• ^続いて、^µa^を^a^ˆi^{の平均から推定する。}

ˆ µa = ¹

N

X

i=1

ˆ a_i = ¹

N

X

i=1

(W_i^′W_i)⁻¹W_i^′(Yi _{− X}iβ)^ˆ (11)

• なお、ここで紹介した推定量は、効率的なものではない。効率的な推定量は、Chamberlain (1992)^{に記載がある。}

(16)

動学モデル

動学パネルデータモデルの場合には、変量係数の取り扱いには一気に難しくなる。

• 係数と回帰変数には、モデルの構造上、相関がでる。

• 固定効果推定タイプの手法が_Tが有限では一致をもたない。そのためT _{→ ∞}の状況について、これまでの文献では研究されてきた。

(17)

パネル _AR(1) モデル

簡単化のため、動学パネルデータモデルの一例であるパネル

AR(1)モデルの係数が、変量係数になっているモデルを考える。

yit = ρiy_i,t−1+ ǫit (12)

• ^{このモデルは、}Pesaran and Smith (1995)^{の研究を嚆矢と} する。

• ここで考えているモデルにで、個人効果は入っていない。個人効果が入るモデルはさらに分析が難しくなる。

(18)

問題点

動学モデルの場合は、係数が個人ごとに異なると、_OLSでは、係数の平均を推定することは、できなくなる。

• もし係数が一定であれば、個人効果が入っていない場合は、 T ^{が固定でも、}OLSにより係数の一致推定ができる。

• なお、個人効果が入っている場合には_OLSでは係数の一致推定はできない。

• しかし、係数が個人ごとに異なると、_OLS推定量の解釈が難しくなる。

• ^{変量係数と}yitの間には、相関が出てしまうので。この問題は、_T _{→ ∞}の場合にも発生する。

(19)

変量係数と _y

_i_,t−1

の相関

変量係数とy_i_,t−1の相関を見るには、y_itを展開するとよい。通常の_ARモデルの場合と同じように、_y_itを展開すると、

y_it = (ρ_i)^ty_i₀+

t−1

X

j=0

ρ^j_iǫ_i_,t−j (13)

となる。

この式から、_y_itと_ρ_i には相関関係があることが見て取れる。

• OLS^{推定では、}ρi の平均を一致推定することはできない。

• なお、一致推定できるのは、_E_(y_it_y_i_,t−1_{)/E (y}_i²_,t−1₎である。これは自己共分散の平均と、分散の平均の比である。

(20)

Pesaran and Smith (1995)

各個人ごとの_OLS推定量の平均をとる推定量である。つまり、_ρ_ˆ_i を

ˆ ρi =

T

X

t=2

y_i²_,t−1

!_{−1 T} X

t=2

y_i,t−1y_it (14)

として、_E_(ρ_i₎の推定量を

ˆ ρ = ¹

N

X

i=1

ˆ

ρ_i (15)

とする者である。

• ^T → ∞^が必要。^T が小さいとバイアスが大きい。

• Hsiao, Pesaran and Tahmiscioglu (1999)^{はバイアス問題を解} 決するため、_Bayes型の推定量を提唱した。それでも、 T _{→ ∞}という条件は必要となっている。

(21)

同質性の検定

係数が個人ごとに異なるか、すべての個人が同じ係数をもっているかを検定する方法を紹介する。

• Swamy (1970)

• Pesaran and Yamagata (2008)

• これらの検定が、比較的有名だと思われる。

(22)

設定

固定効果モデルを考える。

yit = αi+ x_it^′βi+ ǫit (16) 帰無仮説は、ある_βについて

H₀ : βi = β, _∀i, (17)

である。_β_iの次元を_kとする。

ここで紹介する検定は、個人ごとに誤差項の分散が異ってもよいとする。

E(ǫ²_it) = σ_i² (18) と表記する。

(23)

基本的な考え方

係数の異質性の検定の基本的な考え方は、個人ごとに推定した係数と、標本全体で計算した係数を比較することである。

• ^{次の行列を定義する。}

M₀ = IT _{− ι}Tι^′_T/T (19) ただし_ι_T は₁を並べた_T 次元のベクトル、を定義する。

• ^各個人の^βi ^の^OLS^{推定量は、}

βˆ_i = X_i^′M₀X_i⁻¹X_i^′M₀Y_i (20) である。ただし、_X_i _{= (x}_i1, . . . , xiT)^、Yi = (y_i1, . . . , yiT)^である。

(24)

表記

• ^{標本全体の}β^{の推定量は、}GLS(厳密には固定効果推定量の重み付け版である₎を使用する。

βˆGLS =

N

X

i=1

X_i^′M₀X_i ˆ σ_i²

!_{−1 N} X

i=1

X_i^′M₀Y_i ˆ

σ_i² ⁽²¹⁾

• ^{分散推定量の}σˆ²_i ^は

ˆ

σ_i²= ^(Yⁱ^{− X}ⁱ^β^ˆⁱ⁾

′_M

0^(Yi − Xi^β^ˆi⁾

T_{− k − 1} ⁽²²⁾

として、各個人での_OLSから計算する。

(25)

Swamy (1970)

Swamy (1970)^{の検定統計量}:

S =

N

X

i=1

ˆ_β_i _{− ˆ}_β_GLS^′^Xⁱ^′^M⁰^Xⁱ ˆ σ_i²

ˆ_β_i _{− ˆ}_β_GLS ₍₂₃₎

である。

帰無仮説の下で、_Nが固定で、_T _{→ ∞}のとき、

S _→_d χ²_k(N−1) (24)

となる。

(26)

Pesaran and Yamagata (2008)

Pesaran and Yamagata (2008)^はN^がT よりもかなり大きくとも検定が機能するように、_Swamy検定に改良を加えた。

• 現時点での標準的な検定といっても良いと思われる。

• Swamy検定統計量とは、分散の推定法が異なる。

(27)

分散の推定

• ^{各個人の分散を}

˜

σ_i²= ^(Yⁱ^{− X}ⁱ^β^ˆ^FE⁾

′_M

0^(Yi− Xi^β^ˆFE⁾

T _{− 1} ⁽²⁵⁾

と、固定効果推定の残差を使用して計算する。

• GLS^推定量も

β˜_GLS =

N

X

i=1

X_i^′M₀Xi

˜ σ²_i

!_{−1 N} X

i=1

X_i^′M₀Yi

˜

σ²_i ^, ⁽²⁶⁾ と_σ_˜²_i を使う。

(28)

検定統計量

Pesaran-Yamagata^{検定統計量は、}

PY =^√N ^N

−1_S_˜_{− k}

√2k

!

(27)

ただし、

S˜=

N

X

i=1

ˆ_β_i _{− ˜}_β_GLS^′^Xⁱ^′^M⁰^Xⁱ

˜ σ_i²

ˆ_β_i _{− ˜}_β_GLS ₍₂₈₎

N_{, T → ∞}^かつN/T⁴ _{→ 0}のとき、帰無仮説のもとで、

PY _→_dN(0, 1) (29)

• なお、この検定は、動学モデルでも使用可能である。ただし、N_{/T → κ}、0 ≤ κ < ∞^{という条件が必要。}

(29)

他の検定

他にも、Pesaran and Yamagata (2008)の検定では扱えない状況に対処するために、様々な検定法が近年に提唱されている。

• Juhl and Lugovskyy (2014)^では、T が固定されている状況や、もう少し柔軟に不均一分散を許しても、機能する検定が提唱されている。

• ^{Lin (2011)}でも同じような状況で使用可能な検定が提唱され

ている。また_{Lin (2011)}は動学モデルの場合も考慮している。

(30)

係数の分布を推定する ₃ つの方法

• 各個人ごとに計算した統計量の分布を分析する

• Deconvolution^法

• ^{グループ化}

(32)

平均以外の統計量

変量係数モデルに関しては、近年も重要な研究がいくつか発表されている。

始めに、各個人ごとに推定した係数の統計量を計算する方法を紹介する。

• Arellano and Bonhomme (2012)は、変量係数の平均分散の識別推定を議論している。なお、この論文は変量係数の分布も考えているがそれについては後述。

• Fern´andez-Val and Lee (2013)はモーメント条件で定義されるモデルの変量係数の平均や分散などの推定方法を議論している。

• 変量係数モデルとは少し異なるが、動学構造を示す係数の分布を求める方法をOkui and Yanagi (2015)^{は考案している。}

(33)

Arellano and Bonhomme (2012)

先に見た一部の変数の係数が変量係数になっているモデルを考える。

y_it= w_it^′a_i+ x_it^′β + uit (30) 各_a_iの推定量は

ˆ

ai = (W_i^′Wi)⁻¹W_i^′(Yi_{− X}iβ)^ˆ (31) となる。

• 既に平均の推定については紹介したので、ここでは、分散の推定に焦点を合わせる。

(34)

変量係数の分散の推定

ˆ

a_i ^の分散はa_i の分散の一致推定量にはなっておらず₍非線形バイアス₎、バイアス修正が必要になる。

Var(ˆa_i) = Var (ai) + Var ((W_i^′W_i)⁻¹W_i^′U_i) (32) したがって、

(Var (a\i)) = ¹ N

N

X

i=1

(ˆa_i_{− ˆ}µa)(ˆa_i _{− ˆ}µa)^′₋Var((W_i^\^′W_i)⁻¹W_i^′U_i) (33) として、分散の推定ができる。

しかし、_Var_((W_i\^′_W_i₎⁻¹_W_i^′_U_i₎を推定するためには_U_iの相関構造に制約が必要である。

(35)

分散の推定 _: 誤差項が均一分散の場合

誤差項_U_iが均一分散で系列相関がないなら、

ˆ

σ² = ¹ N_{(T − q)}

N

X

i=1

(Y_i_{− X}_iβ)^ˆ ^′M_i(Y_i_{− X}_iβ)^ˆ (34)

として、

Var((W_i\^′Wi)⁻¹W_i^′Ui) = ˆσ²¹ N

N

X

i=1

(W_i^′Wi)⁻¹ (35)

を使うと良い。

(36)

Fernand´ez-Val and Lee (2013)

モーメント条件で定義されるモデルに変量係数が入っている場合

E(g (z_it, θ₀, α_i₀)) = 0 (36)

• ^g ^{は既知の関数}

• θ₀^{は個人間で共通の係数}θ^の真値

• αi0^{は個人間で異なる係数}αi ^の真値

• ^{この論文では}^N, T → ∞の元での推定を考えている。

(37)

FE-GMM ^推定

推定は_GMMの様な推定量で行う。

(ˆ_{θ, {ˆ}αi_}^N_i=1) = arg inf

(θ,{αi}^N_i=1) N

X

i=1

ˆ

g_i(θ, αi)^′W_igˆ_i(θ, αi) (37)

ただし、

ˆ

g_i(θ, αi) = ¹ T

T

X

t=1

g(zit, θ, αi) (38)

かつ_W_i は重み付け行列である。

• ^{各個人ごとに}GMMの目的関数を作って、その和を取る形で目的関数が定義されている。

(38)

変量係数のモーメントの推定

αi^{の平均や分散は、}αˆiの平均や分散を取ることで推定できる。例えば、_α_i の平均は

ˆ µ_α = ¹

N

X

i=1

ˆ

αi (39)

とする。

• ^{この方法は、}^N_{, T → ∞}の漸近理論のもとで一致性をもつ。

• ^T ^が^Nに比べて非常に大きくない場合には、推定量にバイアスがでるので、バイアス修正が必要となる。

• この論文では、バイアスの式を明示的に導出し、その式を元にバイアスを_analyticalに推定する方法を提唱している。 Dhaene and Jochmans (2015)のハーフパネルジャックナイフも使用可能。

(39)

Okui and Yanagi (2015)

動学構造が個人ごとに異なる場合に、平均や自己共分散などの分布を分析する手法である。

設定は、以下の通りである。

• ^まず、αi をある分布から個人ごとの独立に抽出する。

• ^そして、_{yit_}^T_t=1^の値を、αi^{に依存する分布}^L_({yit_}^T_t=1; αi) から抽出する。

• µi = E (yit_|αi)が個人ごとに異なる平均になる。 w_it = y_it_{− µ}_i ^とおく。

• γ_k,i = E (witw_i,t−k_|αi)^が個人iにとっての自己共分散になる。

(40)

個人ごとの平均と自己共分散

まず、個人ごとの平均と自己共分散を計算する。

ˆ

µ_i := ¯y_i := ¹ T

T

X

t=1

y_it,

と

ˆ

γ_k,i := ¹ T _{− k}

T

X

t=k+1

(yit_{− ¯}yi)(y_i,t−k _{− ¯}yi).

と定義する。

そして、_µ_ˆ_i と_γ_ˆ_k,iの分布を用いて、_µ_iと_γ_k,i の分布を推定する。

(41)

分布と分位点

分布や分位点の推定量は、_µ_ˆ_i あるいは_γ_ˆ_k,iの経験分布から得られる。

例えば、_µ_i の分布は、

F^µ_N^ˆ^{(a) :=} ¹ N

N

X

i=1

1(ˆµi _{≤ a),}

として推定する。ただし、 ₁₍_·)は指示関数でありa_{∈ R}である。また、_µ_iの_τ 分位点は、

ˆ

q_τ := inf{a : F^muN^ˆ (a) ≥ τ}. として、推定する。

(42)

ある関数の期待値

興味のある数量が、_µ_i あるいは_γ_k,iの滑らかな関数の期待値として書ける場合は、T がそれほど大きくなくとも、バイアスが小さいことが証明できる。

θi ^をµi^とγ_k,i ^{のベクトルとする。} hを滑らかな関数とする。

H := E (h(θi))^{の推定は、}

Hˆ := ¹ N

N

X

i=1

h(ˆθi).

として出来る。H^ˆは_N/T² _{→ 0}のとき、漸近的にバイアスがない。

• ^例１：µi ^{の平均の場合は、}h(θi) = µi^。

• ^例２：µi ^とγ_1,i^{の共分散は、}h(θi) = (µiγ_1,i, µi, γ_1,i)^として、 Hˆ^{を推定し、}E(µ_iγ_1,i_{) − E (µ}_i)E (γ_1,i)^{の推定量を求める。}

(43)

ハーフパネルジャックナイフ

Dhaene and Jochmans (2015)によるハーフパネルジャックナイフ

(HPJ)を使用して、バイアス修正を行う。

T が偶数の場合を考える。₍奇数の場合は論文を参照₎

1. まず、パネルデータを前半と後半の二つのパネルデータに分ける。_({{y_it_}^T/2_t=1_}^N_i=1と_{{y_it_}^T

t=T /2+1^}^Ni=1⁾

2. H(1)^ˆ ^とH(2)^ˆ ^{を、それぞれ、}_{{yit_}^T/2_t=1_}^N_i=1^あるいは

{{y^it}^T_{t=T /2+1}}^Ni=1を使った推定量とする。 3. HPJ^{推定量は、}

H˜^HPJ = 2 ˆH₋¹

2^ˆ^{H(1) + ˆ}^H(2)

.

となる。この推定量は、バイアスの最大項を消すことができる。

(44)

Deconvolution ^法

変量係数の分布を、Deconvolution法を用いて推定する方法が、近年提唱されている。

• ^T _{→ ∞}の状況では、先に見たように直接的に分布を推定することができる。

• ^しかし、^T が固定の場合は、変量係数の分布を推定するためには、Deconvolution法、あるいはそれを一般化した線形作用素の逆作用素を取る方法が必要になる。

(45)

Deconvolution ^{法の基本的なアイデア}

Deconvolution法の基本的なアイデアを説明するために、次の簡

単な例を考える。

X₁=u + e1 (40)

X₂=u + e₂ (41)

X₁^とX₂の分布は分かっており、_{u, e}₁ _,e₂は独立に分布し_e₁と_e₂ は同じ対称な分布を持つとする。

確率変数_uの特性関数を

φ_u(τ ) = E (exp(juτ )) (42) と定義する。ただし_jは虚数単位である。

また_e₁と_e₂の特性関数を

φe(τ ) = E (exp(je₁τ )) = E (exp(je₂τ )) (43) とする。

(46)

Deconvolution ^{法による識別}

X₁^とX₂の分布は分かっているので、その特性関数も分かる。 φ_X(τ ) = E (exp(jX₁τ )) = φu(τ )φe(τ ) (44) また_X₁_{− X}₂_{= e}₁_{− e}₂ の特性関数から_eの特性関数も分かる。

φe(τ ) = (φe(τ )φe(τ ))^1/2 = E (exp(j(e₁_{− e}₂)))^1/2 (45) したがって、

φu(τ ) = ^φ^X^{(τ )}

φ_e(τ ) ⁽⁴⁶⁾

として、_uの特性関数も識別出来る。

• Deconvolution^法はKotlarski (1967)が初期の重要な研究としてあげられる。その後、数学的にも応用上も大きな進展を遂げた。

(47)

Deconvolution ^推定量

u^やe₁, e₂^{の分布は、}X₁^とX₁_{− X}₂の特性関数を推定し、それを逆フーリエ変換することで得られる。

たとえば、_uの密度関数は、 fˆ_u(a) = ¹

2π Z ∞

−∞

K(τ ) exp(−jaτ) ˆ^φ^X^{(τ )/ ˆ}^φ^e^{(τ )dτ} ⁽⁴⁷⁾

ただし、_K_{(τ )}はトリミング関数であり、大きい値の_τ を計算から除く。

• K(τ )を入れないと、推定はうまく行かない。

• Deconvolution^問題は、ill-posed inverse^{問題を起こす代表的} な例であり、トリミングなどといったregularization^がかなり重要な役割を果たす。

(48)

経済学での応用

• Deconvolution^法は、Horowitz and Markatou (1996)^によって経済学界で知られるようになったと思われる。かれらは、パネルデータへの応用を行っている。

• 近年、多くの分野で使用されるようになった。

• ^{ファクターモデル}: Cunha, Heckman and Schennach (2010) 測定誤差のある変数を含むモデルの分析: Schennach (2007) オークション: Krasnokutskaya (2011)

マッチング₍ミクロ経済学の意味での。学校選択など_): Agarwal and Diamond (2014)

• ^{ここでは、}Deconvolution法を応用による、個人間の異質性を分析する手法を紹介する。

(49)

Arellano and Bonhomme (2012)

先に見た一部の変数の係数が変量係数になっているモデルを考える。

yit= w_it^′ai+ x_it^′β + uit (48) 各_a_iの推定量は

ˆ

ai = (W_i^′Wi)⁻¹W_i^′(Yi_{− X}iβ)^ˆ (49) となる。

ˆ

a_i = ai+ (W_i^′W_i)⁻¹W_i^′U_i (50) という式から、_(W_i^′_W_i₎⁻¹_W_i^′_U_iの分布が分かると、_a_iの分布が分かる。

• 実際の方法は論文を参照のこと。

(50)

Mavroedis, Sasaki and Welch (2015)

パネル_AR(1)モデルで、変量係数になっている場合の識別と推定

を考察している。

yit = αi+ βiy_i,t−1+ ǫit (51)

ただし、_ǫ_it _{∼ N(0, σ}²_i₎ というモデルを考える。

• おそらく、ここで議論されている方法はDeconvolution^法とは呼ばれないだろう。より一般的な線形作用素の逆変換の議論を用いている。

(51)

変量係数からデータへの線形作用素

変量係数の分布_F_{(α, β, σ}²_|y₁₎からデータの分布_F_(y_T, . . . , y₂_|Y₁) は、次の線形作用素で表現できる。

L(ξ)(yT, . . . , y₂) (52)

= Z Z Z

ξ(a, b, s)

" s^1−T

T

Y

t=2

φ^y^t^{− a − by}^t−1 s

^#

da_{· db · ds} (53) データの分布F(yT, . . . , y₂_|y₁)^{は識別できるので、}L作用素の逆変換をとることができれば変量係数の分布の識別が出来る。

• ^{この論文の本論では、}^F(α, β, σ²_|y1)^{が正規分布と仮定し、} local maximum likelihoodでの推定を考えている。_Sieve近似を用いたnonparameteric^な方法はAppendix^にある。

(52)

グループ化

個人を数個のグループにわけて、各グループ内では係数の値は同じだが、グループが異なると係数の値も異なるというモデル。

• いわゆる構造推定の分野では、広く使われてきた。_Keane and Wolpin (1997)^など。

• 動学的離散選択モデルでは標準的な手法であり、計量経済学での研究の蓄積も多い。Kasahara and Shimotsu (2009)^など。

• ただし、これまではいわゆる有限混合モデルが中心である。

• ここでは、線型モデルで、機械学習的な手法を使ってグループ分けを行う方法を紹介する。

(53)

Bonhomme and Manresa (2015)

次の切片が個人ごとにも時間を通じても異なるモデルを考える。

y_it = x_it^′β + α_g_i_t+ v_it (54) ただし、全ての個人が異なる切片をもつわけではなく、各個人は G 個あるグループのどれかに属し、グループ内では、同じ切片を持つものとする。

• これをグループ固定効果(Grouped fixed effects)^と呼ぶ。

• ^いわゆる“kmeans”と呼ばれる手法の拡張になる。

• N/T^ν _{→ 0}^があるv> 0に成り立つとよいという弱い条件のもとで正当化できる。ただし_T _{→ ∞}は必要。

• 係数がグループ構造を持つモデルもOnline Appendix^で議論されている。

(54)

推定量

推定は_OLSで可能_(STATAコードも存在する₎

( ˆβ, ˆα, ˆγ) = arg min

N

X

i=1 T

X

t=1

(yit_{− x}_it^′_{β − α}git)² (55)

ただし、_γは_N個体を_G 個のグループに配分するやり方である。

• ^N, T → ∞^かつ^N/T^ν → 0^がある^v ^{> 0}^{に成り立つ、という} 条件が必要。

• ^{ただし、標準誤差は}^T が固定の元で求めた分散の推定量を使用するとよい。

(55)

アルゴリズム

1. β^とα^{の初期値を決める。}(β⁽⁰⁾, α⁽⁰⁾)^とする。s = 0^とおく。 2. ^すべてのiをグループ分けする。

g_i^(s+1)= arg min

g∈{1,...,G } T

X

t=1

(y_it_{− x}_it^′β^(s)_{− α}^(s)_g_i_t)² (56)

3. β^とα^{の値を更新する。}

(β^(s+1), α^(s+1)) = arg min

β,α T

X

t=1

(y_it_{− x}_it^′_{β − α}_g(s+1)

i ^t

)² (57)

• 論文によると、この方法は_G _{= 3}までうまくいく。

• ^しかし、^kmeans法はより速く安定した手法が現在も開発さ

れており、それらを応用することで、グループが多い場合も計算が可能になる。

(56)

Su, Shi and Phillips (2014)

変量係数モデルを考える。

y_it= x_it^′βi+ αi + vit (58) ただし、_β_iは個体ごとに異なるが、個体は_G個のグループのどれかに属するし、グループ内では係数の値は同じとする。

• G ^{個の異なる係数を}(θ₁, . . . , θG)^とする。

• αiは個人ごとに異なってもよい。

(57)

CLasso ^推定

固定効果変換を行った変数に次のCLasso (classfier Lasso)^を使用する。

( ˆβ, ˆθ) = arg min

β,θ

1 NT

N

X

i=1 T

X

t=1

(¨yit_{− ¨x}_it^′βi)²+ ^λ N

G

Y

g=1

kβⁱ − θ^gk (59)

• ^λ^はtuning parameter^。

• L1^{罰則の性質により、}β^ˆi = ˆθg ^があるg ^{について漸近的に確} 率₁で成り立つ。

• ^N, T → ∞^が必要。^T ^{の大きさの条件は}^λ^{の大きさによる。}

(58)

補足

Su, Shi and Phillips (2014)では他にも多くの分析がなされている。

• 動学パネルデータモデルの_CLassoによる_GMM推定

• グループの数を情報量基準から選択する方法

• グループの数を検定する方法はLu and Su (2014)^{で紹介され} ている。

(59)

終わりに

• 個体間の異質性の問題は、これからの経済学の実証分析での重要な課題であろう。

• このチュートリアルでは、異質性の問題に対処する統計手法の一つである変量係数モデルのこれまでの研究成果の概観を行った。

• 前半で紹介した手法は、現時点でも標準的な手法と考えてもよいだろう。

• 後半では、最新の研究成果を紹介した。これらの手法は計算量の問題があるものや理論的にさらに詳細な検討が必要なものもあるが、今後標準的な手法となる可能性を秘めている。

pdf 教育 OKUI, Ryo panel hetero v2

パネルデータを用いた個人間の異質性の分析

- 変量係数モデルの近年の展開 -

目次

目次

チュートリアルの内容

背景

異質性に向き合う手法

目次

変量係数モデル

固定効果推定量は何を推定しているのか

固定効果モデルを書き換える

条件

係数の平均の推定

共通係数の推定

共通変数の推定のための条件

変量係数の期待値

動学モデル

パネル AR(1) モデル

問題点

変量係数と y

の相関

Pesaran and Smith (1995)

同質性の検定

設定

基本的な考え方

表記

Swamy (1970)

Pesaran and Yamagata (2008)

分散の推定

検定統計量

他の検定

目次

係数の分布を推定する 3 つの方法

平均以外の統計量

Arellano and Bonhomme (2012)

変量係数の分散の推定

分散の推定 : 誤差項が均一分散の場合

Fernand´ez-Val and Lee (2013)

FE-GMM 推定

変量係数のモーメントの推定

Okui and Yanagi (2015)

個人ごとの平均と自己共分散

分布と分位点

ある関数の期待値

ハーフパネルジャックナイフ

Deconvolution 法

Deconvolution 法の基本的なアイデア

Deconvolution 法による識別

Deconvolution 推定量

経済学での応用

Arellano and Bonhomme (2012)

Mavroedis, Sasaki and Welch (2015)

変量係数からデータへの線形作用素

グループ化

Bonhomme and Manresa (2015)

推定量

アルゴリズム

Su, Shi and Phillips (2014)

CLasso 推定

補足

目次

終わりに

_- 変量係数モデルの近年の展開 _-

パネル _AR(1) モデル

変量係数と _y

係数の分布を推定する ₃ つの方法

分散の推定 _: 誤差項が均一分散の場合

FE-GMM ^推定

Deconvolution ^法

Deconvolution ^{法の基本的なアイデア}

Deconvolution ^{法による識別}

Deconvolution ^推定量

CLasso ^推定