4 教育 OKUI, Ryo

(1)

平成²⁸年度上級計量経済学講義ノート^{4: GMM}推定量

このノートでは、一般化モーメント法(generalized method of moments, GMM)の解説を行う。経済モデルによって導かれるモーメント条件を用いて用いて推定を行う方法が、 GMMである。Hansen (1982)によって提案され、名前の通りモーメント法を拡張したものである。OLS推定量やIV推定量などもGMMの特殊例として考える事ができ、また他にも使用できる場合が多く、経済分析で頻繁に使用されている。

4.1 _{モーメント法：復習}

モーメント法とは、母集団モーメントと標本モーメントが等しくなるようにパラメータの値を決める推定法である。ある既知のk次元ベクトル値関数_{g(·, ·)}に対して確率変数Xとk 次元未知パラメータθ₀がモーメント条件

E[g(X; θ0)] = 0 (1)

を満たしているとする。標本_{X1, · · · , Xn}^{が得られたとき、}^θ0のモーメント法推定量θ^ˆは 1

n

∑

i=1

g(X_i; ˆθ) = 0 (2)

により定義される。例： IV推定量

y_i= X_i^′β + ϵ_i (3)

において、モーメント条件

E(Ziϵi) = 0 (4)

が成立している時、(3)、(4)からϵiを消去して

E[Z_i(y_i_{− X}_i^′β)] = 0 (5)

これに対応する標本モーメントと母集団モーメントが等しいとおいて得られる推定量、 1

n

∑

i=1

[Zi(yi_{− X}_i^′β)] = 0^ˆ (6)

を考えると、

β = ˆˆ β_IV = ( _n

∑

i=1

Z_iX_i^′ )−_{1 n}

∑

i=1

Z_iy_i= (Z^′X)⁻¹Z^′Y (7)

となる。

4.2 GMM_推定量

モーメント法は原則としてパラメータの数(= k)と同数のモーメント条件を用意して推定を行う。パラメータの数より多くのモーメント条件(= p > k)がモデルから得られることもある。_{g(·; ·)}をp次元の既知のベクトル関数として、

E[g(X; θ₀)] = 0 (8)

(2)

というモーメント条件が与えられるとき、(2)と同様に 1

n

∑

i=1

g(X_i; ˆθ) = 0 (9)

を満たす推定量が考えられる。しかし、この方程式はk個の未知パラメータに対してp(> k) 本の方程式があるため、一般には解は存在しない。そこで、できるだけ全てのモーメント条件を満たすように、W を_{p × p}の正値定符号であるウェイト行列として

θˆ_{GM M} = arg min

θ ^Q(θ), ^{Q(θ) =}

[1 n

n

∑

i=1

g(X_i; θ) ]′

W [1

n

∑

i=1

g(X_i; θ) ]

(10)

によって定める推定量をGMM推定量という。

4.2.1 一般的な操作変数推定・・・単一方程式の場合

既知のスカラー関数_{m(·, ·; ·)}に対して、経済変数y_i, X_i が

m(y_i, X_i; θ) = ϵ_i (11)

という関係にあるとする。θはk次元の未知パラメータである。例えば、m(y_i, X_i; β) = y_i_{− X}_i^′βなら、操作変数法で考えたモデルと同じになる。IV法と同様にE(Z_iϵ_i) = 0を満たす操作変数Zがあるが、Zの次元がp(> k)であるとする。そのとき、モーメント条件としてp本の方程式

E(Ziϵi) = 0 (12)

があり、対応する標本モーメントの条件は 1

n

∑

i=1

Zim(yi, Xi; θ) = 0 (13)

となる。p本すべての式を満たすθは一般に存在しないので、

θˆ_{GM M} = arg min

θ

[1 n

n

∑

i=1

Z_im(y_i, X_i; θ) ]′

Wˆ [1

n

∑

i=1

Z_im(y_i, X_i; θ) ]

(14)

によって推定量を定義することが考えられる。W^ˆ は任意の正値定符号な_{p × p}行列でよいが、うまく選択することによって効率性を上げることができる。なお、W^ˆ はデータに依存してもよく、その意味でハットがつけられている。

講義ノート2で取り上げた2SLS推定量はGMM推定量の一種である。2SLSの場合は、モデルは、m(y_i, X_i; θ) = y_i_−X_i^′θであり、GMM推定の際の重み付け行列はW =^ˆ ^∑ⁿ_i=1Z_iZ_i^′/n である。

4.3 GMM_{推定量の漸近的性質}

この節では、GMM推定量と一致性と漸近正規性の証明と、そのために必要な仮定の解説をする。

(3)

4.3.1 _一致性

一致性の証明のために以下の仮定をおく。まずは、パラメータ空間がコンパクトである場合を考える。_{Xi}ⁿi=1^は^i.i.d.^{であるとする。}

A1: E[g(X_i; θ₀)] = 0

A2: θ0 _{∈ Θ}、ΘはR^pのコンパクト集合である。

A3: g(X_i; θ)は任意のX_iに対してθに関して連続である。 A4: （識別条件）_{θ ̸= θ}0ならE[g(X_i_{; θ)] ̸= 0} である。

A5: （押さえ込み(dominance)条件） E[sup_θ∈Θ_||g(Xi; θ)||] < ∞ A6: ˆ_{W →}_p W、W は対称な正値定符号行列

定理 ^1. (Proposition 7.7, Hayashi (2000, p467), の特殊例)仮定A1-A6の下で、

θˆ_{GM M} _→_p θ₀ (15)

パラメータ空間のコンパクト性の仮定A2が成立しない場合は、目的関数が凸(ここでは最小化問題を考えているため)であれば、一致性の証明は可能である。そのためにA2, A3, A5を以下で置き換える。

A2’: θ₀ _{∈ Θ}、ΘはR^pのコンパクト集合ではない。θ₀はΘの内点である。 A3’: Q_n(θ)は任意のデータ_{X1, · · · , Xn}^に対して^θ^{について凸である。} A5’: ||E[g(Xi; θ)]|| < ∞, ∀θ ∈ Θ

定理 ^2. 仮定A1, A2’,A3’,A4, A5’, A6の下で、

θˆ_{GM M} _→_p θ₀ (16)

定理1と2も、極値推定量の理論に当てはめることによって証明できる。

4.3.2 _{漸近正規性}

漸近正規性のために、定理1または2の仮定に加えて以下を仮定する。 A7: θ0はΘの内点である。

A8: g(X; θ)は任意のXにおいてθについて連続微分可能である。 A9: ^∑ⁿ_i=1g(X_i; θ₀)/^√_{n →}_dN (0, S)、Sは正値定符号行列である。 A10: θ0の近傍N (θ0)に対して

E [

sup

θ∈N (θ0)

∂g(X_i; θ)

∂θ^′ ]

< ∞ ⁽¹⁷⁾

A11: G = E^{[ ∂g(X}ⁱ^{; θ}⁰⁾

∂θ^′ ]

として、rank(G) = k A12: あるS^ˆが存在して、_{S →}^ˆ p ^Sとなる。

定理³ (GMM推定量の漸近正規性). 定理1または2の条件が成り立ち、さらに、A7-A11 が成立するとき、

1. ^√n(ˆθ_{GM M}_{− θ}₀_{) →}_dN (0, Ω)、ただしΩ = (G^′W G)⁻¹G^′W SW G(G^′W G)⁻¹; 2. 更にA12を加えるとΩ = ( ˆ^ˆ G^′W ˆ^ˆG)⁻¹G^ˆ^′W ˆ^ˆS ˆW ˆG( ˆG^′W ˆ^ˆG)⁻¹ _→_p Ω、

ただし G = n^ˆ ⁻¹^∑ⁿ_i=1∂g(Xi; ˆθGM M)/(∂θ^′)。

(4)

GMM推定量の漸近正規性の証明は、前節で紹介した極値推定量の議論をそのまま適用しても可能である。しかし、GMM推定量の場合は、目的関数の2次微分を考えること無しに証明することもできる。ここで紹介するのは、2次微分を使わない証明法である。

(証明)

A8より、GMM推定の最小化問題の解は

2 [1

n

∑

i=1

∂g(X_i; ˆθ_{GM M})

∂θ^′

]′

Wˆ [1

n

∑

i=1

g(X_i; ˆθ_{GM M}) ]

= 0 (18)

を満たす。A8と平均値の定理より、 1

n

∑

i=1

g(X_i; ˆθ_{GM M}) = ¹ n

n

∑

i=1

g(X_i; θ₀) + ¹ n

n

∑

i=1

∂g(X_i; ¯θ)

∂θ^′ ^(ˆ^θ^{GM M}^{− θ}⁰⁾ ⁽¹⁹⁾ を満たすθ^¯が存在し、ある_{λ ∈ [0, 1]}に対してθ = λˆ^¯ θ_{GM M} _{+ (1 − λ)θ}₀と書ける。従って

√n(ˆθ_{GM M} _{− θ}₀)

= − {[1

n

∑

i=1

∂θ^′

]′

Wˆ [1

n

∑

i=1

∂g(X_i; ¯θ)

∂θ^′

]}⁻1

× [1

n

∑

i=1

∂θ^′

]′

Wˆ [ 1

√n

n

∑

i=1

g(X_i; θ₀) ]

(20)

前章の一様収束に関する補題においてパラメータ空間をN (θ0)の閉包に変更したものを考えると、A7, A8, A10から、

sup

θ∈N (θ0)

1 n

n

∑

i=1

∂g(X_i; θ)

∂θ^′ ^{− E}

[ ∂g(Xi^{; θ)}

∂θ^′ ]

→p⁰ ⁽²¹⁾

となる。θ^ˆGM Mの一致性より_{θ →}^¯ pθ0、(21)、A8が成立しているため前章のAmemiya (1985) からの補題が適用できて、

1 n

n

∑

i=1

∂g(Xi; ˆθGM M)

∂θ^′ ^→^p ^E

[ ∂g(Xi; θ0)

∂θ^′ ]

= G, (22)

1 n

n

∑

i=1

∂g(Xi; ¯θ)

∂θ^′ ^→^p ^E

[ ∂g(Xi; θ0)

∂θ^′ ]

= G (23)

である。(20), (22), (23), ˆ_{W →}_p W (A6),仮定A9から、

√n(ˆθ_{GM M}_{− θ}₀_{) →}_d N (0, (G^′W G)⁻¹G^′W SW G(G^′W G)⁻¹) (24)

2.は_{W →}^ˆ p W , A12, (22)より明らか。（証明終）補足

• ˆ^S^{としては、例えば、} S =ˆ ¹

n

∑

i=1

g(X_i; ˆθ_{GM M})g(X_i; ˆθ_{GM M})^′ (25)

が考えられる。

(5)

4.4 効率的な GMM 推定

W = S⁻¹のとき、GMM推定量の漸近分散Ωは最小になる。つまり、任意の対称な正値定符号行列W に対して、

(G^′W G)⁻¹G^′W SW G(G^′W G)⁻¹ _{≥ (G}^′S⁻¹G)⁻¹ (26) が成立する。従って、ウェイト行列をW = S⁻¹とおいて推定を行うのが良いが、実際には Sは未知なので、実行不可能である。

実行可能で効率的なGMM推定として、以下の二つの手法が提案されている。 1. 2段階GMM

１段階目にW = IとしてGMM推定を行い、θ^ˆ_{GM M}⁽¹⁾ を得る。それを用いてS^ˆを得る。２段階目にS^ˆ⁻¹をウェイト行列に使ってθ^ˆ_{GM M}⁽²⁾ を得る。これは、漸近分散(G^′S⁻¹G)⁻¹ を達成する効率的なGMM推定量である。

2. Continuous updating GMM

θが未知であるためにSの推定ができないわけであるが、θを未知のままSの「推定量」を構成することは可能である。たとえば、

S(θ) =ˆ ¹ n

n

∑

i=1

g(X_i; θ)g(X_i; θ)^′ (27)

とすればよい。Contiunous updating estimator (CUE)は、これを用いて、

θˆ_{CU E} = arg min

θ

[ 1

√n

n

∑

i=1

g(X_i; θ) ]′

S(θ)ˆ ⁻¹ [ 1

√n

n

∑

i=1

g(X_i; θ) ]

(28)

によって定義されるもので、漸近分散(G^′S⁻¹G)⁻¹を達成する効率的なGMMである。系¹ ⁽²段階GMM推定量の漸近正規性). 定理3の条件を仮定する。ただし、W^ˆ にはS^ˆ⁻¹ を用いて、上のいずれかの方法による効率的GMM推定を考えるものとする。そのとき、

(a) ^√n(ˆθ_{GM M}_{− θ}₀_{) →}_dN (0, Ω)、ただしΩ = (G^′S⁻¹G)⁻¹ (b) ˆΩ = ( ˆG^′S^ˆ⁻¹G)^ˆ ⁻¹_→p Ω

CUEも同様の結果が成り立つが、その証明はこの授業では取り扱わない。

一般に、2段階GMM推定量の方が計算が簡単であるが、バイアスが大きいことが知られている(Hansen, Heaton and Yaron (1996)、Newey and Smith (2004))。

4.5 GMM推定を元にした係数に関する検定

この節ではパラメータに関する仮説が正しいか否かの検定法を説明する。ML法の枠組みでは、ワルド検定、ラグランジュ乗数検定、尤度比検定という３つの同等な大標本検定法があるが、GMMの枠組みでも原理的にそれらと同様にして検定法を構成できる。ここでは、これら3つの方法を紹介する。詳しい議論は、Hayashi (2000, Section 7.4, p.487-497)を参照のこと。

a(θ)を_{r(≤ k)}次元の連続微分可能なベクトル値関数とし、以下の検定を考える。

H₀ : a(θ₀) = 0 (29)

H₁ : a(θ₀_{) ̸= 0} (30)

また、A(θ) = ∂a(θ)/∂θ^′、A₀ = A(θ₀)とする。

(6)

4.5.1 _{ワルド検定}

もし帰無仮説が正しければ、H0の制約なし推定量θ^ˆは制約をほぼ満たすはずである。そこで、ワルド検定ではa(ˆ_{θ) ≈ 0}かどうかを調べる。検定統計量は以下で定義される。S^ˆをS の一致推定量として、

T_W = na(ˆθ)^′[A(ˆθ)( ˆG^′S^ˆ⁻¹G)^ˆ ⁻¹A(ˆθ)^′]⁻¹a(ˆθ) (31) この統計量の構成は、k次元正規確率変数ベクトルuでその分散行列V (u)の逆行列をはさむ２次形式u^′[V (u)]⁻¹uを作ると、それは自由度kのカイ二乗分布に従うという性質を用いたものである。

定理 ^4. ワルド検定

(i) 定理3の仮定が成立する。

(ii) a(θ)はr(< k)次元の連続微分可能なベクトル値関数とする。 (iii) A₀は行フルランクである。

(i)-(iii)の仮定が成立するとき、H0のもとで、

T_W _→_d χ²_r (32)

となり、H₁のもとで、 TW

n ^→^p ^a(θ⁰⁾

′[A0(G^′S⁻¹G)⁻¹A^′₀]⁻¹a(θ0) = 定数(> 0) (33) である。

証明は、通常のF検定や尤度法におけるワルド検定と同じであるので省略する。¹ 補足

1参考までに証明を記載しておく。a(θ)は連続微分可能なので、平均値の定理から

√n[a(ˆ_{θ) − a(θ}0)] = A(¯θ)^√n(ˆ_{θ − θ}0) (34) かつ

A(¯_{θ) →}pA(θ0) (35)

である。従って、 _√

n[a(ˆθ_{) − a(θ}0)] →^d^N^{(0, A}0(G^′S⁻¹G)⁻¹A^′₀) (36) (22)より_{G →}^ˆ pG、A13より_{S →}^ˆ pS、(ii)よりA(ˆ_{θ) →}pA0なので、

A(ˆθ)( ˆG^′S^ˆ⁻¹G)^ˆ ⁻¹A(ˆθ)^′_→pA(θ0)(G^′S⁻¹G)⁻¹A(θ0)^′ (37) (36)、(37)より

n[a(ˆθ_{) − a(θ}0)]^′[A(ˆθ)( ˆG^′S^ˆ⁻¹G)^ˆ ⁻¹A(ˆθ)^′]⁻¹[a(ˆθ_{) − a(θ}0_{)] →}dχ²r (38) である。(38),(37)は帰無仮説、対立仮説のどちらが正しい場合にも成立する。帰無仮説a(θ0) = 0が正しい場合、(38)の左辺でa(θ0) = 0とおくとTW に一致することから、H0の下では、

TW _→dχ²r (39)

が示される。次にH1の下でのTW の性質を調べる。a^′V a, b^′V bが計算できるような任意のa, b, V に対して a^′V a_{= (a − b)}^′V(a − b) + (a − b)^′^{V b}^{+ b}^′^V(a − b) + b^′^{V b}^{が成立するので、}

TW

n ⁼ ^[a(ˆ^{θ) − a(θ}⁰^)]

′_[A(ˆ_{θ)( ˆ}_G′_S_ˆ−1_G)_ˆ −1_A(ˆ_θ)′_]−1_[a(ˆ_{θ) − a(θ}

0)] (40)

+ [a(ˆ_{θ) − a(θ}0)]^′[A(ˆθ)( ˆG^′S^ˆ⁻¹G)^ˆ ⁻¹A(ˆθ)^′]⁻¹a(θ0) (41) + a(θ0)^′[A(ˆθ)( ˆG^′S^ˆ⁻¹G)^ˆ ⁻¹A(ˆθ)^′]⁻¹[a(ˆ_{θ) − a(θ}0)] (42) + a(θ0)^′[A(ˆθ)( ˆG^′S^ˆ⁻¹G)^ˆ ⁻¹A(ˆθ)^′]⁻¹a(θ0) (43)

(7)

• H¹^の下では^TW^/nがある正の定数に確率収束するので、「T_W は発散する」と解釈できる。実際、H₁が正しい時、nが大きくなるとH₀が棄却される確率が１に近づく。それを、T_W _→_p _∞と書くこともあるが、それは任意の（大きい）C > 0、（小さい） ϵ > 0に対して、あるn0が存在して、すべてのn > n0について

P (T_W < C) < ϵ (45)

が成立する、ということを意味する。

• (iii)は重複した制約が含まれないことを保証している。また、(iii)が成立しないなら逆行列が計算できないという問題が生じる。

4.5.2 _{ラグランジュ乗数（}LM_）検定

ラグランジュ乗数(LM )検定では帰無仮説を制約として推定を行ったときに、その制約が効いているかどうかを調べる。LMでは制約付きのGMM推定量θ^˜_{GM M}が必要になる。それは以下の解として定義される。

minθ∈Θ

[1 n

n

∑

i=1

g(X_i; θ) ]′

S˜⁻¹ [1

n

∑

i=1

g(X_i; θ) ]

s.t. 2a(θ) = 0 (46)

すなわちΘ₁ = Θ ∩ [θ : a(θ) = 0]^として

θ = arg min˜

θ∈Θ1

[1 n

n

∑

i=1

g(X_i; θ) ]′

S˜⁻¹ [1

n

∑

i=1

g(X_i; θ) ]

(47)

なお、制約なしの推定量は前節までと同じくθ^ˆ_{GM M} とする。以下、表現を簡潔にするためにθ^ˆGM M, ˜θGM Mをθ, ˜^ˆ θと書くことにする。θ^ˆは常に一致推定量であるが、θ^˜は帰無仮説（制約a(θ₀) = 0）が正しいときのみ一致性をもつ。つまり、

θ1= arg min

θ∈Θ1

E[g(Xi; θ)]^′S⁻¹E[g(Xi; θ)] (48)

として、帰無仮説が正しいときはθ1 = θ0、対立仮説が正しい時はθ1 _{̸= θ}0であるから θ →ˆ p^θ0 ^(H0とH₁の両方の下で)、 (49) また、

θ →˜ p ^θ0 ^(H0のもとで) (50)

→^p ^θ¹(̸= θ⁰⁾ ^(H¹^のもとで⁾ ⁽⁵¹⁾ となる。

この検定は、制約付き最大化問題において、制約が有効(binding)でなければラグランジュ乗数が0になり、有効であればラグランジュ乗数が0でないという性質を用いた検定で

と書ける。対立仮説が正しい場合、右辺第１、２、３項はa(θ)の連続性、θ →^ˆ ^p^θ0、(37)から0に確率収束する。また、(37)から第４項はa(θ0)^′[A0(G^′S⁻¹G)⁻¹A^′0^]⁻¹^a(θ0)に収束する。従って、対立仮説が正しい時には

TW

n ^→^p^a(θ⁰⁾

′_[A

0(G^′S⁻¹G)⁻¹A^′0^]⁻¹^a(θ0)(> 0) (44) となる。

(8)

ある。制約の下でのSの推定量をS^˜、ラグランジュ乗数をνとして、(46)の解は以下の一階の条件を満たす。

[1 n

n

∑

i=1

∂g(Xi; ˜θ)

∂θ^′ ]′

S˜⁻¹ [ 1

√n

n

∑

i=1

g(Xi; ˜θ) ]

+^√nA(˜θ)^′ν = 0˜ (52)

√na(˜θ) = 0 (53)

ラグランジュ乗数検定統計量は

T_LM = n˜ν^′[A(˜θ)( ˜G^′S^˜⁻¹G)^˜ ⁻¹A(˜θ)^′]˜ν (54) である。ただしG = n^˜ ⁻¹^∑ⁿ_i=1∂g(X_i; ˜θ)/(∂θ^′)である。

定理 ^5. ラグランジュ乗数検定以下の仮定を導入する。

(i) 定理3の仮定がA12を除いて成立する。

(ii) a(θ)は_{r(≤ k)}次元の連続微分可能なベクトル値関数とする。

(iii) A0は行フルランクである。 (iv) 帰無仮説のもとで_{S →}^˜ p ^S

(v) 対立仮説のもとで_{S →}^˜ p ^S1で、S₁は正値定符号行列である。

(vi) A1= A(θ1)は行フルランク、G1 = E[∂g(Xi; θ1)(∂θ^′)]は列フルランクである。ただし、θ₁は(48)である。

仮定(i)-(iv)の下で、H₀が正しいなら、

T_LM _→_dχ²_r (55)

が、仮定(i)、(ii)、(v)、(vi)の下で、H1の場合には、

T_LM

n ^→^p ^γ

′[A₁(G^′₁S₁⁻¹G₁)⁻¹A^′₁]⁻¹γ =定数(> 0) (56) が成り立つ。

証明は授業では省略する。²

（※）仮定(vi)の「A₁= A(θ₁)は行フルランク」は、対立仮説のもとでの収束の形で定理を記述するために必要であるが、実際には成立していなくても検定上は困らない。むしろ、発散が早くなると考えられ、望ましいであろう。

2興味のある学生の為に、ここに証明を記載しておく。平均値の定理より

√1 n

n

∑

i=1

g(Xi; ˜θ) = _√¹ n

n

∑

i=1

g(Xi; θ1) + ¹ n

n

∑

i=1

∂g(Xi; ¯θ1)

∂θ^′

√n(˜_{θ − θ}1) (57)

√na(˜θ) = A(¯θ2)^√n(˜_{θ − θ}1) (58) を満たすθ^¯1= λ1θ^˜+ (1 − λ1)θ1、θ^¯2= λ2θ^˜+ (1 − λ2)θ1が存在する。(52)、(53)に(57)、(58)を代入すると

Ψ =˜ [1

n

∑

i=1

∂g(Xi; ˜θ)

∂θ^′ ]′

S˜⁻¹ [1

n

∑

i=1

∂g(Xi; ¯θ1)

∂θ^′ ]

(59) として

Ψ˜^√n(˜_{θ − θ}1) +^√nA(˜θ)^′ν˜ = ₋ [1

n

∑

i=1

∂g(Xi; ˜θ)

∂θ^′ ]_′

S˜⁻¹_√¹ n

n

∑

i=1

g(Xi; θ1) (60)

A(¯θ2)^√n(˜_{θ − θ}1) = 0 (61)

(9)

4.5.3 _尤度比（LR_）検定

ここで考える枠組みは最尤法ではないので、厳密には尤度比検定という言葉は適切ではないかもしれないが、最尤法の枠組みにおける尤度比検定と全く同等の考え方から統計量が導かれるため、そのように呼ぶことにする。尤度比検定(LR)では制約つき推定値と制約なし推定値で目的関数が達成する最大値に違いがあるかどうかを調べる。検定統計量は

T_LR_{= −2n[Q}_n(ˆ_{θ) − Q}_n(˜θ)] (73) であり、適当な条件のもとで、

T_LR

{→d^χ²r ^(H⁰^のとき⁾

→p ∞ (H1のとき) ⁽⁷⁴⁾

が示される。

を得る。これを行列表記すると

( _˜

Ψ A(˜θ)^′ A(¯θ2) 0

) ( _√

n(˜_{θ − θ}1)

√_n˜ ν

)

= (

−[¹n

∑n i=1

∂g(Xi; ˜θ)

∂θ′ ^]^′S^˜^{−1 1}√_n^∑ⁿ_i=1g(Xi; θ1) 0

)

(62) 分割行列の逆行列の公式(Hayashi (2000), p.673)を使うと、

√n˜ν_{= −}^[A(¯θ2) ˜Ψ⁻¹A(˜θ)^′^]⁻¹A(¯θ2) ˜Ψ⁻¹ [1

n

∑

i=1

∂g(Xi; ˜θ)

∂θ^′ ]_′

S˜⁻¹_√¹ n

n

∑

i=1

g(Xi; θ1) (63)

帰無仮説が正しい時、θ1= θ0で、θ,¯^˜θ1, ¯θ2はすべてθ0に確率収束するので、仮定の下で講義ノート3の補題3 が適用できて

G →˜ ^p^{G, ˜}Ψ →^pG^′S⁻¹G, (64)

また、仮定(ii)より

A(¯θ2) →^p^A(θ0) (65)

である。一方、(64),仮定(iv),仮定A9から [1

n

∑

i=1

∂g(Xi; ˜θ)

∂θ^′ ]_′

S˜⁻¹_√¹ n

n

∑

i=1

g(Xi; θ0) →^d^{N(0, G}^′^S⁻¹^G) ⁽⁶⁶⁾

である。(63), (64), (65), (66)より

√n˜_{ν →}dN(0, (A(θ0)G^′S⁻¹GA(θ0)^′)⁻¹) (67) が成り立ち、仮定(ii)と_{θ →}^˜ pθ0よりA(˜θ_{) →}pA(θ0)、(64)が成り立つ。これらと仮定(iv)より、H0の下で

TLM _→dχ²r (68)

が示される。

対立仮説のもとでは、(63)を

√_n˜

ν (69)

= ₋^√n[A(¯θ2) ˜Ψ⁻¹A(˜θ)^′]⁻¹A(¯θ2) ˜Ψ⁻¹ [1

n

∑

i=1

∂g(Xi; ˜θ)

∂θ^′ ]_′

S˜⁻¹¹ n

n

∑

i=1

g(Xi; θ1) (70)

として考える。右辺を^√nで割ったものは

γ_{= −[A}1(G^′₁S₁⁻¹G)⁻¹₁ A^′₁]⁻¹A1(G^′₁S⁻¹₁ G1)⁻¹G₁^′S₁⁻¹E[g(Xi; θ1)] (71) に収束する。定理の仮定よりE[g(Xi; θ1)] ̸= 0^なので、^{(v), (vi)}^よりγ ̸= 0。以上から、対立仮説のもとでのワルド検定の収束の証明と同様にして、H1の下では、

TLM

n ^→^p^γ

′_[A

1(G^′₁S₁⁻¹G1)⁻¹A^′₁]γ =定数(> 0) (72)

（証明終）

(10)

4.6 J検定（過剰識別の検定）

GMM推定に用いるモーメント条件が正しいかどうかを確かめる検定法を扱う。それはJ検定と呼ばれ、過剰識別性(over-identification)の検定ともいう。前節で示した効率的なGMM 推定量を用いるものとする。非効率なGMM推定量を下に検定を考える事もできるが、その場合は検定統計量の帰無仮説の下での漸近分布を求めることが難しくなる。

通常、GMM推定に用いられるモーメント条件の個数（p）は、パラメータの次元（k）よりも多い。もしp = kなら、丁度識別であり、目的関数の最小値は0になる。しかし、p > k のときは、用いるモーメント条件が正しければ目的関数の最小値0に近い値になるはずである。これを用いて検定を行うのがJ検定である。なお、もしもモーメント条件の中に間違った制約が含まれていると、推定結果は一致性を持たない。検定の帰無仮説と対立仮説は

H₀: E[g(X_i; θ)] = 0, _∃θ (75) H₁: E[g(X_i; θ)] ̸= 0, ∀θ ⁽⁷⁶⁾ である。検定統計量を

J = nQ_n(ˆθ) (77)

とすると、以下の結果が成り立つ。

定理 ⁶ ^(J 検定). 系1と同じ条件を仮定する。ただし、定理3のA9を A9’: ^∑ⁿ_i=1_{g(X_i; θ) − E[g(Xi; θ)]}/^√n →d^{N (0, S)}

で置き換えるものとする。M₁を証明中で定義する、ある定数行列として、

J

{→d^χ²_p−k ^(H0のとき)

→^p ∞ ^(H¹^{のとき、ただし、}^δ^′^(S⁻¹− S⁻¹²^M¹^S⁻¹²)δ ̸= 0^{である場合のみ}⁾ ⁽⁷⁸⁾ となる。なお、δはθ1 = arg min_θE[g(Xi; θ)]^′S⁻¹E[g(Xi; θ)]として、E[g(Xi; θ)] = δと定義される。δはp次元ベクトルであるが、対立仮説はそのp個の要素のうち、ひとつでもゼロでないものがあるという仮説である。

（証明）平均値の定理より

√1 n

n

∑

i=1

g(Xi; ˆθ) = _√¹ n

n

∑

i=1

g(Xi; θ0) + ¹ n

n

∑

i=1

∂g(Xi; ¯θ)

∂θ^′

√n(ˆ_{θ − θ}0) (79)

で、_{θ →}^¯ p ^θ0である。(20)を代入すると、ウェイト行列にS^ˆ⁻¹を用いることに注意して、

√1 n

n

∑

i=1

g(X_i; ˆθ) = S¹² [

S⁻¹²_√¹ n

n

∑

i=1

g(X_i; θ₀) ]

(80)

− _n¹

n

∑

i=1

∂g(X_i; ¯θ)

∂θ^′ ⁽⁸¹⁾

× {[1

n

∑

i=1

∂g(X_i; ˆθ)

∂θ^′ ]′

Sˆ⁻¹ [1

n

∑

i=1

∂g(X_i; ¯θ)

∂θ^′

]}⁻1

(82)

× [1

n

∑

i=1

∂g(X_i; ˆθ)

∂θ^′ ]′

Sˆ⁻¹S¹² [

S⁻¹²_√¹ n

n

∑

i=1

g(X_i; θ₀) ]

(83)

(11)

ここで、

Mˆ = S⁻^1/2 [1

n

∑

i=1

∂g(X_i; ¯θ)

∂θ^′

] {[1 n

n

∑

i=1

∂g(X_i; ˆθ)

∂θ^′ ]′

Sˆ⁻¹ [1

n

∑

i=1

∂g(X_i; ¯θ)

∂θ^′

]}⁻1

(84)

× [1

n

∑

i=1

∂g(X_i; ˆθ)

∂θ^′ ]′

Sˆ⁻¹S¹² (85)

とおくと、

√1_n

n

∑

i=1

g(X_i; ˆθ) = S¹²_{(I − ˆ}M ) [

S⁻¹²_√¹ n

n

∑

i=1

g(X_i; θ₀) ]

(86)

なので

J = [ 1

√n

n

∑

i=1

g(Xi; ˆθ) ]′

Sˆ⁻¹ [ 1

√n

n

∑

i=1

g(Xi; ˆθ) ]

= [

S⁻¹²_√¹ n

n

∑

i=1

g(X_i; θ₀) ]′

(I − ˆ^M^′^)S¹²^S^ˆ⁻¹^S¹²(I − ˆ^{M )}

× [

S⁻¹²_√¹ n

n

∑

i=1

g(X_i; θ₀) ]

(87)

となる。帰無仮説が正しい時、仮定A9’より

S⁻¹²_√¹ n

n

∑

i=1

g(X_i; θ₀_{) →}_dN (0, I), (88)

(22)、(23)、定理3の仮定A12より M →ˆ p^{M = S}⁻

1

2_G(G^′_S⁻¹_G)⁻¹_G^′_S⁻ 1

2 ₍₈₉₎

である。また、_{I − M} はべき等行列であるから、P = S⁻¹²Gとおくと rank(I − M) = rank[I − P (P^′^{P )}⁻¹^P^′^]

= tr[I − P (P^′^{P )}⁻¹^P^′^]

= p − k ⁽⁹⁰⁾

である。(87)、(88)、(89)、(90)より

J →d^χ²_p−k ⁽⁹¹⁾

であることがわかる。

対立仮説が正しいとき、E[g(X_i; θ₀)] = δ ̸= 0^であり、

S⁻¹²_√¹ n

n

∑

i=1

g(Xi; θ0) =^√nS⁻¹²δ + S⁻¹²_√¹ n

n

∑

i=1

[g(Xi; θ0_{) − δ]} (92)

と書ける。A9’より、右辺第２項は標準正規分布に収束するが、第１項は_∞か_−∞に発散する。また、

θ →ˆ ^p^θ¹ ^{= arg min}

θ ^E[g(Xⁱ^{; θ)]}

′S⁻¹E[g(Xi; θ)] (93)

(12)

であるため、(若干の追加的仮定の下で) ˆMはM でない別の行列M1に確率収束する。従って、Jのうち、オーダーの大きい部分を取り出すと

J ≈ nδ^′^S⁻¹²(I − M1^)S⁻

1

2_δ ₍₉₄₎

である。_{I −M}1はべき等行列なので正値定符号ではないが（半正値定符号である）、δ^′(S⁻¹₋ S⁻¹²M₁S⁻¹²_{)δ ̸= 0}ならばJは_∞に発散する。（証明終）

補足

• 証明からわかるように、もしも偶然にδ^′(S⁻¹_{− S}⁻¹²M₁S⁻¹²)δ = 0であれば、帰無仮説が間違っていても、_{J →}_dχ²_p−kとなってしまい、J検定は検出力がないことになってしまう。ただし、一般にはそうなっている可能性は低いと考えられており、この点は通常の実用上では考慮されていない。この問題は、Newey (1985)によって指摘された。

• ^{パラメータの個数（}^k^{）と操作変数の個数（}^p）が同じ場合は、目的関数がゼロになるためJ検定は機能しない。

• k < pなら、操作変数に一つでもモーメント条件を満たさないものがある場合にはJ 検定で帰無仮説は棄却される。しかし、どのモーメント条件が間違っているか、あるいはいくつ間違っているかはわからない。

• J検定統計量のうち、線形な操作変数推定で分散均一を仮定したものをSargan検定統計量と呼ぶ。具体的には、

n [1

n

∑

i=1

Z_i(y_t_{− X}_i^′β)^ˆ ]′(

ˆ σ²¹

n

∑

i=1

Z_i^′Z_i )−1[

1 n

n

∑

i=1

Z_i(y_i_{− X}_i^′β)^ˆ ]

(95)

ただし、β^ˆは2段階最小２乗推定量、σˆ²=^∑ⁿ_i=1(y_i_{− X}_i^′β)^ˆ ²/nとしたものである。

References

[1] T. Amemiya. Advanced Econometrics. Harvard University Press, Cambridge, Massachusetts, 1985.

[2] L. P. Hansen. Large sample properties of generalized method of moments estimators. Econo- metrica, 50(4):1029–1053, 1982.

[3] L. P. Hansen, J. Heaton, and A. Yaron. Finite-sample properties of some alternative GMM estimators. Journal of Business and Economic Statistics, 14(3):262–280, 1996.

[4] F. Hayashi. Econometrics. Princeton University Press, 2000.

[5] W. K. Newey. Generalized method of moments specification testing. Journal of Econometrics, 29:229–256, 1985.

[6] W. K. Newey and R. Smith. Higher order properties of GMM and generalized empirical likelihood estimators. Econometrica, 72(1):219–255, 2004.