平成28年度 上級計量経済学 講義ノート4: GMM推定量
このノートでは、一般化モーメント法(generalized method of moments, GMM)の解 説を行う。経済モデルによって導かれるモーメント条件を用いて用いて推定を行う方法が、 GMMである。Hansen (1982)によって提案され、名前の通りモーメント法を拡張したもの である。OLS推定量やIV推定量などもGMMの特殊例として考える事ができ、また他にも 使用できる場合が多く、経済分析で頻繁に使用されている。
4.1 モーメント法:復習
モーメント法とは、母集団モーメントと標本モーメントが等しくなるようにパラメータの値 を決める推定法である。ある既知のk次元ベクトル値関数g(·, ·)に対して確率変数Xとk 次元未知パラメータθ0がモーメント条件
E[g(X; θ0)] = 0 (1)
を満たしているとする。標本{X1, · · · , Xn}が得られたとき、θ0のモーメント法推定量θˆは 1
n
n
∑
i=1
g(Xi; ˆθ) = 0 (2)
により定義される。 例: IV推定量
yi= Xi′β + ϵi (3)
において、モーメント条件
E(Ziϵi) = 0 (4)
が成立している時、(3)、(4)からϵiを消去して
E[Zi(yi− Xi′β)] = 0 (5)
これに対応する標本モーメントと母集団モーメントが等しいとおいて得られる推定量、 1
n
n
∑
i=1
[Zi(yi− Xi′β)] = 0ˆ (6)
を考えると、
β = ˆˆ βIV = ( n
∑
i=1
ZiXi′ )−1 n
∑
i=1
Ziyi= (Z′X)−1Z′Y (7)
となる。
4.2 GMM推定量
モーメント法は原則としてパラメータの数(= k)と同数のモーメント条件を用意して推定を 行う。パラメータの数より多くのモーメント条件(= p > k)がモデルから得られることもあ る。g(·; ·)をp次元の既知のベクトル関数として、
E[g(X; θ0)] = 0 (8)
というモーメント条件が与えられるとき、(2)と同様に 1
n
n
∑
i=1
g(Xi; ˆθ) = 0 (9)
を満たす推定量が考えられる。しかし、この方程式はk個の未知パラメータに対してp(> k) 本の方程式があるため、一般には解は存在しない。そこで、できるだけ全てのモーメント条 件を満たすように、W をp × pの正値定符号であるウェイト行列として
θˆGM M = arg min
θ Q(θ), Q(θ) =
[1 n
n
∑
i=1
g(Xi; θ) ]′
W [1
n
n
∑
i=1
g(Xi; θ) ]
(10)
によって定める推定量をGMM推定量という。
4.2.1 一般的な操作変数推定・・・単一方程式の場合
既知のスカラー関数m(·, ·; ·)に対して、経済変数yi, Xi が
m(yi, Xi; θ) = ϵi (11)
という関係にあるとする。θはk次元の未知パラメータである。例えば、m(yi, Xi; β) = yi− Xi′βなら、操作変数法で考えたモデルと同じになる。IV法と同様にE(Ziϵi) = 0を満 たす操作変数Zがあるが、Zの次元がp(> k)であるとする。そのとき、モーメント条件と してp本の方程式
E(Ziϵi) = 0 (12)
があり、対応する標本モーメントの条件は 1
n
n
∑
i=1
Zim(yi, Xi; θ) = 0 (13)
となる。p本すべての式を満たすθは一般に存在しないので、
θˆGM M = arg min
θ
[1 n
n
∑
i=1
Zim(yi, Xi; θ) ]′
Wˆ [1
n
n
∑
i=1
Zim(yi, Xi; θ) ]
(14)
によって推定量を定義することが考えられる。Wˆ は任意の正値定符号なp × p行列でよい が、うまく選択することによって効率性を上げることができる。なお、Wˆ はデータに依存 してもよく、その意味でハットがつけられている。
講義ノート2で取り上げた2SLS推定量はGMM推定量の一種である。2SLSの場合は、モ デルは、m(yi, Xi; θ) = yi−Xi′θであり、GMM推定の際の重み付け行列はW =ˆ ∑ni=1ZiZi′/n である。
4.3 GMM推定量の漸近的性質
この節では、GMM推定量と一致性と漸近正規性の証明と、そのために必要な仮定の解説を する。
4.3.1 一致性
一致性の証明のために以下の仮定をおく。まずは、パラメータ空間がコンパクトである場合 を考える。{Xi}ni=1はi.i.d.であるとする。
A1: E[g(Xi; θ0)] = 0
A2: θ0 ∈ Θ、ΘはRpのコンパクト集合である。
A3: g(Xi; θ)は任意のXiに対してθに関して連続である。 A4: (識別条件)θ ̸= θ0ならE[g(Xi; θ)] ̸= 0 である。
A5: (押さえ込み(dominance)条件) E[supθ∈Θ||g(Xi; θ)||] < ∞ A6: ˆW →p W、W は対称な正値定符号行列
定理 1. (Proposition 7.7, Hayashi (2000, p467), の特殊例)仮定A1-A6の下で、
θˆGM M →p θ0 (15)
パラメータ空間のコンパクト性の仮定A2が成立しない場合は、目的関数が凸(ここでは 最小化問題を考えているため)であれば、一致性の証明は可能である。そのためにA2, A3, A5を以下で置き換える。
A2’: θ0 ∈ Θ、ΘはRpのコンパクト集合ではない。θ0はΘの内点である。 A3’: Qn(θ)は任意のデータ{X1, · · · , Xn}に対してθについて凸である。 A5’: ||E[g(Xi; θ)]|| < ∞, ∀θ ∈ Θ
定理 2. 仮定A1, A2’,A3’,A4, A5’, A6の下で、
θˆGM M →p θ0 (16)
定理1と2も、極値推定量の理論に当てはめることによって証明できる。
4.3.2 漸近正規性
漸近正規性のために、定理1または2の仮定に加えて以下を仮定する。 A7: θ0はΘの内点である。
A8: g(X; θ)は任意のXにおいてθについて連続微分可能である。 A9: ∑ni=1g(Xi; θ0)/√n →dN (0, S)、Sは正値定符号行列である。 A10: θ0の近傍N (θ0)に対して
E [
sup
θ∈N (θ0)
∂g(Xi; θ)
∂θ′ ]
< ∞ (17)
A11: G = E[ ∂g(Xi; θ0)
∂θ′ ]
として、rank(G) = k A12: あるSˆが存在して、S →ˆ p Sとなる。
定理3 (GMM推定量の漸近正規性). 定理1または2の条件が成り立ち、さらに、A7-A11 が成立するとき、
1. √n(ˆθGM M− θ0) →dN (0, Ω)、ただしΩ = (G′W G)−1G′W SW G(G′W G)−1; 2. 更にA12を加えるとΩ = ( ˆˆ G′W ˆˆG)−1Gˆ′W ˆˆS ˆW ˆG( ˆG′W ˆˆG)−1 →p Ω、
ただし G = nˆ −1∑ni=1∂g(Xi; ˆθGM M)/(∂θ′)。
GMM推定量の漸近正規性の証明は、前節で紹介した極値推定量の議論をそのまま適用 しても可能である。しかし、GMM推定量の場合は、目的関数の2次微分を考えること無し に証明することもできる。ここで紹介するのは、2次微分を使わない証明法である。
(証明)
A8より、GMM推定の最小化問題の解は
2 [1
n
n
∑
i=1
∂g(Xi; ˆθGM M)
∂θ′
]′
Wˆ [1
n
n
∑
i=1
g(Xi; ˆθGM M) ]
= 0 (18)
を満たす。A8と平均値の定理より、 1
n
n
∑
i=1
g(Xi; ˆθGM M) = 1 n
n
∑
i=1
g(Xi; θ0) + 1 n
n
∑
i=1
∂g(Xi; ¯θ)
∂θ′ (ˆθGM M− θ0) (19) を満たすθ¯が存在し、あるλ ∈ [0, 1]に対してθ = λˆ¯ θGM M + (1 − λ)θ0と書ける。従って
√n(ˆθGM M − θ0)
= − {[1
n
n
∑
i=1
∂g(Xi; ˆθGM M)
∂θ′
]′
Wˆ [1
n
n
∑
i=1
∂g(Xi; ¯θ)
∂θ′
]}−1
× [1
n
n
∑
i=1
∂g(Xi; ˆθGM M)
∂θ′
]′
Wˆ [ 1
√n
n
∑
i=1
g(Xi; θ0) ]
(20)
前章の一様収束に関する補題においてパラメータ空間をN (θ0)の閉包に変更したものを考 えると、A7, A8, A10から、
sup
θ∈N (θ0)
1 n
n
∑
i=1
∂g(Xi; θ)
∂θ′ − E
[ ∂g(Xi; θ)
∂θ′ ]
→p0 (21)
となる。θˆGM Mの一致性よりθ →¯ pθ0、(21)、A8が成立しているため前章のAmemiya (1985) からの補題が適用できて、
1 n
n
∑
i=1
∂g(Xi; ˆθGM M)
∂θ′ →p E
[ ∂g(Xi; θ0)
∂θ′ ]
= G, (22)
1 n
n
∑
i=1
∂g(Xi; ¯θ)
∂θ′ →p E
[ ∂g(Xi; θ0)
∂θ′ ]
= G (23)
である。(20), (22), (23), ˆW →p W (A6),仮定A9から、
√n(ˆθGM M− θ0) →d N (0, (G′W G)−1G′W SW G(G′W G)−1) (24)
2.はW →ˆ p W , A12, (22)より明らか。(証明終) 補足
• ˆSとしては、例えば、 S =ˆ 1
n
n
∑
i=1
g(Xi; ˆθGM M)g(Xi; ˆθGM M)′ (25)
が考えられる。
4.4 効率的な GMM 推定
W = S−1のとき、GMM推定量の漸近分散Ωは最小になる。つまり、任意の対称な正値定 符号行列W に対して、
(G′W G)−1G′W SW G(G′W G)−1 ≥ (G′S−1G)−1 (26) が成立する。従って、ウェイト行列をW = S−1とおいて推定を行うのが良いが、実際には Sは未知なので、実行不可能である。
実行可能で効率的なGMM推定として、以下の二つの手法が提案されている。 1. 2段階GMM
1段階目にW = IとしてGMM推定を行い、θˆGM M(1) を得る。それを用いてSˆを得る。 2段階目にSˆ−1をウェイト行列に使ってθˆGM M(2) を得る。これは、漸近分散(G′S−1G)−1 を達成する効率的なGMM推定量である。
2. Continuous updating GMM
θが未知であるためにSの推定ができないわけであるが、θを未知のままSの「推定 量」を構成することは可能である。たとえば、
S(θ) =ˆ 1 n
n
∑
i=1
g(Xi; θ)g(Xi; θ)′ (27)
とすればよい。Contiunous updating estimator (CUE)は、これを用いて、
θˆCU E = arg min
θ
[ 1
√n
n
∑
i=1
g(Xi; θ) ]′
S(θ)ˆ −1 [ 1
√n
n
∑
i=1
g(Xi; θ) ]
(28)
によって定義されるもので、漸近分散(G′S−1G)−1を達成する効率的なGMMである。 系1 (2段階GMM推定量の漸近正規性). 定理3の条件を仮定する。ただし、Wˆ にはSˆ−1 を用いて、上のいずれかの方法による効率的GMM推定を考えるものとする。そのとき、
(a) √n(ˆθGM M− θ0) →dN (0, Ω)、ただしΩ = (G′S−1G)−1 (b) ˆΩ = ( ˆG′Sˆ−1G)ˆ −1→p Ω
CUEも同様の結果が成り立つが、その証明はこの授業では取り扱わない。
一般に、2段階GMM推定量の方が計算が簡単であるが、バイアスが大きいことが知 られている(Hansen, Heaton and Yaron (1996)、Newey and Smith (2004))。
4.5 GMM推定を元にした係数に関する検定
この節ではパラメータに関する仮説が正しいか否かの検定法を説明する。ML法の枠組みで は、ワルド検定、ラグランジュ乗数検定、尤度比検定という3つの同等な大標本検定法があ るが、GMMの枠組みでも原理的にそれらと同様にして検定法を構成できる。ここでは、こ れら3つの方法を紹介する。詳しい議論は、Hayashi (2000, Section 7.4, p.487-497)を参照 のこと。
a(θ)をr(≤ k)次元の連続微分可能なベクトル値関数とし、以下の検定を考える。
H0 : a(θ0) = 0 (29)
H1 : a(θ0) ̸= 0 (30)
また、A(θ) = ∂a(θ)/∂θ′、A0 = A(θ0)とする。
4.5.1 ワルド検定
もし帰無仮説が正しければ、H0の制約なし推定量θˆは制約をほぼ満たすはずである。そこ で、ワルド検定ではa(ˆθ) ≈ 0かどうかを調べる。検定統計量は以下で定義される。SˆをS の一致推定量として、
TW = na(ˆθ)′[A(ˆθ)( ˆG′Sˆ−1G)ˆ −1A(ˆθ)′]−1a(ˆθ) (31) この統計量の構成は、k次元正規確率変数ベクトルuでその分散行列V (u)の逆行列をはさ む2次形式u′[V (u)]−1uを作ると、それは自由度kのカイ二乗分布に従うという性質を用い たものである。
定理 4. ワルド検定
(i) 定理3の仮定が成立する。
(ii) a(θ)はr(< k)次元の連続微分可能なベクトル値関数とする。 (iii) A0は行フルランクである。
(i)-(iii)の仮定が成立するとき、H0のもとで、
TW →d χ2r (32)
となり、H1のもとで、 TW
n →p a(θ0)
′[A0(G′S−1G)−1A′0]−1a(θ0) = 定数(> 0) (33) である。
証明は、通常のF検定や尤度法におけるワルド検定と同じであるので省略する。1 補足
1参考までに証明を記載しておく。a(θ)は連続微分可能なので、平均値の定理から
√n[a(ˆθ) − a(θ0)] = A(¯θ)√n(ˆθ − θ0) (34) かつ
A(¯θ) →pA(θ0) (35)
である。従って、 √
n[a(ˆθ) − a(θ0)] →dN(0, A0(G′S−1G)−1A′0) (36) (22)よりG →ˆ pG、A13よりS →ˆ pS、(ii)よりA(ˆθ) →pA0なので、
A(ˆθ)( ˆG′Sˆ−1G)ˆ −1A(ˆθ)′→pA(θ0)(G′S−1G)−1A(θ0)′ (37) (36)、(37)より
n[a(ˆθ) − a(θ0)]′[A(ˆθ)( ˆG′Sˆ−1G)ˆ −1A(ˆθ)′]−1[a(ˆθ) − a(θ0)] →dχ2r (38) である。(38),(37)は帰無仮説、対立仮説のどちらが正しい場合にも成立する。帰無仮説a(θ0) = 0が正しい場 合、(38)の左辺でa(θ0) = 0とおくとTW に一致することから、H0の下では、
TW →dχ2r (39)
が示される。次にH1の下でのTW の性質を調べる。a′V a, b′V bが計算できるような任意のa, b, V に対して a′V a= (a − b)′V(a − b) + (a − b)′V b+ b′V(a − b) + b′V bが成立するので、
TW
n = [a(ˆθ) − a(θ0)]
′[A(ˆθ)( ˆG′Sˆ−1G)ˆ −1A(ˆθ)′]−1[a(ˆθ) − a(θ
0)] (40)
+ [a(ˆθ) − a(θ0)]′[A(ˆθ)( ˆG′Sˆ−1G)ˆ −1A(ˆθ)′]−1a(θ0) (41) + a(θ0)′[A(ˆθ)( ˆG′Sˆ−1G)ˆ −1A(ˆθ)′]−1[a(ˆθ) − a(θ0)] (42) + a(θ0)′[A(ˆθ)( ˆG′Sˆ−1G)ˆ −1A(ˆθ)′]−1a(θ0) (43)
• H1の下ではTW/nがある正の定数に確率収束するので、「TW は発散する」と解釈で きる。実際、H1が正しい時、nが大きくなるとH0が棄却される確率が1に近づく。 それを、TW →p ∞と書くこともあるが、それは任意の(大きい)C > 0、(小さい) ϵ > 0に対して、あるn0が存在して、すべてのn > n0について
P (TW < C) < ϵ (45)
が成立する、ということを意味する。
• (iii)は重複した制約が含まれないことを保証している。また、(iii)が成立しないなら 逆行列が計算できないという問題が生じる。
4.5.2 ラグランジュ乗数(LM)検定
ラグランジュ乗数(LM )検定では帰無仮説を制約として推定を行ったときに、その制約が効 いているかどうかを調べる。LMでは制約付きのGMM推定量θ˜GM Mが必要になる。それ は以下の解として定義される。
minθ∈Θ
[1 n
n
∑
i=1
g(Xi; θ) ]′
S˜−1 [1
n
n
∑
i=1
g(Xi; θ) ]
s.t. 2a(θ) = 0 (46)
すなわちΘ1 = Θ ∩ [θ : a(θ) = 0]として
θ = arg min˜
θ∈Θ1
[1 n
n
∑
i=1
g(Xi; θ) ]′
S˜−1 [1
n
n
∑
i=1
g(Xi; θ) ]
(47)
なお、制約なしの推定量は前節までと同じくθˆGM M とする。以下、表現を簡潔にするため にθˆGM M, ˜θGM Mをθ, ˜ˆ θと書くことにする。θˆは常に一致推定量であるが、θ˜は帰無仮説(制 約a(θ0) = 0)が正しいときのみ一致性をもつ。つまり、
θ1= arg min
θ∈Θ1
E[g(Xi; θ)]′S−1E[g(Xi; θ)] (48)
として、帰無仮説が正しいときはθ1 = θ0、対立仮説が正しい時はθ1 ̸= θ0であるから θ →ˆ pθ0 (H0とH1の両方の下で)、 (49) また、
θ →˜ p θ0 (H0のもとで) (50)
→p θ1(̸= θ0) (H1のもとで) (51) となる。
この検定は、制約付き最大化問題において、制約が有効(binding)でなければラグラン ジュ乗数が0になり、有効であればラグランジュ乗数が0でないという性質を用いた検定で
と書ける。対立仮説が正しい場合、右辺第1、2、3項はa(θ)の連続性、θ →ˆ pθ0、(37)から0に確率収束す る。また、(37)から第4項はa(θ0)′[A0(G′S−1G)−1A′0]−1a(θ0)に収束する。従って、対立仮説が正しい時には
TW
n →pa(θ0)
′[A
0(G′S−1G)−1A′0]−1a(θ0)(> 0) (44) となる。
ある。制約の下でのSの推定量をS˜、ラグランジュ乗数をνとして、(46)の解は以下の一階 の条件を満たす。
[1 n
n
∑
i=1
∂g(Xi; ˜θ)
∂θ′ ]′
S˜−1 [ 1
√n
n
∑
i=1
g(Xi; ˜θ) ]
+√nA(˜θ)′ν = 0˜ (52)
√na(˜θ) = 0 (53)
ラグランジュ乗数検定統計量は
TLM = n˜ν′[A(˜θ)( ˜G′S˜−1G)˜ −1A(˜θ)′]˜ν (54) である。ただしG = n˜ −1∑ni=1∂g(Xi; ˜θ)/(∂θ′)である。
定理 5. ラグランジュ乗数検定 以下の仮定を導入する。
(i) 定理3の仮定がA12を除いて成立する。
(ii) a(θ)はr(≤ k)次元の連続微分可能なベクトル値関数とする。
(iii) A0は行フルランクである。 (iv) 帰無仮説のもとでS →˜ p S
(v) 対立仮説のもとでS →˜ p S1で、S1は正値定符号行列である。
(vi) A1= A(θ1)は行フルランク、G1 = E[∂g(Xi; θ1)(∂θ′)]は列フルランクである。ただ し、θ1は(48)である。
仮定(i)-(iv)の下で、H0が正しいなら、
TLM →dχ2r (55)
が、仮定(i)、(ii)、(v)、(vi)の下で、H1の場合には、
TLM
n →p γ
′[A1(G′1S1−1G1)−1A′1]−1γ =定数(> 0) (56) が成り立つ。
証明は授業では省略する。2
(※) 仮定(vi)の「A1= A(θ1)は行フルランク」は、対立仮説のもとでの収束の形で 定理を記述するために必要であるが、実際には成立していなくても検定上は困らない。むし ろ、発散が早くなると考えられ、望ましいであろう。
2興味のある学生の為に、ここに証明を記載しておく。 平均値の定理より
√1 n
n
∑
i=1
g(Xi; ˜θ) = √1 n
n
∑
i=1
g(Xi; θ1) + 1 n
n
∑
i=1
∂g(Xi; ¯θ1)
∂θ′
√n(˜θ − θ1) (57)
√na(˜θ) = A(¯θ2)√n(˜θ − θ1) (58) を満たすθ¯1= λ1θ˜+ (1 − λ1)θ1、θ¯2= λ2θ˜+ (1 − λ2)θ1が存在する。(52)、(53)に(57)、(58)を代入すると
Ψ =˜ [1
n
n
∑
i=1
∂g(Xi; ˜θ)
∂θ′ ]′
S˜−1 [1
n
n
∑
i=1
∂g(Xi; ¯θ1)
∂θ′ ]
(59) として
Ψ˜√n(˜θ − θ1) +√nA(˜θ)′ν˜ = − [1
n
n
∑
i=1
∂g(Xi; ˜θ)
∂θ′ ]′
S˜−1√1 n
n
∑
i=1
g(Xi; θ1) (60)
A(¯θ2)√n(˜θ − θ1) = 0 (61)
4.5.3 尤度比(LR)検定
ここで考える枠組みは最尤法ではないので、厳密には尤度比検定という言葉は適切ではない かもしれないが、最尤法の枠組みにおける尤度比検定と全く同等の考え方から統計量が導か れるため、そのように呼ぶことにする。尤度比検定(LR)では制約つき推定値と制約なし推 定値で目的関数が達成する最大値に違いがあるかどうかを調べる。検定統計量は
TLR= −2n[Qn(ˆθ) − Qn(˜θ)] (73) であり、適当な条件のもとで、
TLR
{→dχ2r (H0のとき)
→p ∞ (H1のとき) (74)
が示される。
を得る。これを行列表記すると
( ˜
Ψ A(˜θ)′ A(¯θ2) 0
) ( √
n(˜θ − θ1)
√n˜ ν
)
= (
−[1n
∑n i=1
∂g(Xi; ˜θ)
∂θ′ ]′S˜−1 1√n∑ni=1g(Xi; θ1) 0
)
(62) 分割行列の逆行列の公式(Hayashi (2000), p.673)を使うと、
√n˜ν= −[A(¯θ2) ˜Ψ−1A(˜θ)′]−1A(¯θ2) ˜Ψ−1 [1
n
n
∑
i=1
∂g(Xi; ˜θ)
∂θ′ ]′
S˜−1√1 n
n
∑
i=1
g(Xi; θ1) (63)
帰無仮説が正しい時、θ1= θ0で、θ,¯˜θ1, ¯θ2はすべてθ0に確率収束するので、仮定の下で講義ノート3の補題3 が適用できて
G →˜ pG, ˜Ψ →pG′S−1G, (64)
また、仮定(ii)より
A(¯θ2) →pA(θ0) (65)
である。一方、(64),仮定(iv),仮定A9から [1
n
n
∑
i=1
∂g(Xi; ˜θ)
∂θ′ ]′
S˜−1√1 n
n
∑
i=1
g(Xi; θ0) →dN(0, G′S−1G) (66)
である。(63), (64), (65), (66)より
√n˜ν →dN(0, (A(θ0)G′S−1GA(θ0)′)−1) (67) が成り立ち、仮定(ii)とθ →˜ pθ0よりA(˜θ) →pA(θ0)、(64)が成り立つ。これらと仮定(iv)より、H0の下で
TLM →dχ2r (68)
が示される。
対立仮説のもとでは、(63)を
√n˜
ν (69)
= −√n[A(¯θ2) ˜Ψ−1A(˜θ)′]−1A(¯θ2) ˜Ψ−1 [1
n
n
∑
i=1
∂g(Xi; ˜θ)
∂θ′ ]′
S˜−11 n
n
∑
i=1
g(Xi; θ1) (70)
として考える。右辺を√nで割ったものは
γ= −[A1(G′1S1−1G)−11 A′1]−1A1(G′1S−11 G1)−1G1′S1−1E[g(Xi; θ1)] (71) に収束する。定理の仮定よりE[g(Xi; θ1)] ̸= 0なので、(v), (vi)よりγ ̸= 0。以上から、対立仮説のもとでの ワルド検定の収束の証明と同様にして、H1の下では、
TLM
n →pγ
′[A
1(G′1S1−1G1)−1A′1]γ =定数(> 0) (72)
(証明終)
4.6 J検定(過剰識別の検定)
GMM推定に用いるモーメント条件が正しいかどうかを確かめる検定法を扱う。それはJ検 定と呼ばれ、過剰識別性(over-identification)の検定ともいう。前節で示した効率的なGMM 推定量を用いるものとする。非効率なGMM推定量を下に検定を考える事もできるが、そ の場合は検定統計量の帰無仮説の下での漸近分布を求めることが難しくなる。
通常、GMM推定に用いられるモーメント条件の個数(p)は、パラメータの次元(k)よ りも多い。もしp = kなら、丁度識別であり、目的関数の最小値は0になる。しかし、p > k のときは、用いるモーメント条件が正しければ目的関数の最小値0に近い値になるはずであ る。これを用いて検定を行うのがJ検定である。なお、もしもモーメント条件の中に間違っ た制約が含まれていると、推定結果は一致性を持たない。検定の帰無仮説と対立仮説は
H0: E[g(Xi; θ)] = 0, ∃θ (75) H1: E[g(Xi; θ)] ̸= 0, ∀θ (76) である。検定統計量を
J = nQn(ˆθ) (77)
とすると、以下の結果が成り立つ。
定理 6 (J 検定). 系1と同じ条件を仮定する。ただし、定理3のA9を A9’: ∑ni=1{g(Xi; θ) − E[g(Xi; θ)]}/√n →dN (0, S)
で置き換えるものとする。M1を証明中で定義する、ある定数行列として、
J
{→dχ2p−k (H0のとき)
→p ∞ (H1のとき、ただし、δ′(S−1− S−12M1S−12)δ ̸= 0である場合のみ) (78) となる。なお、δはθ1 = arg minθE[g(Xi; θ)]′S−1E[g(Xi; θ)]として、E[g(Xi; θ)] = δと定 義される。δはp次元ベクトルであるが、対立仮説はそのp個の要素のうち、ひとつでもゼ ロでないものがあるという仮説である。
(証明)平均値の定理より
√1 n
n
∑
i=1
g(Xi; ˆθ) = √1 n
n
∑
i=1
g(Xi; θ0) + 1 n
n
∑
i=1
∂g(Xi; ¯θ)
∂θ′
√n(ˆθ − θ0) (79)
で、θ →¯ p θ0である。(20)を代入すると、ウェイト行列にSˆ−1を用いることに注意して、
√1 n
n
∑
i=1
g(Xi; ˆθ) = S12 [
S−12√1 n
n
∑
i=1
g(Xi; θ0) ]
(80)
− n1
n
∑
i=1
∂g(Xi; ¯θ)
∂θ′ (81)
× {[1
n
n
∑
i=1
∂g(Xi; ˆθ)
∂θ′ ]′
Sˆ−1 [1
n
n
∑
i=1
∂g(Xi; ¯θ)
∂θ′
]}−1
(82)
× [1
n
n
∑
i=1
∂g(Xi; ˆθ)
∂θ′ ]′
Sˆ−1S12 [
S−12√1 n
n
∑
i=1
g(Xi; θ0) ]
(83)
ここで、
Mˆ = S−1/2 [1
n
n
∑
i=1
∂g(Xi; ¯θ)
∂θ′
] {[1 n
n
∑
i=1
∂g(Xi; ˆθ)
∂θ′ ]′
Sˆ−1 [1
n
n
∑
i=1
∂g(Xi; ¯θ)
∂θ′
]}−1
(84)
× [1
n
n
∑
i=1
∂g(Xi; ˆθ)
∂θ′ ]′
Sˆ−1S12 (85)
とおくと、
√1n
n
∑
i=1
g(Xi; ˆθ) = S12(I − ˆM ) [
S−12√1 n
n
∑
i=1
g(Xi; θ0) ]
(86)
なので
J = [ 1
√n
n
∑
i=1
g(Xi; ˆθ) ]′
Sˆ−1 [ 1
√n
n
∑
i=1
g(Xi; ˆθ) ]
= [
S−12√1 n
n
∑
i=1
g(Xi; θ0) ]′
(I − ˆM′)S12Sˆ−1S12(I − ˆM )
× [
S−12√1 n
n
∑
i=1
g(Xi; θ0) ]
(87)
となる。帰無仮説が正しい時、仮定A9’より
S−12√1 n
n
∑
i=1
g(Xi; θ0) →dN (0, I), (88)
(22)、(23)、定理3の仮定A12より M →ˆ pM = S−
1
2G(G′S−1G)−1G′S− 1
2 (89)
である。また、I − M はべき等行列であるから、P = S−12Gとおくと rank(I − M) = rank[I − P (P′P )−1P′]
= tr[I − P (P′P )−1P′]
= p − k (90)
である。(87)、(88)、(89)、(90)より
J →dχ2p−k (91)
であることがわかる。
対立仮説が正しいとき、E[g(Xi; θ0)] = δ ̸= 0であり、
S−12√1 n
n
∑
i=1
g(Xi; θ0) =√nS−12δ + S−12√1 n
n
∑
i=1
[g(Xi; θ0) − δ] (92)
と書ける。A9’より、右辺第2項は標準正規分布に収束するが、第1項は∞か−∞に発散 する。また、
θ →ˆ pθ1 = arg min
θ E[g(Xi; θ)]
′S−1E[g(Xi; θ)] (93)
であるため、(若干の追加的仮定の下で) ˆMはM でない別の行列M1に確率収束する。従っ て、Jのうち、オーダーの大きい部分を取り出すと
J ≈ nδ′S−12(I − M1)S−
1
2δ (94)
である。I −M1はべき等行列なので正値定符号ではないが(半正値定符号である)、δ′(S−1− S−12M1S−12)δ ̸= 0ならばJは∞に発散する。(証明終)
補足
• 証明からわかるように、もしも偶然にδ′(S−1− S−12M1S−12)δ = 0であれば、帰無仮 説が間違っていても、J →dχ2p−kとなってしまい、J検定は検出力がないことになっ てしまう。ただし、一般にはそうなっている可能性は低いと考えられており、この点 は通常の実用上では考慮されていない。この問題は、Newey (1985)によって指摘さ れた。
• パラメータの個数(k)と操作変数の個数(p)が同じ場合は、目的関数がゼロになる ためJ検定は機能しない。
• k < pなら、操作変数に一つでもモーメント条件を満たさないものがある場合にはJ 検定で帰無仮説は棄却される。しかし、どのモーメント条件が間違っているか、ある いはいくつ間違っているかはわからない。
• J検定統計量のうち、線形な操作変数推定で分散均一を仮定したものをSargan検定統 計量と呼ぶ。具体的には、
n [1
n
n
∑
i=1
Zi(yt− Xi′β)ˆ ]′(
ˆ σ21
n
n
∑
i=1
Zi′Zi )−1[
1 n
n
∑
i=1
Zi(yi− Xi′β)ˆ ]
(95)
ただし、βˆは2段階最小2乗推定量、σˆ2=∑ni=1(yi− Xi′β)ˆ 2/nとしたものである。
References
[1] T. Amemiya. Advanced Econometrics. Harvard University Press, Cambridge, Massachusetts, 1985.
[2] L. P. Hansen. Large sample properties of generalized method of moments estimators. Econo- metrica, 50(4):1029–1053, 1982.
[3] L. P. Hansen, J. Heaton, and A. Yaron. Finite-sample properties of some alternative GMM estimators. Journal of Business and Economic Statistics, 14(3):262–280, 1996.
[4] F. Hayashi. Econometrics. Princeton University Press, 2000.
[5] W. K. Newey. Generalized method of moments specification testing. Journal of Econometrics, 29:229–256, 1985.
[6] W. K. Newey and R. Smith. Higher order properties of GMM and generalized empirical likelihood estimators. Econometrica, 72(1):219–255, 2004.