平成25年度 ミクロ計量経済学 講義ノート7: 分散の分解
このノートでは、二つのグループ間での分散の差を、観測される共変量の分布の差と、 それ以外の本質的な差に、分解する方法の解説を行う。例えば、所得の不平等度を分散で計 測し、異なる時代での不平等度に差がある場合に、その原因が年齢構成や産業構造の違いと いった観測できるものの差で説明できるのか、それとも同じ(観測できる)属性をもった個 人の中でも不平等度が変化しているのか、という分析に使用される。このノートでは、分 散の分解の理論的背景、推定法、限界を議論する。結論をまとめると、OB分解法の応用と して分散の分解は可能であるが、分散の簡便で説得力のあるモデルを見つけるのが難しく、 detailed decompositionを分散に適用するのは容易ではない、となる。このノートの議論は、 Fortin, Lemieux and Firpo (2011)によっている。
7.1 分散分解の理論
この節では、分散分解法をOB分解法の拡張として理論的な背景を解説する。つまり、政策 評価法の枠組みを使用して分散分解法の基礎付けを行う。このノートでは、V(·)として、分 散を表記する。
設定は、OB分解法の場合と同じである。つまり、ある個人iがいて、この個人は潜在 的にYAiとYBiの両方の結果を持ち、その個人がグループAに入れば、YAiを観測でき、グ ループBに入れば、YBiを観測するという設定である。
しかし、OB分解の場合は平均の差が興味の対象であったが、今回は、分散の差である V(YB|B) − V (YA|A)をいかにして分解するかという問題を考える。この分散の差を、
∆VO= V (YB|B) − V (YA|A) (1) と表記する。
分散分解は、観測される分散の差を、
∆VO= ∆VS + ∆VX (2)
ただし、
∆VS = V (YB|B) − V (YA|B) (3) かつ
∆VX = V (YA|B) − V (YA|A) (4) と分解する。∆VS は説明できない分散の差であり、∆VX が説明できる分散の差である。この 分解においては、V(YA|B)は追加的な仮定なしには識別できない。そのため、追加的な仮 定なしには、分散の分解は不可能である。
V(YA|B)を識別するために、無視可能性の仮定を使用する。まず、無視可能性の仮定 とは、
(YA, YB)⊥g|X (5)
であった。識別したい数量であるV(YA|B)は
V(YA|B) = E((YA− E(YA|B))2|B) (6)
= E(YA2|B) − (E(YA|B))2 (7)
= E(E(YA2|X, B)|B) − (E(E(YA|X, B)B))2 (8)
1
である。ここで、無視可能性の仮定により、
E(YA2|X, B) = E(YA2|X, A) (9)
である。同様に
E(YA|X, B) = E(YA|X, A) (10)
となる。となる。最後に出てきたE(YA2|X, A)とE(YA|X, A)はデータから観測できる。従っ て、無視可能性の仮定の下で、V(YA|B)は識別でき、分散分解も可能になる。
分散分解はnonparametricに実行可能である。分解の要素のうち、V(YB|B)とV(YA|A) は、それぞれ、YAiとYBiの標本分散で推定すればよい。V(YA|B)については、E(YA2|X) とE(YA|X)はAグループの観測値のみを使用し、nonparametricに推定すること推定でき る。E(YA2|X)の推定値をaˆA(X)とし、E(YA|X)の推定値をˆbA(X)とすると、V(YA|B)は
Vˆ(YA|B) = 1 nB
nB
∑
i=1
ˆ
aA(XBi) − ( 1
nB nB
∑
i=1
ˆbA(XBi) )2
(11)
として推定できる。しかし、ノンパラメトリックに高い精度の推定を行うことは難しく、少 ない母数で記述できるモデルを仮定して通常は推定を行う。
7.2 線形モデルでの分解
分散分解を簡便に行うために、条件付き期待値と条件付き分散にモデルを当てはめること を考える。つまり、E(YA|X)やV(YA|X)にモデルを仮定し、そのモデルを推定すること で、分散分解を行う。なお前節では、E(YA2|X)の推定を考えたが、ここでは、条件付き分 散V(YA|X) = E((YA− E(YA|X))2|X)のモデル化を行う。直接にE(YA2|X)をモデル化し ない理由は、これの適切なモデルを提示するのが難しいからである。少なくとも条件付き期 待値や分散と比べて難しいと考えれている。
まず、一般に分散には次のような条件付き分散による分解が可能である。
V(Y ) = E((Y − E(Y ))2) (12)
= E((Y − E(Y |X) + E(Y |X) − E(Y ))2) (13)
= E((Y − E(Y |X))2) + E((E(Y |X) − E(Y ))2) (14)
= E(V (Y |X)) + V (E(Y |X)) (15)
この公式と、条件付き期待値と条件付き分散のモデル化とを組み合わせて、分散分解を行う。 まず、E(YA|X)とE(YB|X)には、線形モデルを仮定する。つまり、
E(YA|X) = X′βAかつ E(YB|X) = X′βA (16) とする。無視可能性の仮定があるために、E(YA|X)はグループAの観測値のみを用いた線 形回帰で、E(YB|X)はグループBの観測値のみを用いた線形回帰で、それぞれ推定できる。 線形モデルの仮定のもとでは、
V(E(YA|X)|A) = βA′ V(X|A)βA (17) となる。V(E(YB|X)|A)も同様である。
従って、分散分解は、
∆VS = E(V (YB|X)|B) − E(V (YA|X)|B) + (βB− βA)′V(X|B)(βB+ βA) (18)
2
かつ
∆VX = E(V (YA|X)|B) − E(V (YA|X)|A) + βA′ (V (X|B) − V (X|A))βA (19) とかける。
次に、条件付き分散のモデル化を考えるが、これは一般に受け入れられているモデルが ないため、自明ではない。一つのやり方は、Xの値によって、母集団をわけ、その各グルー プ内では分散は一定とする方法である。この方法は、計算上は標本分散をXのグループ分 けの分だけ計算すればよいだけであるので、簡単である。
もう一つの条件付き分散の推定は、モデル化をし、そのモデルの母数を推定するとい うものである。ここでは、簡便な線形モデルを考える。つまり、V(YA|X) = X′δAかつ V(YB|X) = X′δBとするものである。このときは、分散分解は、
∆VS = E(X|B)′(δB− δA) + (βB− βA)′V(X|B)(βB− βA) (20) かつ
∆VX = (E(X|B) − E(X|A))′δA+ βA′ (V (X|B) − V (X|A))βA (21) とかける。
条件付き分散をモデル化した場合の分散モデルの母数の推定は、次のような2段階推定 で行う。まず、条件付き期待値のモデルを推定し、残差を得る。ここでは線形モデルを考え ているので、
ˆ
vAi = YAi− XAi′ βˆA (22)
としてAグループの残差は計算でき、Bグループの残差も同様に計算できる。次にvˆAi2 を XAiに回帰することで、δAの推定値を得られる。δBも同様に推定できる。
7.3 分散分解の限界
ここまで見てきたように、OB分解法の拡張として分散分解は可能であるが、分散分解には 次に述べるように主に二つの問題点がある。
• 条件付き分散のモデル化をしないと、簡便に推定できないが、条件付き分散の適切な モデルについて、学界内での意見の一致がない。ここでは、線形モデルを考えたが、 線形モデルは、分散が負になることもあるので、分散のモデルとしてはあまり適切で はないという説得力のある意見がある。分散が決して負にはならないようなモデルも 存在するが、どのモデルがよいかという意見の一致はない。
なお、条件付き期待値の場合は、線形モデルを使用することはそれほど大きな抵抗は ない。また、賃金の場合には、ミンサー方程式を使用することが一般的であり、よく 当てはまることが知られている。
• 分散分解ではdetailed decompositionの実行に問題が残る。ここでは、最も簡便なモ デルであろうと思われる線形モデルを期待値にも分散にも用いたが、その場合でも、 detailed decompositionは容易ではない。なぜなら、二つの説明変数の交叉項が分解 に含まれているので、一方の変数の効果を判定することが、難しいからである。
References
[1] N. Fortin, T. Lemiuex, and S. Firpo. Decomposition methods in economics. In O. Ashenfelter and D. Card, editors, Handbook of Labor Economics, volume 4a, chapter 1, pages 1–102. Elsevier B.V., 2011.
3