分散の分解教育 OKUI, Ryo

(1)

平成²⁵年度ミクロ計量経済学講義ノート^7: 分散の分解

このノートでは、二つのグループ間での分散の差を、観測される共変量の分布の差と、それ以外の本質的な差に、分解する方法の解説を行う。例えば、所得の不平等度を分散で計測し、異なる時代での不平等度に差がある場合に、その原因が年齢構成や産業構造の違いといった観測できるものの差で説明できるのか、それとも同じ(観測できる)属性をもった個人の中でも不平等度が変化しているのか、という分析に使用される。このノートでは、分散の分解の理論的背景、推定法、限界を議論する。結論をまとめると、OB分解法の応用として分散の分解は可能であるが、分散の簡便で説得力のあるモデルを見つけるのが難しく、 detailed decompositionを分散に適用するのは容易ではない、となる。このノートの議論は、 Fortin, Lemieux and Firpo (2011)によっている。

7.1 _{分散分解の理論}

この節では、分散分解法をOB分解法の拡張として理論的な背景を解説する。つまり、政策評価法の枠組みを使用して分散分解法の基礎付けを行う。このノートでは、^V(·)として、分散を表記する。

設定は、OB分解法の場合と同じである。つまり、ある個人iがいて、この個人は潜在的に^Y^Aiと^Y^Biの両方の結果を持ち、その個人がグループAに入れば、^Y^Aiを観測でき、グループBに入れば、YBiを観測するという設定である。

しかし、OB分解の場合は平均の差が興味の対象であったが、今回は、分散の差である V(YB|B) − V (YA|A)をいかにして分解するかという問題を考える。この分散の差を、

∆^VO= V (YB|B) − V (YA|A) (1) と表記する。

分散分解は、観測される分散の差を、

∆^VO= ∆^VS + ∆^VX (2)

ただし、

∆^VS = V (YB|B) − V (YA|B) (3) かつ

∆^VX = V (YA|B) − V (YA|A) (4) と分解する。∆^V_S は説明できない分散の差であり、∆^V_X が説明できる分散の差である。この分解においては、V(YA|B)は追加的な仮定なしには識別できない。そのため、追加的な仮定なしには、分散の分解は不可能である。

V(YA|B)を識別するために、無視可能性の仮定を使用する。まず、無視可能性の仮定とは、

(YA, YB)⊥g|X (5)

であった。識別したい数量であるV(YA|B)は

V(YA|B) = E((YA− E(YA|B))²|B) (6)

= E(YA²|B) − (E(YA|B))² (7)

= E(E(YA²|X, B)|B) − (E(E(YA|X, B)B))² (8)

1

(2)

である。ここで、無視可能性の仮定により、

E(YA²|X, B) = E(YA²|X, A) (9)

である。同様に

E(YA|X, B) = E(YA|X, A) (10)

となる。となる。最後に出てきたE(YA²|X, A)とE(YA|X, A)はデータから観測できる。従って、無視可能性の仮定の下で、V(YA|B)は識別でき、分散分解も可能になる。

Vˆ(YA|B) = ¹ nB

n_B

∑

i=1

ˆ

aA(XBi) − ( 1

nB n_B

∑

i=1

ˆbA(XBi) )₂

(11)

として推定できる。しかし、ノンパラメトリックに高い精度の推定を行うことは難しく、少ない母数で記述できるモデルを仮定して通常は推定を行う。

7.2 _{線形モデルでの分解}

まず、一般に分散には次のような条件付き分散による分解が可能である。

V(Y ) = E((Y − E(Y ))²) (12)

= E((Y − E(Y |X) + E(Y |X) − E(Y ))²) (13)

= E((Y − E(Y |X))²) + E((E(Y |X) − E(Y ))²) (14)

= E(V (Y |X)) + V (E(Y |X)) (15)

この公式と、条件付き期待値と条件付き分散のモデル化とを組み合わせて、分散分解を行う。まず、E(YA|X)とE(YB|X)には、線形モデルを仮定する。つまり、

E(YA|X) = X^′βAかつ E(YB|X) = X^′βA (16) とする。無視可能性の仮定があるために、E(YA|X)はグループAの観測値のみを用いた線形回帰で、E(YB|X)はグループBの観測値のみを用いた線形回帰で、それぞれ推定できる。線形モデルの仮定のもとでは、

従って、分散分解は、

2

(3)

かつ

∆^VX = E(V (YA|X)|B) − E(V (YA|X)|A) + βA^′ (V (X|B) − V (X|A))βA (19) とかける。

次に、条件付き分散のモデル化を考えるが、これは一般に受け入れられているモデルがないため、自明ではない。一つのやり方は、Xの値によって、母集団をわけ、その各グループ内では分散は一定とする方法である。この方法は、計算上は標本分散をXのグループ分けの分だけ計算すればよいだけであるので、簡単である。

もう一つの条件付き分散の推定は、モデル化をし、そのモデルの母数を推定するというものである。ここでは、簡便な線形モデルを考える。つまり、V(YA|X) = X^′δAかつ V(YB|X) = X^′δBとするものである。このときは、分散分解は、

∆^VS = E(X|B)^′(δB− δA) + (βB− βA)^′V(X|B)(βB− βA) (20) かつ

∆^VX = (E(X|B) − E(X|A))^′δA+ βA^′ (V (X|B) − V (X|A))βA (21) とかける。

条件付き分散をモデル化した場合の分散モデルの母数の推定は、次のような２段階推定で行う。まず、条件付き期待値のモデルを推定し、残差を得る。ここでは線形モデルを考えているので、

ˆ

vAi = YAi− XAi^′ β^ˆA (22)

としてAグループの残差は計算でき、^Bグループの残差も同様に計算できる。次にvˆ_Ai² _を XAi_{に回帰することで、}δA_{の推定値を得られる。}δB_{も同様に推定できる。}

7.3 _{分散分解の限界}

ここまで見てきたように、OB分解法の拡張として分散分解は可能であるが、分散分解には次に述べるように主に二つの問題点がある。

• 条件付き分散のモデル化をしないと、簡便に推定できないが、条件付き分散の適切なモデルについて、学界内での意見の一致がない。ここでは、線形モデルを考えたが、線形モデルは、分散が負になることもあるので、分散のモデルとしてはあまり適切ではないという説得力のある意見がある。分散が決して負にはならないようなモデルも存在するが、どのモデルがよいかという意見の一致はない。

なお、条件付き期待値の場合は、線形モデルを使用することはそれほど大きな抵抗はない。また、賃金の場合には、ミンサー方程式を使用することが一般的であり、よく当てはまることが知られている。

• 分散分解ではdetailed decompositionの実行に問題が残る。ここでは、最も簡便なモデルであろうと思われる線形モデルを期待値にも分散にも用いたが、その場合でも、 detailed decompositionは容易ではない。なぜなら、二つの説明変数の交叉項が分解に含まれているので、一方の変数の効果を判定することが、難しいからである。

References

[1] N. Fortin, T. Lemiuex, and S. Firpo. Decomposition methods in economics. In O. Ashenfelter and D. Card, editors, Handbook of Labor Economics, volume 4a, chapter 1, pages 1–102. Elsevier B.V., 2011.

3

分散の分解 教育 OKUI, Ryo

References

分散の分解教育 OKUI, Ryo