• 検索結果がありません。

RIF回帰 教育 OKUI, Ryo

N/A
N/A
Protected

Academic year: 2018

シェア "RIF回帰 教育 OKUI, Ryo"

Copied!
6
0
0

読み込み中.... (全文を見る)

全文

(1)

平成25年度 ミクロ計量経済学 講義ノート10: RIF回帰

このノートでは、RIF(recentered influence function)回帰という、条件付きでない分位 点の回帰モデルとその推定量を解説する。通常の分位点回帰は、条件付き分位点に説明変数 が与える影響を計測するものである。しかし、条件付き分位点の結果を条件付きでない分位 点の結果と結びつけるのは容易ではない。例えば、労働組合への参加率が、賃金全体の分布 における分位点に与える影響を調べることは、通常の分位点回帰ではできない。通常の分位 点回帰でわかるのは、条件付き分布における分位点に対する労働組合の参加率への影響で あり、それと、賃金全体での条件付きでない分位点への影響との関連は意外と複雑である。 このノートでは、まず、条件付きでない分位点と、条件付き分位点の違いを解説する。つぎ に、RIF回帰という条件付きでない分位点への説明変数の影響をモデル化する方法とその 推定法を解説する。最後に、RIF回帰を分位点分解に応用する。RIF回帰は、分位点分解に おけるdetailed decompositionを行う際に非常に有用な手法である。このノートの議論は、 Firpo, Fortin and Lemieux (2009)とFortin, Lemieux and Firpo (2011)によっている。

10.1 条件付きでない分位点回帰の意義と条件付き分位点回帰との違い

この節では、条件付きでない分位点回帰と条件付き分位点回帰の違いを説明する。条件付き 分位点回帰のほうが、チェック関数を用いて推定する通常の分位点回帰であり、条件付きで ない分位点回帰が、このノートの主眼であるRIF回帰に相当する。この二つは計算方法が 異なるだけでなく、根本的に違う目的を持って使用されるものである。

例として、Fripo, Fortin and Lemieux (2009)に習い、労働組合に参加しているかどうか を説明変数とし、被説明変数は賃金である分析を考える。このとき、条件付き分位点回帰で 調べるのは、労働組合参加者の賃金の分位点と非参加者の賃金分布の分位点の違いである。 一方、条件付きでない分位点回帰で調べるのは、賃金(周辺)分布の分位点に対する労働組 合参加率の影響になる。この二つの目的は異なる。例えば、近年の労働組合への参加率の減 少が、賃金分布の下の方の分位点にどのような影響を与えているかを調べるためには、条件 付きでない分位点回帰を用いる必要がある。

この二つの分位点回帰の違いをモデルを使って説明を行う。まず、例にならって、Y を 賃金としXを労働組合に参加しているかどうかを示す2項変数とする。Y の分布をFY と し、条件付き分布をFY |Xとする。p = Pr(X = 1)を労働組合参加者の割合とする。すると、 条件付きでない分布と条件付き分布の間には、

FY(y) = pFY |X=1(y) + (1 − p)FY |X=0(y) (1) という関係がなりたつ。

条件付き分位点回帰で調べるのは、Xの二つの値それぞれに対応するY の分位点の差で ある。条件付き分位点をQα(Y |X) = FY |X−1 (α)とする。条件付き分位点回帰では、

Qα(Y |X) = βα,0+ βα,1X (2)

と仮定する。このとき

βα,1= Qα(Y |X = 1) − Qα(Y |X = 0) (3) である。一方、条件付きでない分位点回帰で調べるのは、pの値を変えたときのY の周辺分布に おける分位点の影響である。qα= FY−1(α)をY のα分位点とする。条件付きでない分位点 回帰では、

dqα

dp (4)

(2)

を調べる。陰関数定理を用いると、これは、 dqα

dp =

Pr(Y > qα|X = 1) − Pr(Y > qα|X = 0)

fY(qα) (5)

とかける。なお、fY(·)はY の条件付きでない密度関数である。

このように、条件付き分位点回帰と条件付きでない分位点回帰は異なる。また、条件付 き分位点から、条件付きでない分位点を求めることは可能ではあるが、分布全体の情報を必 要とするため、あまり便利ではない。従って、条件付きでない分位点回帰をするためには、 別途そのためのモデルや手法を使用する必要がある。この方法が次に紹介するRIF回帰で ある。

10.2 RIF 回帰

RIF回帰は、条件付きでない分位点回帰をするための手法である。これは、被説明変数とし てRIF(recentered influence function)を用いる他は、通常の回帰モデルと同じように扱え、 推定も線形モデルであれば、OLSで可能である。なお、ここでは、分位点回帰のためのRIF 回帰を紹介するが、RIF回帰自体は他の統計量にも使用することができる。

RIFとは、興味のある統計量のinfluence functionを、その期待値が興味のある統計量 になるように調整(この作業がrecentering)したものである。Influence functionの定義は、 後ほど述べる。分位点に興味がある場合は、influence functionは

α − 1{Y ≤ qα}

fY(qα) (6)

となる。fY はY の密度関数である。influence functionの期待値は0であるので、RIFは RIF(Y ; qα) = qα+α − 1{Y ≤ qα}

fY(qα) (7)

である。期待値を取ると、E(RIF(Y ; qα)) = qαであり、分位点になる。

RIF回帰モデルは、RIFの説明変数Xでの条件付き期待値をモデル化したものである。 例えば、線形モデルを使用する場合は、

E(RIF(Y ; qα)|X) = Xγ (8)

とモデル化する。線形モデルの場合だと、係数のγがXの分布を変えたときの、Y の分位 点に与える影響となる。なお、今考えている分位点の場合は、Pr(Y ≤ qα|X)を線形確率モ デルでモデル化したものと同値である。

RIF回帰の仕組みを理解するために、まずはinfluence functionの定義から説明する。 ここでは、分位点に限らず、一般の統計量v(FY)について議論を進める。Y の分布をFY からGY の方向に変更したときにv(·)がどのように変化するかを表現するのが、influence functionである。FY,t·GY = (1 − t)FY + tGY として、FY とGY の凸結合をとる。そして、 v(FY,t·GY)のtについての微分をとると

∂v(FY,t·GY)

∂t

t=0

=

∂v(F

Y,t·∆y)

∂t

t=0

d(GY − FY)(y) (9)

とかける。ここで、∆yとはY = yを確率1で取る分布である。最後の積分の中に出てきた 微分がinfluence functionと呼ばれるものであり、IF(y; v)と表記する。E(IF(Y ; v)) = 0で ある。

(3)

次に、RIF回帰によってXの分布の変化の影響をY の条件付きでない分布の変化を調 べることが出来るという点を見る。まず、RIFの定義から、

v(FY) =

RIF(y; v)dFY(y) (10)

=

∫ ∫

RIF(y; v)dFY |X(y|X = x)dFX(x) (11)

=

E(RIF(y; v)|X = x)dFX(x) (12)

とかける。次にXの分布をFXからGXの方向へ変化させると、これはY の分布をFY から GY(y) =

FY |X=x(y)dGX(x) (13)

に変化させることに対応する。このとき、FY,t·G

Y = (1 − t)FY + tG

Y とすると、

∂v(FY,t·G

Y)

∂t

t=0

=

E(RIF(Y, v)|X = x)d(GX − FX)(x) (14)

とかけるのである。さらに、Xの要素のうち一つだけXj + tと変化させることによりGX

を作り、その場合の∂v(FY,t·GY)/(∂t)

t=0の値をβj(v)とし、β(v)βj(v)を並べたベクト

ルとすると、

β(v) =

∫ dE(RIF(Y, v)|X = x)

dx dFX(x) (15)

となる。

したがって、RIF回帰の係数は、Xの分布を変化させたときのY の統計量への影響と見 ることができる。線形モデルの場合には、

dE(RIF(Y, v)|X = x)

dx = γ (16)

であり、その期待値もγである。よってある変数Xjの係数γjはXj の値をXj + tと変化 させたときに、統計量vがどのように変化するかを捉えたものになる。また、非線形モデル として、

E(RIF(Y, v)|X = x) = m(x) (17)

を考えるならば、

β(v) = E

(dm(x) dx

x=X

)

(18)

となる。

10.3 RIF 回帰の推定

RIF回帰の推定は簡単である。被説明変数の構築に少し手間がかかるが、それ以外は線形モ デルであればOLSで推定可能である。ここでは、条件付きでない分位点回帰をRIF回帰を 用いて行う場合の、推定について議論する。

(4)

RIF回帰を行うためには、被説明変数となるRIFを求める必要がある。分位点の場合に は、RIFは先に見たように

RIF(Y ; qα) = qα+α − 1{Y ≤ qα}

fY(qα) (19)

である。まず、分位点qαはY のデータからα分位点を計算すればよい。その推定値をqˆα となる。すると後は、fy(qα)の推定をすればよいことになる。これは、カーネル推定量を用いる。 カーネル関数をK(·)とし、バンド幅をbとすると、

Y(qα) = 1 N b

N i=1

K

(Yi− ˆqα b

)

(20)

として、推定できる。カーネル関数としては、例えば、ガウスカーネルK(a) = φ(a)という 標準正規密度関数を使用するものを考えることができる。バンド幅は、cross-validationを 用いて計算するのが一般的であるようだが、より簡単な方法としては、「大まかなやり方」 として、

ˆb = 1.06ˆσN−1/5 (21)

を用いることもできる。ここで、σˆはY の標本標準偏差である。

そして、OLSにより、RIFの推定量であるRIF(Y ; qd α)をXに回帰する。推定量は、 ˆ

γ = ( n

i=1

XiXi )−1 n

i=1

XiRIF(Yd i.qα) (22)

となる。これがRIF回帰である。

10.4 RIF 回帰の分位点分解への応用

最後に、RIF回帰を用いて分位点分解を行う方法を紹介する。この方法は、特にdetailed

decompositionを行うのに便利である。分解の理論的な枠組みは、政策評価法のものである。

ある個人iがいて、この個人は潜在的にYAiとYBiの両方の結果を持ち、その個人がグルー プAに入れば、YAiを観測でき、グループBに入れば、YBiを観測するという設定である。 qαg|g として、グループgにおけるYgのα分位点を表記する。そして、分位点分解とは、

Q,αO = qαB|B− qαA|A

Q,αO = ∆Q,αS + ∆Q,αX (23)

ただし、

Q,αS = qB|Bα − qA|Bα (24) かつ

Q,αX = qαA|B− qA|Aα (25) と分解するものであった。

この分位点をRIF回帰モデルを使用してモデル化し推定する。

E(RIF(YA; qA|Aα )|X) = XγA (26) E(RIF(YB; qαB|B)|X) = XγB (27)

(5)

と線形回帰モデルで書くことにする。さらにqA|Bα についても、

E(RIF(YA; qA|Bα |X) = XγA (28) と仮定する1。すると、qA|Bα = E(X|B)γAとなる。

上記のRIF回帰モデルのもとでは分位点分解は、

Q,αS = E(X|B)B− γA) (29) かつ

Q,αX = (E(X|B) − E(X|A))γA (30) となる。分解の推定は、RIF回帰モデルの推定をもとに行うことが出来る。つまり、実装は 次のようになる。

1. グループAからの観測値のみを使い、RIF(YA; qA|Aα )|X)を推定し、それをXに回帰 して、ˆγAを得る。

2. 同様にしてグループBからの観測値を使い、γˆBを得る。 3. 分位点分解を

∆ˆQ,αS = ¯XB (ˆγB− ˆγA) (31)

∆ˆQ,αX = ( ¯XB− ¯XA)γˆA (32) として計算する。

RIF回帰モデルが線形でない場合に対処するためにDiNardo, Fortin and Lemieux (1996) によるreweighting法を用いることができる。特にqA|Bα のRIFに対する線形性の仮定さら には、その係数がγAであるという仮定の正当性が難しいため、線形性に頑健な手法は望ま しい。実装は次の通りである。

1. Reweighting function である

Ψ(X) = Pr(B|X) Pr(A)

Pr(A|X) Pr(A) (33)

を推定する。ただし以下では、推定値もΨ(X)と表記する。 2. RIF(YA; qαA|B)を計算する。そのために

ˆ

qαA|B= arg min

θ nA

i=1

ρα(YAi− θ)Ψ(XAi) (34)

かつ

YA|B(ˆqA|Bα ) = 1 nAb

nA

i=1

Ψ(XAi)K

(YAi− ˆqαA|B b

)

(35)

と推定する。すると、RIFは

RIF(Yd A; qA|Bα ) = ˆqαA|B+ α − 1{YA− ˆq

α A|B}

YA|B(ˆqA|Bα ) (36)

と推定できる。

1これはモデルの設定からは出てこず、別途仮定する必要があるように思われる。ただ、この仮定が本当にモ デルの他の仮定から出てこないかどうかは、教員もよくわかっていない。

(6)

3. 重み付け線形回帰を行う。つまり、 ˆ

γAC = arg min

γ nA

i=1

(RIF(Yd Ai; Qα(YA|B)) − XAi γ)2Ψ(XAi) (37)

と推定する。

4. E(X|B)を重み付け平均で推定する。つまり、

AC = 1 nA

nA

i=1

XAiΨ(XAi) (38)

とする。 5. qαA|B

ˆ

qA|Bα = ( ¯XAC)ˆγAC (39)

と推定し、

∆ˆQ,αS = ¯XB γˆB− ( ¯XAC)γˆAC (40)

∆ˆQ,αX = ( ¯XAC)γˆCA− ¯XA γˆA (41)

として、分解を行う。

RIF分解を用いた分位点分解は、detailed decompositionを容易に行うことができる。例 えば、k番名の説明変数の、分解の説明できない部分への影響は

∆ˆQ,αS,k = ¯XBk(ˆγBk− ˆγAk) (42)

として、推定できる。Reweighting法を用いた場合でも同様にできる。他の分位点分解の方 法では、detailed decompositionを行うことが難しく、detailed decompositionが簡単に出 来るRIF回帰を用いた分解は有用である。

References

[1] J. DiNardo, N. M. Fortin, and T. Lemieux. Labot market institutions and the distribution of wages, 1973–1992: A semiparametric approach. Econometrica, 64:1001–1044, 1996.

[2] S. Firpo, N. M. Fortin, and T. Lemieux. Unconditional quantile regressions. Econometrica, 77(3):953–973, 2009.

[3] N. Fortin, T. Lemiuex, and S. Firpo. Decomposition methods in economics. In O. Ashenfelter and D. Card, editors, Handbook of Labor Economics, volume 4a, chapter 1, pages 1–102. Elsevier B.V., 2011.

参照

関連したドキュメント

石川県教育委.

[r]

REC DATA MASTER L to SD CARD REC DATA MASTER R to SD CARD VOLUME SOUND

小牧市教育委員会 豊明市教育委員会 岩倉市教育委員会 知多市教育委員会 安城市教育委員会 西尾市教育委員会 知立市教育委員会

Marco Donatelli, University of Insubria Ronny Ramlau, Johan Kepler University Lothar Reichel, Kent State University Giuseppe Rodriguez, University of Cagliari Special volume

The CrM operational characteristics will be similar to any conventional critical conduction mode boost PFC or flyback converter, namely the switching frequency will vary with line

"Identification of social interactions," Handbook of Socail Economics, J. Jackson, eds., Amsterdam: Elsevier Science, 2011. 39) Lin, X.: Identifying Peer Effects in

外声の前述した譜諺的なパセージをより効果的 に表出せんがための考えによるものと解釈でき