平成25年度 ミクロ計量経済学 講義ノート8 分位点回帰
このノートでは、分位点回帰の手法を解説する。分位点回帰とは、被説明変数の、説明 変数で条件づけた分布の分位点をモデル化し、推定するものである。なお、通常の回帰分析 では、被説明変数の説明変数で条件づけた「期待値」が分析の対象となる。しかし、期待値 を調べるだけでは、分析ができない問題もある。分位点回帰を行うことで、より詳細な説明 変数と被説明変数の関係を得ることができるため、近年では分位点回帰の利用は盛んになっ てきている。また、期待値は、異常値に影響されやすいが、分位点回帰は異常値に対して頑 健であるため、異常値のあるデータで、その影響を避けるために分位点回帰を使用すること もある。分位点回帰について基本的な内容は、Koenker (2005)にまとめられている。
8.1 分位点回帰
線形回帰式y = β′x + ϵを考える。しかし、通常の仮定であるE(ϵ|x) = 0の代わりに、 quantα
| {z }
α−分位点
(ϵ|x) = 0, (1)
つまり、Fϵ|xをϵのxで条件づけた条件付き分布として、
Fϵ|x(0) = α (2)
を仮定する。yの分位点で表現すると、上のモデルでは、quantα(y|x) = β′xとなる。たと えば、メディアン回帰では、med(ϵ|x) = quant0.5(ϵ|x) = 0、あるいはmed(y|x) = β′xと なる。
• 分位点処置効果の解釈には注意が必要である。処置の前後での同じ水準での分位点の 違いを計測しているに過ぎない。これは、ある分位点にいた個人がどれほどの処置効 果を得たかを示すものでは必ずしもない。もし、処置が結果の順位に影響を与えない なら、個人への処置効果という解釈もできる。
Lehmann-Doksum による分位点回帰の基礎付け x = Dとし、説明変数が2項変数の
場合を考える。仮に、D = 1のとき、yの分布がGであり、D = 0になるとFになるとす る。FとGの間には、次のように
F (y) = G(y + ∆(y)) (3)
という関係にあるとする。さて、このとき、
∆(y) = G−1(F (y)) − y (4)
である。さて、α = F (y)であるようなyにおける変化を考え、それをδ(α)と表記すると、 上の式を変形して、
δ(α) = G−1(F (y)) − y = G−1(α) − F−1(α) (5) となる。これをDのαでの分位点処置効果という。
分位点処置効果と分位点回帰の関係は次のようになる。yのDで条件づけた分位点は、 quantα(y|D) = F−1(α)(1 − D) + G−1(α)D (6) とかける。これを書き換えると、
quantα(y|D) = F−1(α) + (G−1(α) − F−1(α))D = F−1(α) + δ(α)D (7) となる。つまり、分位点回帰におけるDの係数が分位点処置効果であるδ(α)となる。分位 点回帰は、上のDを連続で多変数の場合に自然に拡張したものと考えることができる。
8.2 推定
分位点回帰の推定には、チェック関数と呼ばれる、次の
ρα(z) = α|z|{z > 0} + (1 − α)|z|{z ≤ 0} (8) という関数を用いた極値推定量を使用する。つまり、推定量は、
β = arg minˆ
β
1 n
∑n i=1
ρα(yi− β′xi) (9)
である。なお、ρα がチェック関数と呼ばれるのは、グラフがチェック印に似ているからで ある。
Figure 1: チェック関数
1-a/sqrt(a(1-a)) a/sqrt(a(1-a))
次の定理で、チェック関数の期待値が、分位点を最小詞として持つことを述べる。 定理 1 (チェック関数の性質).
yi= β + ϵ, quantα(ϵ) = 0 (10)
のとき、β = quantα(y)は、E(ρα(y − b))の最小詞である。
証明. 次の二つのbの値を比べる。ひとつはβ = quantα(y)である。もう一つは、b < βと する。次を示す。
R1 = E(ρα(y − β)) ≤ R2 = E(ρα(y − b)). (11)
そのために、次の展開を行う。
R2− R1= − (1 − α)
∫ b
−∞((y − b) − (y − β))dFy+ α
∫ ∞
β ((y − b) − (y − β))dFy (12) + α
∫ β
b (y − b)dF
y− (1 − α)
∫ β
b (y − β)dF
y (13)
=(1 − α)(b − β)Fy(b) − α(b − β)(1 − Fy(β)) (14)
− α(b − β)(Fy(β) − Fy(b)) + (2α − 1)
∫ β
b (y − β)dF
y. (15)
Figure 2: チェック関数と分位点
1-a a
delta a
b1
b2
a
ここで、Fy(β) = αであるので、
R2− R1 = (1 − α)(b − β)Fy(b) − α(b − β)(1 − α) (16)
−α(b − β)(α − Fy(b)) + (2α − 1)
∫ β
b (y − β)dF
y (17)
= −(b − β)(α − Fy(b)) + (2α − 1)
∫ β
b (y − β)dF
y (18)
= −(b − β)(α − Fy(b)) +
∫ β
b (y − β)dF
y+ 2(α − 1)
∫ β
b (y − β)dF
y. (19) ここで、b < βなので、
∫ β
b (y − β)dF y ≥
∫ β
b (b − β)dF
y = (b − β)(α − Fy(b)) (20) となり、また、1 > αであることから、
2(α − 1)
∫ β
b (y − β)dF
y ≥ 0 (21)
である。したがって、
R2− R1 ≥ 0 (22)
となる。b > βの場合も同様に証明できる。
次に、分位点回帰の場合に、チェック関数を用いた推定ができることを見る。モデルは、 y = β0′x + ϵ かつquantα(ϵ|x) = 0である。このとき、quantα(y|x) = β0′xなので、明らか に、すべてのxについて、
arg min
β E(ρα(y − β
′x)|x) = β
0 (23)
である。従って、xの関数を適当にv(x)と取ると、
β0 = arg min E(v(x)ρα(y − β′x)) (24)
となる。v(x) = 1を取る場合には、通常の分位点回帰の推定問題に対応する。上の式の自然 な標本での対応は、
β = arg minˆ
β
1 n
∑n i=1
ρα(yi− x′iβ) =通常の分位点回帰推定量 (25)
であろう。たとえば、α = 1/2であるなら、
β = arg minˆ
β
1 n
∑n i=1
|yi− x′iβ| (26)
となり、LAD (least absolute deviation)推定量となる。
8.3 漸近理論
一致性 極値推定量の理論をそのままあてはめて証明できる。つまり、推定の際の目的関数 の極限の最小詞が真の母数となっているので、あとは、一様収束と最小詞が強い意味での最 小詞であることを証明すればよい。
漸近分布 βˆの漸近分布の導出は、少し通常の漸近理論の適用はできない。問題点は、
Qn(β) = 1 n
∑n i=1
|yi− β′xi| (27)
が(βの関数として)滑らかでないことである。
• xiがスカラーの時のQnの形状は、Figure 3にある。
Figure 3: 分位点回帰の目的関数
Q
beta
beta
|y-x’beta|
x x
従って、滑らかでない目的関数の場合の漸近正規性の定理を使う。まず一般的な定理を 述べる。Qn(θ) =∑ni=1g(xi; θ)/nを目的関数とし、θˆn= arg max Qn(θ)とする。
定理 2 (van der Vaart (1998, Theorem 5.23)). ˆθnは一致性をもつと仮定する。以下の条件 が満たされるとする。
1. g(xi; θ)はθ0で、確率1で微分可能;
2. E [{∂g(xi; θ)/∂θ}{∂g(xi; θ)/∂θ}′] ≡ S < ∞;
3. E{g(x; θ)} (θの関数である)はθ0のまわりで2次のテイラー展開をすることができ る。つまり、
E{g(x; θ)} = E{g(x; θ0)} +12(θ − θ0)′ ∂
2
∂θ∂θ′E{g(x; θ0)}(θ − θ0) + o(||θ − θ0||); (28) 4. θ0の近傍Nで、∀θ1, θ2∈ N、
||g(x; θ1) − g(x; θ2)|| ≤ ρ(x)||θ1− θ2|| (29) で、E{|ρ(x)|2} < ∞ (リプシッツの条件)、となるものが存在する。
5. ∂2E {g(xi; θ0)} /∂θ∂θ′ ≡ H は正値定符号。 このとき、
√n(ˆθn− θ0) →dN (0, H−1SH−1) (30)
となる。
証明は省略するが、証明のポイントは、Qnは滑らかではなくとも、Qは滑らかである と仮定することにより、Qnが滑らかな場合と同じように議論をすることができるというこ とである。
上記の定理を用いて、分位点回帰推定量の漸近分布を求める。ここでは、α = 1/2の場 合を考える。つまり、βˆがLAD推定量の場合である。この場合、
Qn(β) = 1 n
∑n i=1
|yi− x′iβ| (31)
となる。なお、他のαの値の場合も同様に議論できる。
まず、条件1については、ϵがメディアンの値を確率0で取るならば満たされることが わかる。また、条件2については、∂β∂ |y − x′β| = sign(y − x′β)xであるので、S = E(xx′) となる。条件4については、S = E(xx′)が有界であれば満たされることがわかる。
条件3を確かめる。もともとの目的関数の代わりに、以下の関数を考える。
Q(β) = E(|yi− x′iβ| − |yi− x′iβ0|) = E
E(|yi− x′iβ| − |yi− x′iβ0||x)
| {z }
Qx(β)
. (32)
すると、
Qx(β) = E(|yi− x′iβ| − |yi− x′iβ0||x) = E(|ϵ − x′(β − β0)| − |ϵ||x). (33) ここで、θ ≡ x′(β − β0)と定義する。
Qx(β) = E(|ϵ − θ| − |ϵ||x). (34)
一般性を失わずに、0 < θの場合を考える。
Qx(β) =
∫ ∞
−∞(|ϵ − θ| − |ϵ|)dFϵ|x (35)
=
∫ 0
−∞
θdFϵ|x+
∫ θ
0 (θ − 2ϵ)dFϵ|x
+
∫ ∞
θ −θdFϵ|x
(36)
= θFϵ|x(0) + θ(Fϵ|x(θ) − Fϵ|x(0)) − 2
∫ θ 0
ϵdFϵ|x− θ(1 − Fϵ|x(θ)) (37)
= 2θFϵ|x(θ) − 2
∫ θ 0
ϵdFϵ|x− θ (38)
= 2
∫ θ 0
dϵFϵ|x(ϵ) dϵ dϵ − 2
∫ θ 0
ϵdFϵ|x− θ (39)
= 2
∫ θ 0
Fϵ|xdϵ + 2
∫ θ 0
ϵdFϵ|x− 2
∫ θ 0
ϵdFϵ|x− θ (40)
= 2
∫ θ 0
Fϵ|xdϵ − θ (41)
= 2
∫ x′(β−β0) 0
Fϵ|xdϵ − x′(β − β0). (42)
この式から、“H”を計算することができる。
∂2
∂β∂β′Q(β) =
∂2
∂β∂β′Ex(Qx(β)) =
∂2
∂β∂β′E (
2
∫ x′(β−β0) 0
Fϵ|xdϵ − x′(β − β0) )
(43)
= E ( ∂2
∂β∂β′2
∫ x′(β−β0) 0
Fϵ|xdϵ )
(44)
= E( ∂
∂β2Fϵ|x(x
′(β − β 0))x′
)
(45)
= 2E(fϵ|x(x′(β − β0))xx′) (46)
と計算できる。したがって、β0で
∂2
∂β∂β′Q(β) = 2E
(fϵ|x(0)xx′) (47)
となる。なお、条件5のためには、最後の行列は、有界で非特異であると仮定する。 したがって、
√n( ˆβ − β0) →dN (0, V ) (48) であることを証明できた。なお、
V = 1
4E(fϵ|x(0)xx
′)−1E(xx′)E(f
ϵ|x(0)xx′)−1 (49)
である。
• 詳しい解説は、Pollard (1991)を見よ。
1. もし、fϵ|x(0) = fϵ(0)のように、xに依存しないことが仮定できるのであれば、 V = 1
4 1
fϵ(0)2E(xx
′)−1 (50)
となる。これは、通常の回帰における分散均一の仮定に相当する。 2. α ̸= 1/2のときも、
√n( ˆβ − β0) →dN (0, V ), (51) となるが、
V = α(1 − α)E(fϵ|x(0)xx′)−1E(xx′)E(fϵ|x(0)xx′)−1 (52)
である。
8.4 標準誤差
漸近分散V の推定はそれほど単純ではない。
一つの方法は、ノンパラメトリックカーネル法を使用することである。“分散均一”の場 合は、
fˆϵ(0) = 1 nb
∑n i=1
K( ˆϵi− 0 b
)
(53)
として推定し、V の推定量を構築するとよい。“分散不均一に頑健”な漸近分散推定量とし ては、
E(fϵ|x(0)xx′) = 1 n
∑1 bK
( ˆϵi− 0 b
)
xix′i (54)
を使うことができる。
他には、ブートストラップを使用することも考えられる。Hahn (1995)を見よ。しかし、 分位点回帰の場合は、漸近精密化ができず、そのためには目的関数を滑らかにする必要があ ることも知られている。(Horowitz, 1998)を見よ。なお、目的関数を滑らかにする手法は、 推定量の計算にも有用であることが知られている(Hitomi and Kagihara, 2001)。
8.5 補足: 分位点回帰の頑健性
(y1, x1), . . . , (yn, xn)というデータセットのもとで、 β = arg minˆ
∑n i=1
α|yi− x′iβ|1{yi− x′iβ > 0} + (1 − α)|yi− x′iβ|1{yi− x′iβ < 0} (55)
であるとする。ここで、yiをyN EWi で置き換える。ここで、yiN EW は次の条件を満たすよ うに定義される。もし、yi− x′iβ > 0ˆ ならyiN EW− x′iβ > 0ˆ であり、逆にyi− x′iβ < 0ˆ なら、 yN EWi − x′iβ < 0ˆ とする。この時、
β = arg minˆ
∑n i=1
ρα(yN EWi − x′iβ) (56)
となり、推定量は変化しない。
理由は、次のように説明できる。ただし、以下の説明は理論的には不十分であり、あく までも概略を知るために大雑把に行っている。一次の条件をみると、
∑n i=1
[α(−xi)(1 − 1{yi− x′iβ ≤ 0}) + (1 − α)xi1{yi− x′iβ ≤ 0}] (57)
=
∑n i=1
[−α + 1{yi− x′iβ ≤ 0}]xi (58)
となる。あるいは、
1 n
∑n i=1
(α − 1{yi− x′iβ ≤ 0})xˆ i= 0 (59)
であるので、一次の条件変化がないのである。
References
[1] J. Hahn. Bootstrapping quantile regression estimators. Econometric Theory, 11(1):105–121, 1995.
[2] K. Hitomi and M. Kagihara. Calculation method for nonlinear dynamic least absolute devia- tions estimator. Journal of the Japan Statistical Society, 31(1):39–51, 2001.
[3] J. L. Horowitz. Bootstrap methods for median regression models. Econometrica, 66(6):1327– 1351, 1998.
[4] R. Koenker. Quantile Regression. Econometric Society Monographs. Cambridge University Press, 2005.
[5] D. Pollard. Asymptotics for least absolute deviation regression estimators. Econometric Theory, 7(2):186–199, 1991.