担当:鹿野(大阪府立大学)
2013 年度後期
はじめに
前回の復習
回帰分析の根源的仮定 :外生性FA1と標本の独立性FA2。
MM-OLS推定と、その不偏性・一致性。
今回学ぶこと
不均一分散のもとでのOLS推定量の分散。
OLSの漸近分布・漸近分散⇒仮説検定。
テキスト該当箇所:8.2章。浅野・中村(2010)のp139∼140も参照。講義ノート#08、#09 と比較。
1 誤差項の分散構造と OLS の分散
1.1 準備:誤差項の不均一分散
前回のまとめ:根源的仮定FA1、FA2のもとで、回帰モデル
Yi= α + βXi+ ui (1)
のOLS推定量(MM推定量)は不偏性・一致性を満たす。
E( ˆβ) = β, plim ˆβ = β. (2)
⊲ ∴古典的仮定よりも緩い前提条件で、OLSはうまく働いてくれる。
⊲ OLSの分散は?分布は?⇒これらは仮説検定で必要。
⊲ 準備として、誤差項uiの を考える。
誤差項の不均一分散 :誤差項uiの条件付き分散は、 一般に
Var(ui|Xi) = E(u2i|Xi) = v(Xi) = σ2i, i = 1, 2, . . . , n. (3)
∴ Xiに応じて、バラつきが異なる可能性。 これを と呼ぶ。
⊲ 注意:分散が各観測で異なる⇒添え字iで区別。 1
⊲ 一方、均一分散ならば、繰り返し期待値の公式から
E(u2i|Xi) = σ2 ⇒ E(u2i) = EXi[E(u2i|Xi)] = σ2. (4)
∴古典的仮定の、 均一分散の仮定CA3(講義ノート#08) と同値。
⊲ 均一分散は、あくまで分析者の都合による仮定⇒より一般的には、データが不均一 分散であるケースを想定すべき。
1.2 OLS の分散
OLSを、次のように表す。
β = β +ˆ wiui = β + 1 SX X
(Xi− ¯X)ui = β + AB. (5)
ここでwi = S1
XX(Xi− ¯X)
はOLSウェイト(講義ノート#08)。 また A = S1
X X
, B =(Xi− ¯X)ui. (6)
⊲ ∴ ˆβの、X1, X2, . . . , Xnに関する条件付き分散は Var( ˆβ|X1, X2, . . . , Xn) = E
( ˆβ− β)2|X1, X2, . . . , Xn
= E(A2B2|X1, X2, . . . , Xn). (7)
⊲ AはX1, X2, . . . , Xnで作られているので、X1, X2, . . . , Xnを見せられれば定数扱い。(講 義ノート#18。) よって
Var( ˆβ|X1, X2, . . . , Xn) = . (8)
OLSの分散:根源的仮定FA1、FA2のもとで、OLSの分散は Var( ˆβ|X1, X2, . . . , Xn) = A2
(Xi− ¯X)2E(u2i|Xi)
= . (9)
⊲ 一般に、OLSの分散は非常に複雑な形となる。
⊲ 証明:補足資料#20より、次式が成立。 E(B2|X1, X2, . . . , Xn) =
(Xi− ¯X)E(u2i|Xi) =
(Xi− ¯X)σ2i. (10) これを(8)式に代入すれば良い。
Remark:もし誤差項が均一分散だったら ?⇒全ての観測でE(u2i|Xi) = σ2i = σ2なので、 Var( ˆβ|X1, X2, . . . , Xn) =
1 SX X
(Xi− ¯X)2σ2
= σ
2
SX X
(Xi− ¯X)2
=SXX
= σ
2
S2X X
SX X= . (11)
⊲ ∴コレは均一分散のときのOLSの分散と同じ!(講義ノート#08)
⊲ 一般にOLSの分散は、 に依存して決まる。
2 OLS の漸近分布に基づく仮説検定
2.1 OLS の漸近正規性と漸近分散
βの仮説検定を行うためには、OLS推定量βˆの分布を導出する必要。⇒準備として、(5) 式を次のように書き換える。
β = β + ABˆ ⇔ β = β +ˆ √1
n · · . (12)
⊲ さらに次の書き換え。
nA = Sn
X X =
1
1 nSX X
= 1 1
n(Xi− ¯X)2 = 1 s2
X
, (13)
√1nB = 1n(Xi− ¯X)ui. (14)
∴前者はXiの標本分散の逆数。
⊲ 大数の法則(+外生性の仮定FA1)より、 plim nA = n
SX X = 1 plim s2X =
1
Var(Xi) = . (15)
⊲ また中心極限定理により、 近似的に
√1nB∼a , C = plim1n(Xi− ¯X)2u2i. (16)
(正確な証明は、 入門レベルを超えるので省略。)
Remark:サンプル数nが十分多ければ、誤差項ui がいかなる分布に従おうとも、近似
的に
β = β +ˆ √1
n × × . (17)
∴ ˆβは正規分布に従う確率変数。
⊲ ポイントは √1nB = √1n(Xi− ¯X)uiの漸近正規性。個々のuiに正規性を仮定しなくと も、その加重和は中心極限定理により、 正規近似できる。
⊲ 古典的仮定では、 (CA5)を置いてβˆの分布を導出。 一方、正規 分布に従わないデータも多くある。∴正規性の仮定によるアプローチは問題あり。
OLSの漸近分布:OLS推定量 ˆβは、βの (講義ノート#17)。
ˆβ∼ Na β,Avar( ˆβ). (18)
ここで は
Avar( ˆβ) = C
nσ4X, C = plim 1 n
(Xi− ¯X)2u2i. (19)
⊲ ∴サンプルnが多ければ、母集団に特定の分布を仮定しなくとも、βˆの正規分布が得 られる。
⊲ 証明:(15)式、(16)式の結果を(12)式に代入・整理すればよい。
⊲ 漸近分散がとても複雑⇒データから推定するには ?
ホワイトの頑健分散 :漸近分散(19)式は、次式で推定できる。 H = Cˆ
n( ˆσ2
X)2
, σˆ2X = 1 n
(Xi− ¯X)2
=SXX
, C =ˆ 1 n
(Xi− ¯X)2ˆu2i. (20)
これを と呼ぶ(Halbert White、色ではなく人名)。
⊲ ∴ Cに含まれる観測できない を、OLSの結果得られる で置
き換え。White(1980)はplim ˆC = Cを証明。
⊲ 上式を書き換えれば、 よりシンプルに。 H = n
2
nS2X X 1 n
(Xi− ¯X)2ˆu2i = 1 S2X X
(Xi− ¯X)2ˆu2i. (21)
⊲ ホワイトの分散推定に基づけば、βˆの は s.e.( ˆβ)H =
√H = S1
X X
(Xi− ¯X)2ˆu2i. (22)
たいていの統計ソフトのOLSコマンドには、ホワイトの標準誤差を求めるオプショ ンがついている。(gretlの「頑健な標準誤差」。)
2.2 正規近似を利用した仮説検定
漸近分布(18)式とホワイトの分散推定(18)式を使えば、OLSの分布は
ˆβ∼ N(β, H).a (23)
⊲ ∴近似的に、次式が成立。
Z = ∼ N(0, 1).a (24)
⊲ β に 仮 説 値 を 与 え れ ば 、 標 準 正 規 分 布 の 臨 界 値 z = 1.96 ≈ 2を 使って 仮 説 検 定
( )ができる。
漸近分布による近似 :手順は通常のt検定と全く同じ。 違いは標準誤差の計算法だけ。 1. 未知の係数に帰無仮説H0: β = β0を置く。
2. 仮説値のもとで を計算。
Z0= βˆ√− β0
H . (25)
3. |Z0| > 1.96 ⇒ H0: β = β0を棄却する、|Z0| < 1.96 ⇒ H0:を棄却しない。
Remark:現在の実証分析では、「OLS+ホワイトの標準誤差」 が主流。
⊲ 講義ノート#09の、均一分散を前提とした標準誤差
s.e.( ˆβ) =
s2 SX X =
s
√S
X X
, s2= 1 n− 2
(Yi− ˆY)2 (26)
は、不均一分散の場合、誤った標準誤差。⇒あまり使わない。(データが均一分散の 保証がないので、 危なくて使えない。)
⊲ 一方ホワイトの標準誤差は、 均一分散だろうが不均一分散だろうが、 いつでも正し い 。⇒コチラの計算法を使うべき。
⊲ t値(Z値)の分母は標準誤差。∴標準誤差の計算方式が、 の判断 を変えてしまう可能性 !
例:マンション価格の回帰分析(講義ノート#12、#14)の、標準誤差・t値の計算法を再 考。被説明変数はマンション価格。
通常の分散 ホワイトの分散 係数 標準誤差 t値 標準誤差 t値
定数項 1896.26 189.09 10.03 159.32 11.90
駅までの時間 -36.79 10.01 -3.68 8.92 -4.13
築年数 -61.30 4.59 -13.35 3.62 -16.92
面積 60.14 2.21 27.19 2.69 22.36
1ルーム -544.81 161.23 -3.38 111.23 -4.90
¯
R2 0.89
n 194
⊲ 全てgretlで計算。
⊲ 分散の推定方式次第で、標準誤差・t値が大幅に変わる。ホワイトの頑健なバージョ ンをレポートすべき。(幸い)この例では、どちらの標準誤差でも全ての係数が統計 的に有意。
⊲ 均一分散ならば、通常の標準誤差とホワイトの標準誤差にあまり差が出ないはず。∴ 標準誤差の比較は、 均一分散の仮定が正しいか否かの簡便なチェックになる。
Remark:根源的仮定FA1(外生性)、FA2(標本の独立性) を前提にした新しい回帰分
析の世界(講義ノート#18以降)⇒OLSは、かなり広範なデータに適用可能 !
⊲ 回帰係数の推定方法は ?⇒実質は 。
⊲ OLS推定の性能は?⇒ 、 。ただし有効性(最小分散)は不明。
⊲ 有意性の検定は ?⇒ (近似)による検定。 と標準誤差、t値。
⊲ ∴分析者がやるべき作業自体(OLS推定→有意性検定)は、古典的仮定のときとあ まり変わらない。
まとめと復習問題
今回のまとめ
不均一分散のもとでのOLS推定量の分散。
OLSの漸近分布・漸近分散(ホワイトの分散推定) と、仮説検定での利用。
復習問題
出席確認用紙に解答し (用紙裏面を用いても良い)、 退出時に提出せよ。
1. なぜ通常のOLSの分散ではなく、ホワイトの分散に基づく標準誤差・t値を用いたほうが 良いのか?簡潔に説明せよ。