• 検索結果がありません。

不均一分散・非正規性とOLS 計量経済学 鹿野研究室 note20

N/A
N/A
Protected

Academic year: 2018

シェア "不均一分散・非正規性とOLS 計量経済学 鹿野研究室 note20"

Copied!
6
0
0

読み込み中.... (全文を見る)

全文

(1)

担当:鹿野(大阪府立大学)

2013 年度後期

はじめに

前回の復習

 回帰分析の根源的仮定 :外生性FA1と標本の独立性FA2

 MM-OLS推定と、その不偏性・一致性。

今回学ぶこと

 不均一分散のもとでのOLS推定量の分散。

 OLSの漸近分布・漸近分散仮説検定。

 テキスト該当箇所:8.2章。浅野・中村(2010)のp139∼140も参照。講義ノート#08#09 と比較。

1 誤差項の分散構造と OLS の分散

1.1 準備:誤差項の不均一分散

 前回のまとめ:根源的仮定FA1FA2のもとで、回帰モデル

Yi= α + βXi+ ui (1)

OLS推定量(MM推定量)は不偏性・一致性を満たす。

E( ˆβ) = β, plim ˆβ = β. (2)

⊲ ∴古典的仮定よりも緩い前提条件で、OLSはうまく働いてくれる。

⊲ OLSの分散は?分布は?これらは仮説検定で必要。

準備として、誤差項ui を考える。

 誤差項の不均一分散 :誤差項uiの条件付き分散は、 一般に

Var(ui|Xi) = E(u2i|Xi) = v(Xi) = σ2i, i = 1, 2, . . . , n. (3)

∴ Xiに応じて、バラつきが異なる可能性。 これを と呼ぶ。

⊲ 注意:分散が各観測で異なる添え字iで区別。 1

(2)

⊲ 一方、均一分散ならば、繰り返し期待値の公式から

E(u2i|Xi) = σ2 E(u2i) = EXi[E(u2i|Xi)] = σ2. (4)

∴古典的仮定の、 均一分散の仮定CA3(講義ノート#08) と同値。

⊲ 均一分散は、あくまで分析者の都合による仮定より一般的には、データが不均一 分散であるケースを想定すべき。

1.2 OLS の分散

 OLSを、次のように表す。

β = β +ˆ wiui = β + 1 SX X

(Xi− ¯X)ui = β + AB. (5)

ここでwi = S1

XX(Xi− ¯X)

OLSウェイト(講義ノート#08)。 また A = S1

X X

, B =(Xi− ¯X)ui. (6)

⊲ ∴ ˆβの、X1, X2, . . . , Xnに関する条件付き分散は Var( ˆβ|X1, X2, . . . , Xn) = E

( ˆβ− β)2|X1, X2, . . . , Xn



= E(A2B2|X1, X2, . . . , Xn). (7)

⊲ AX1, X2, . . . , Xnで作られているので、X1, X2, . . . , Xnを見せられれば定数扱い。(講 義ノート#18。) よって

Var( ˆβ|X1, X2, . . . , Xn) = . (8)

 OLSの分散:根源的仮定FA1FA2のもとで、OLSの分散は Var( ˆβ|X1, X2, . . . , Xn) = A2



(Xi− ¯X)2E(u2i|Xi)

= . (9)

一般に、OLSの分散は非常に複雑な形となる。

証明:補足資料#20より、次式が成立。 E(B2|X1, X2, . . . , Xn) =



(Xi− ¯X)E(u2i|Xi) =



(Xi− ¯X2i. (10) これを(8)式に代入すれば良い。

 Remark:もし誤差項が均一分散だったら ?全ての観測でE(u2i|Xi) = σ2i = σ2なので、 Var( ˆβ|X1, X2, . . . , Xn) =

1 SX X

(Xi− ¯X)2σ2

= σ

2

SX X



(Xi− ¯X)2

=SXX

= σ

2

S2X X

SX X= . (11)

⊲ ∴コレは均一分散のときのOLSの分散と同じ!(講義ノート#08

一般にOLSの分散は、 に依存して決まる。

(3)

2 OLS の漸近分布に基づく仮説検定

2.1 OLS の漸近正規性と漸近分散

 βの仮説検定を行うためには、OLS推定量βˆの分布を導出する必要。準備として、(5) 式を次のように書き換える。

β = β + ABˆ β = β +ˆ 1

n · · . (12)

さらに次の書き換え。

nA = Sn

X X =

1

1 nSX X

= 1 1

n(Xi− ¯X)2 = 1 s2

X

, (13)

√1nB = 1n(Xi− ¯X)ui. (14)

∴前者はXiの標本分散の逆数。

大数の法則(+外生性の仮定FA1)より、 plim nA = n

SX X = 1 plim s2X =

1

Var(Xi) = . (15)

⊲ また中心極限定理により、 近似的に

√1nBa , C = plim1n(Xi− ¯X)2u2i. (16)

(正確な証明は、 入門レベルを超えるので省略。)

 Remark:サンプル数nが十分多ければ、誤差項ui がいかなる分布に従おうとも、近似

的に

β = β +ˆ 1

n × × . (17)

ˆβは正規分布に従う確率変数。

ポイントは 1nB = 1n(Xi− ¯X)uiの漸近正規性。個々のuiに正規性を仮定しなくと も、その加重和は中心極限定理により、 正規近似できる。

古典的仮定では、 CA5)を置いてβˆの分布を導出。 一方、正規 分布に従わないデータも多くある。∴正規性の仮定によるアプローチは問題あり。

 OLSの漸近分布:OLS推定量 ˆβは、βの (講義ノート#17)。

ˆβ∼ Na β,Avar( ˆβ). (18)

ここで は

Avar( ˆβ) = C

4X, C = plim 1 n

(Xi− ¯X)2u2i. (19)

(4)

⊲ ∴サンプルnが多ければ、母集団に特定の分布を仮定しなくとも、βˆの正規分布が得 られる。

証明:(15)式、(16)式の結果を(12)式に代入・整理すればよい。

漸近分散がとても複雑データから推定するには ?

 ホワイトの頑健分散 :漸近分散(19)式は、次式で推定できる。 H = Cˆ

n( ˆσ2

X)2

, σˆ2X = 1 n

(Xi− ¯X)2

=SXX

, C =ˆ 1 n

(Xi− ¯X)2ˆu2i. (20)

これを と呼ぶ(Halbert White、色ではなく人名)

⊲ ∴ Cに含まれる観測できない を、OLSの結果得られる で置

き換え。White1980)はplim ˆC = Cを証明。

⊲ 上式を書き換えれば、 よりシンプルに。 H = n

2

nS2X X 1 n

(Xi− ¯X)2ˆu2i = 1 S2X X

(Xi− ¯X)2ˆu2i. (21)

⊲ ホワイトの分散推定に基づけば、βˆの は s.e.( ˆβ)H =

√H = S1

X X

(Xi− ¯X)2ˆu2i. (22)

たいていの統計ソフトのOLSコマンドには、ホワイトの標準誤差を求めるオプショ ンがついている。(gretlの「頑健な標準誤差」。)

2.2 正規近似を利用した仮説検定

 漸近分布(18)式とホワイトの分散推定(18)式を使えば、OLSの分布は

ˆβ∼ N(β, H).a (23)

⊲ ∴近似的に、次式が成立。

Z = ∼ N(0, 1).a (24)

⊲ β に 仮 説 値 を 与 え れ ば 、 標 準 正 規 分 布 の 臨 界 値 z = 1.96 ≈ 2を 使って 仮 説 検 定

( )ができる。

 漸近分布による近似 :手順は通常のt検定と全く同じ。 違いは標準誤差の計算法だけ。 1. 未知の係数に帰無仮説H0: β = β0を置く。

2. 仮説値のもとで を計算。

Z0= βˆ− β0

H . (25)

(5)

3. |Z0| > 1.96 ⇒ H0: β = β0を棄却する、|Z0| < 1.96 ⇒ H0:を棄却しない。

 Remark:現在の実証分析では、「OLS+ホワイトの標準誤差」 が主流。

講義ノート#09の、均一分散を前提とした標準誤差

s.e.( ˆβ) =

s2 SX X =

s

S

X X

, s2= 1 n− 2



(Yi− ˆY)2 (26)

は、不均一分散の場合、誤った標準誤差。あまり使わない。(データが均一分散の 保証がないので、 危なくて使えない。)

⊲ 一方ホワイトの標準誤差は、 均一分散だろうが不均一分散だろうが、 いつでも正し い 。コチラの計算法を使うべき。

⊲ t値(Z値)の分母は標準誤差。∴標準誤差の計算方式が、 の判断 を変えてしまう可能性 !

 例:マンション価格の回帰分析(講義ノート#12#14)の、標準誤差・t値の計算法を再 考。被説明変数はマンション価格。

通常の分散 ホワイトの分散 係数 標準誤差 t値 標準誤差 t

定数項 1896.26 189.09 10.03 159.32 11.90

駅までの時間 -36.79 10.01 -3.68 8.92 -4.13

築年数 -61.30 4.59 -13.35 3.62 -16.92

面積 60.14 2.21 27.19 2.69 22.36

1ルーム -544.81 161.23 -3.38 111.23 -4.90

¯

R2 0.89

n 194

全てgretlで計算。

⊲ 分散の推定方式次第で、標準誤差・t値が大幅に変わる。ホワイトの頑健なバージョ ンをレポートすべき。(幸い)この例では、どちらの標準誤差でも全ての係数が統計 的に有意。

⊲ 均一分散ならば、通常の標準誤差とホワイトの標準誤差にあまり差が出ないはず。∴ 標準誤差の比較は、 均一分散の仮定が正しいか否かの簡便なチェックになる。

 Remark:根源的仮定FA1(外生性)、FA2(標本の独立性) を前提にした新しい回帰分

析の世界(講義ノート#18以降)⇒OLSは、かなり広範なデータに適用可能 !

⊲ 回帰係数の推定方法は ?実質は 。

⊲ OLS推定の性能は? 。ただし有効性(最小分散)は不明。

有意性の検定は ? (近似)による検定。 と標準誤差、t値。

⊲ ∴分析者がやるべき作業自体(OLS推定有意性検定)は、古典的仮定のときとあ まり変わらない。

(6)

まとめと復習問題

今回のまとめ

 不均一分散のもとでのOLS推定量の分散。

 OLSの漸近分布・漸近分散(ホワイトの分散推定) と、仮説検定での利用。

復習問題

出席確認用紙に解答し (用紙裏面を用いても良い)、 退出時に提出せよ。

1. なぜ通常のOLSの分散ではなく、ホワイトの分散に基づく標準誤差・t値を用いたほうが 良いのか?簡潔に説明せよ。

参照

関連したドキュメント

自分の親のような親 子どもの自主性を育てる親 厳しくもあり優しい親 夫婦仲の良い親 仕事と両立ができる親 普通の親.

生殖毒性分類根拠 NITEのGHS分類に基づく。 特定標的臓器毒性 特定標的臓器毒性単回ばく露 単回ばく露 単回ばく露分類根拠

「課題を解決し,目標達成のために自分たちで考

Maurer )は,ゴルダンと私が以前 に証明した不変式論の有限性定理を,普通の不変式論

Maurer )は,ゴルダンと私が以前 に証明した不変式論の有限性定理を,普通の不変式論

ためのものであり、単に 2030 年に温室効果ガスの排出量が半分になっているという目標に留

基本目標2 一人ひとりがいきいきと活動する にぎわいのあるまちづくり 基本目標3 安全で快適なうるおいのあるまちづくり..

17‑4‑672  (香法 ' 9 8 ).. 例えば︑塾は教育︑ という性格のものではなく︑ )ット ~,..