『新しい計量経済学』鹿野研究室 slide08

(1)

計量経済学_#08

古典的回帰モデル ₍₁₎

鹿野繁樹

大阪府立大学

2017 年 10 月更新

(2)

Outline

1 回帰分析の古典的仮定

2 回帰係数の_{OLS 推定}

テキスト：鹿野繁樹 [2015]、第 5.1 章・第 5.2 章。

前回の復習

1 OLS 回帰と OLS 残差

2 _決定係数

(3)

Section 1 回帰分析の古典的仮定

(4)

線形回帰モデル：回帰直線と確率誤差の出会い

前回までの復習：二次元データ_(X_i_{, Y}_i) の関係を、OLS 回帰 Yˆ_i = a^∗+ b^∗X_i. (1)

で分析。

回帰直線の散布図へのフィット（残差2 乗和 = 予測誤差の最小化）で_{OLS 係数 a}^∗_{, b}^∗を決定。

a^∗ = ¯Y − b^∗X,^¯ b^∗ = ^S^XY S_XX ⁼

(Xi− ¯X)(Yi − ¯Y)

(Xi− ¯^X)² ^. ⁽²⁾ ... いくら努力しても、OLS 残差 ˆu_i = Y_i− ˆY_i^が残る。⇒ 説明変数_X_iだけで被説明変数_Y_iの変動を説明するのは、ムリ！

(5)

あらかじめ誤差を認め、_Y_iは線形回帰モデルに従って変動すると仮定。

仮定 _{1 (} 線形回帰モデル ₎

Y_i = α + βXi+ ui^, ⁱ= 1, 2, . . . , n. (CA0) u_i^{は誤差項。説明変数}X_i^{で説明できない}Y_i^{のバラつきをと} らえた確率変数。（誤差項_u_i _{=OLS 残差 ˆ}_u_i。）

∴Y_iの変動・個体差の要因：

データとして観測できる_X_iの違い。観測不能な確率的ノイズ_u_i。

改めて、切片α（アルファ）、傾き β（ベータ）を^{回帰係数と} 呼ぶ。

(6)

統計的推測（講義ノート#04・#05）の立場で考えると？

母集団モデル= 回帰モデル (CA0)：標本 (Xi^{, Y}i) の観測プロセスを表現。

未知の母数= 回帰係数 α と β：推定・検定の対象。

(CA0) 式に従って変動する標本 (Xi^{, Y}i) を収集・分析 ⇒ さかのぼって_α, β の値を推測することができるはず！

(7)

Remark 1

回帰係数α, β の統計的推測。

Y_i = α + βXi+ ui 母集団（母数_{α, β）}

↓ ↑

標本を観測_↓ ↑ α, β の推定・仮説検定

↓ ↑

(X1, Y1), (X2, Y2), . . . , (X_n, Y_n)

標本

(8)

古典的回帰モデル

以降、古典的仮定（classical assumption，CA）を満たす標本を想定。

仮定 _{2 (} 回帰分析の古典的仮定 ₎

非確率的な説明変数： _X1, X2, . . . , X_n^はn 個の定数, (CA1) 期待値はゼロ： _E(u_i_{) = 0,} _(CA2) 母分散の均一性： _Var(u_i_{) = E(u}

2 i^{) = σ}

2, _(CA3) 独立標本⇒ 無相関： Cov(ui^{, u}j) = E(ui^uj) = 0, (CA4)

正規性_{: u}_i _{∼ N(0, σ}

2). (CA5)

これらの仮定を満たすとき、_{(CA0) 式は}古典的回帰モデルと呼ばれる。

(9)

仮定(CA2) から仮定 (CA5) は誤差項 uiに関する仮定。標本の誤差モデル（講義ノート_{#04）とほぼ同様。}

仮定(CA2) と (CA5)：uiは、ゼロの周りに分布する確率的ノイズ。

仮定(CA3) と仮定 (CA5) の σ²^は、^ui^{の母分散。}

注意：仮定_(CA2)より_E(u_i_{) = 0}なので，_u_iの分散は

σ² = Var(u_i) = E(u_i− E(u_i))² = E(u²_i). (3)

∴単に_u

2

i ^{の期待値。}

仮定(CA4)：同様の理由で、仮定 (CA2) の誤差項の共分散は Cov(ui^{, u}j) = E(ui^uj) = 0。

(10)

仮定(CA1) について：なぜ Xi^{を非確率変数とする？}⇒ 回帰分析が、実験データ（講義ノート#01）の解析で発展したことに由来。

実験で、分析者が_{n 通りの X}_iの値_{x₁_{, x}₂, . . . , x_n_{}（例えば薬} 品投与量）を被験者i に与え、それを受けて Y_i^{（例えば血圧）} の個体差が生じた状況を想定。

∴_Y_iを観測する前から_X_iの値は確定。_{⇒ X}_iは非確率変数！ ... 経済学で使う非実験データには、合わない仮定。あくまで分析の簡単化のための仮定。

(11)

古典的仮定のもとで、_Y_iの振る舞いは？

期待値：(CA0) 式の期待値は、仮定 (CA1) と仮定 (CA2) より E(Yi) = Eα + βXi+ ui = α + βXi+ E(ui)

=0

= α + βXi^.

（仮定_{(CA1) より X}_iは定数なので、_E(X_i_{) = X}_i。）

分散：_Y_i_{− E(Y}_i_{) = α + βX}_i_{+ u}_i_{− (α + βX}_i_{) = u}_iなので、仮定_{(CA3) より}

Var(Yi) = E(Yi− E(Yi))² = E(u²_i)

=_σ2

= σ².

X_i^{に依存せず、母分散}σ²^で一定。分布型：仮定_{(CA5) の u}_i _{∼ N(0, σ}

2) の中心を定数（母平均） E(Yi) = α + βXi^{だけシフト}⇒ 正規分布に関する公式（講義ノート_#03）より

Y_i ∼ N(α + βXi^{, σ} 2).

(12)

古典的回帰モデルは結局、「_X_iに依存して期待値がシフトする_Y_i の正規母集団」！

公式 ₁

古典的回帰モデルは、次式の構造を持つ正規母集団である。 Y_i ∼ N(α + βX_i, σ²), E(Y_i) = α + βX_i

期待値（_Xiに依存）

, Var(Y_i) = σ²

母分散（一定）

. (4)

証明：前段で証明済み。

図1：β > 0 の古典的回帰モデルを、(Xi^{, Y}i) 平面上に描いたイメージ。

X_i^{の値で期待値}E(Yi) の位置が決まり、次いで誤差 ui^が加わ

ることで_E(Y_i_{) を中心に Y}_iの正規分布が形成。

同じ_X_iの値を持つ個体でも、_u_iの違いで_Y_iの観測に差異が生じる。

(13)

0.0 0.2 0.4 0.6 0.8 1.0

01234

Xi

Yi

α + βXi

ui~N(0,σ²)

図_{1 :} 古典的回帰モデル_Y_i _{= α + βX}_i_{+ u}_i，_u_i_{∼ N(0, σ}

2)

(14)

発想の転換

OLS 回帰：まず散布図に n 個の観測点 (Xi^{, Y}i) があり、そこに回帰直線_Yˆ_i _{= a + bX}_iをフィットさせる。

古典的回帰モデル：まずモデル(CA0) があり、モデルから n 組の_(X_i_{, Y}_i) が発生する。⇒ いかにして (X_i, Y_i) から α と β をリカバーするか？∴ 回帰係数の推定。

Remark 2

OLS 回帰（前回まで）と古典的回帰モデル（今回から）の違い。 OLS 回帰：はじめにデータありき。所与の散布図 (Xi^{, Y}i) に、回帰式_Yˆ_i _{= a + bX}_iを当てはめ。∴ 記述統計の一種。

古典的回帰モデル：はじめにモデルありき。モデル_{(CA0) か} ら_(X_i_{, Y}_i_{) が発生。⇒ (X}_i_{, Y}_i) から α と β を推定するには？

(15)

Section 2 回帰係数の _OLS 推定

(16)

OLS ^推定量

回帰係数α, β の推定量として、何がふさわしいか？⇒OLS 係数 a^∗, b^∗を「とりあえず」採用してみる。

ˆ

α= ¯Y − ˆβ ¯X, β^ˆ= ^S^XY

S_XX^. ⁽⁵⁾ このとき_{α, ˆ}_ˆ β（OLS）を、α, β のOLS 推定量^と呼ぶ。

根拠：回帰直線と線形回帰モデルは見た目が良く似ている！

⇒OLS 係数を使うとうまく行きそう？

... OLS は、望ましい推定量の採用基準（不偏性と有効性、講義ノート#05）を満たすか？⇒ コレを調べるには、いくつかの準備が必要。

(17)

公式 _{2 (} 偏差 ₂ 乗和・偏差積和の別表現：その ₂₎

S_XX =(Xi− ¯X)Xi^, ^SXY =(Xi− ¯X)Yi^. (6) 証明：講義ノート_{#07 より}_(X_i_{− ¯}X) = 0 なので、

S_XY =(X_i− ¯X)(Y_i− ¯Y)

= (Xi− ¯X)Yi− (Xi− ¯X) ¯Y

=(Xi− ¯X)Yi− ¯Y (Xi − ¯X)

=0

=(Xi− ¯X)Yi^.

S_XX^{に関しては復習問題。}

(18)

(5) 式の ˆβ の分子 S_XY ^に(6) 式を代入し変形すると、 βˆ= ¹

S_XX

(X_i− ¯X)Y_i =^Xⁱ^{− ¯}^X S_XX

Y_i

=w_iY_i, w_i = ^Xⁱ^{− ¯}^X

S_XX ^. ⁽⁷⁾ 上式の_w₁_{, w}₂, . . . , w_n^を_{OLS ウェイト}^と呼ぶ。

(19)

公式 _{3 (OLS} 推定量の線形性 ₎

β は、ˆ _{OLS ウェイト w}_i^によるY_i^{の加重和。}

βˆ=w_iY_i = w¹Y1_{+ w}2Y2+ · · · + wn^Yn^, ^wi = ^Xⁱ^{− ¯}^X S_XX ^. ⁽⁸⁾ 証明：前段で証明済み．

∴ ˆ_{β は、w}_iをウェイトとする_Y_iの一次式。一般に線形推定量と呼ばれる。

標本平均も Y¯ = ¹

n

Y_i = ¹ n^Y¹⁺

1

n^Y²^{+ · · · +} 1 n^Yⁿ と書けば、均等なウェイト

1

nの線形推定量と解釈できる。

(20)

OLS ウェイト wi^{の三つの性質}⇒ 今後頻繁に利用。

公式 _{4 (OLS} ウェイトの性質 ₎

和はゼロ_:

w_i = 0, (9) X_i^{との積和は}1 : w_iX_i = 1, (10) 2 乗和は SXX^の逆数: ^w²_i = ¹

S_XX^. ⁽¹¹⁾

(21)

証明：前回の_(X_i_{− ¯}_{X) = 0、S}_XX ₌_(X_i_{− ¯}_X)

2

（定義式）、および公式_{(6) を使えば}

w_i =^Xⁱ^{− ¯}^X S_XX ⁼

1 S_XX

(Xi− ¯X)

=0

= 0.

w_iX_i =^(Xⁱ^{− ¯}^X) S_XX ^Xⁱ ⁼

1 S_XX

(Xi− ¯X)Xi

=_SX X

= 1.

w²_i ₌^(Xⁱ^{− ¯}^X)

2

S_XX² ⁼ 1 S_XX²

(Xi− ¯^X)²

=_S_{X X}

= ¹ S_XX^.

(22)

OLS ^{推定量の期待値と分散}

公式_{(8) の Y}_iに回帰モデル(CA0) を代入し、展開・整理すると βˆ=w_iY_i =w_i(α + βXi + ui)

= α^wi

=0

+β^wi^Xi

=1

+^wi^ui

= β +^wi^ui^. (12) ただし公式(9) と公式 (10) を利用。

∴_{OLS 推定量 ˆ}β は、真の β の周りを誤差の加重和 w_iu_i^だけバラつく確率変数。一般に_β^ˆ_{= β。}

標本平均の誤差表現（講義ノート#04）と本質的に同じ！

(23)

Remark 3

推定量の誤差表現：多くの推定問題において、未知の母数_{θ とそ} の推定量 ˆθ は正確に、または近似的に

θˆ= θ + 推定の誤差.

∴ ˆθ の性質を調べる際に便利。

例：標本_X_iによる_{µ の推定で、 ¯}_X _{= µ +}

1 n^uⁱ^。

例：二次元標本_(X_i_{, Y}_i) による β の OLS 推定で、 βˆ= β + w_iu_i^。

(24)

(12) 式の推定誤差 w_iu_i^{の期待値：仮定}(CA1) より wi^{は非確率、}

仮定(CA2) より E(u_i) = 0 なので Ew_iu_i= w¹E(u¹)

=0

+w²E(u²) + · · · + wnE(un) = 0. (13)

(25)

w_iu_i^{の分散：仮定}(CA4)（独立標本）および仮定 (CA3) により、 Varw_iu_i= Var (w¹u1_{+ w}2u2+ · · · + wn^un)

= Var(w¹u1_{) + Var(w}2u2) + · · · + Var(wn^un)

= w1²Var(u¹)

=_σ2

+w2²Var(u²) + · · · + w_n²Var(un)

= w1²σ² + w²2σ²+ · · · + w²_nσ² = σ²w²_i. (14)

（講義ノート#02：定数を分散記号の外に出すときは、2 乗で。）さらに公式_{(11) を使えば}

Varw_iu_i= σ²w_i² = ^σ

2

S_XX^. ⁽¹⁵⁾

(26)

よって(12) 式から、 ˆβ の期待値・分散は E( ˆβ) = Eβ+w_iu_i= E(β)

β

+ Ew_iu_i

=0

= β, (16)

Var( ˆ^β) = Var^β+^wi^ui

= Var(β)

=0

+ Var^wi^ui

=_σ2_/S_{X X}

= ^σ

2

S_XX^. (17)

(27)

公式 _{5 (OLS} 推定量 _β ˆ の期待値・分散 ₎

古典的仮定(CA1) ∼ (CA4) を満たす標本ならば、 E( ˆβ) = β, Var( ˆβ) = ^σ

2

S_XX ⁼

σ²

(Xi− ¯X)²^. ⁽¹⁸⁾ 証明：前段で証明済み。

E( ˆβ) = β より、OLS ˆβ は回帰係数 β の不偏推定量。

(n − 1)s²_X = SXX =(Xi− ¯^X)²^{を利用して分散}Var( ˆ^β) の分母を変形すると

Var( ˆβ) = ^σ

2

(n − 1)s²_X^. ⁽¹⁹⁾

∴ サンプル数n が大きいほど_{Var( ˆ}β) が減少 =OLS 推定の精度が向上！

α のOLS ˆα も、同様の性質を持つ。テキストp81 参照。

(28)

ガウス・マルコフの定理： _OLS の有効性

回帰係数の不偏推定量は、実はOLS 以外にも存在。

不偏性の基準_{E( ˜}β) = β を満たす推定量 ˜β を設計する方法は、無限にある。（詳細はテキストp81∼p82 参照。）

不偏性の意味で同性能の推定量が複数ある場合、第二の基準・有効性（最小分散、講義ノート_{#05）を問う。}

OLS ˆβ は、最小分散の不偏推定量か？

(29)

答え：OLS よりも分散（ブレ）の小さい不偏推定量を作ることは、不可能！

公式 _{6 (} ガウス・マルコフの定理 ₎

古典的仮定(CA1) ∼ (CA4) が成立するならば、OLS 推定量 ˆβ の分散は、β の線形不偏推定量の中で最小となる。

E( ˆβ) = β, Var( ˆβ) = σ²w_i² = ^σ

2

S_XX ^<^{Var( ˜}^β). ⁽²⁰⁾ ただしβ は任意の線形不偏推定量。˜

証明：テキスト_{p93 参照。}

OLS が統計ソフトに実装されている理由：^{有効性（最小分散）}^。

(30)

Remark 4

OLS 推定量が採用される理由 = ガウス・マルコフの定理。 OLS 推定量 ˆ^α, ˆ^{β は、回帰係数 α}, β の最小分散の線形不偏推定量。

単なる不偏推定量ではない。有効性（分散）の基準で優れている。

ガウス・マルコフの定理（OLS の有効性・最小分散）は、データが古典的仮定を満たすことを前提とする。

古典的仮定に従わないデータでは、OLS 以外の推定法が最適になるかも？

(31)

今回の復習問題

次の設問に答えよ。各自用意した紙に解答し、退出時に提出せよ。講義名、日付、学籍番号、氏名を明記すること。

1 _公式_{2、(6) 式の、S}

XX に関するパートを証明せよ。

2 _{テキスト第}5 章復習問題 5.1。

(32)

References

鹿野繁樹. 新しい計量経済学. 日本評論社, 2015.

『新しい計量経済学』 鹿野研究室 slide08

古典的回帰モデル (1)

Outline

前回の復習

Section 1

回帰分析の古典的仮定

線形回帰モデル：回帰直線と確率誤差の出会い

仮定 1 ( 線形回帰モデル )

Remark 1

古典的回帰モデル

仮定 2 ( 回帰分析の古典的仮定 )

公式 1

Remark 2

Section 2

回帰係数の OLS 推定

OLS 推定量

公式 2 ( 偏差 2 乗和・偏差積和の別表現：その 2)

公式 3 (OLS 推定量の線形性 )

公式 4 (OLS ウェイトの性質 )

OLS 推定量の期待値と分散