担当:鹿野(大阪府立大学) 2013 年度後期
はじめに
前回の復習
OLS予測とOLS残差。
決定係数R2。
今回学ぶこと
回帰モデルと回帰分析の古典的仮定。
OLS推定量の確率的性質 :不偏性とガウス・マルコフの定理。
テキスト該当箇所 :3.1∼3.3章。講義ノート#04が非常に役立つので、 参照のこと。
1 古典的仮定
1.1 線形回帰モデル
回帰直線Yˆi = a + bXiをOLS推定→OLS残差(予測誤差)ˆuiが発生。
Yi= ˆYi+ ˆui = a∗+ b∗Xi+ ˆui (1)
⊲ 通常、回帰直線で被説明変数Yiの変動・個体差を全て捉えるのはムリ。
線形回帰モデル:あらかじめ誤差の存在を認め、XiとYiの関係を
Yi = α + βXi+ ui, i = 1, 2, . . . , n (2)
と定式化。これを と呼ぶ。
⊲ 切片α、傾きβを と呼ぶ。未知の母数。
⊲ uiはYiの直線α + βXiからの確率的なズレで、 と呼ぶ。(注意:OLS残差
ˆuiではないので、 区別。)
⊲ ∴回帰モデルは、 データとして観測されたYiの個体差を
Yiの個体差= Xiの違いに起因する部分+確率的な誤差ui (3) と表現。
1
Yi = µ
共通の典型値
+ ui
誤差
, i = 1, 2, . . . , n. (4)
⊲ 一方(2)式は
Yi = α + βXi
Xiに依存・個体差
+ ui
誤差
, i = 1, 2, . . . , n. (5)
∴回帰モデルは、Xiに応じてYiの母平均が変化するモデル。(どう変化するかは係 数βの符号次第。)誤差モデルの一般化。
1.2 回帰分析の古典的仮定
古典的仮定 :以下、回帰モデル(2)式の説明変数Xiと誤差項uiに、次の仮定を置く。 こ れらをまとめて回帰分析の (classical assumption) と呼ぶ。CA2∼CA4は 講義ノート#04で、CA5は講義ノート#05で置いた仮定と全く同じ。
⊲ CA1:説明変数Xiは、非確率変数。普通の数字として扱う。(今回初登場!)
⊲ CA2:E(ui) = 0。
⊲ CA3:Var(ui) = E(u2i) = σ2、σ2は未知の母分散。
⊲ CA4:u1,u2, . . . ,unは独立→ Cov(ui,uj) = E(uiuj) = 0。(独立標本→無相関。)
⊲ CA5:ui ∼ N(0, σ2)。(正規母集団。)
Remark:CA1(Xiが非確率的)の由来・意味・効能
⊲ CA1は、回帰分析が の解析から生まれた歴史的背景に由来。
⊲ 分析者があらかじめq通りのXiの値x(1),x(2), . . . ,x(q)を観測個体(被験者)に与え、
「介入による効果+確率誤差」 でYiの個体差が生じた、 という状況を想定。
⊲ (Xi,Yi)が同時にサンプリングされる (講義ノート#01)では、CA1 は不自然・不満足な仮定。⇒しかし、OLS推定量の確率的性質が圧倒的に簡単に。
古典的回帰モデル :仮定CA1∼CA4の下で、(2)式の期待値・分散は
E(Yi) = E(α + βXi+ ui) = α + βXi+ E(ui) = α + βXi, (6) Var(Yi) = E(Yi− E(Yi))2= E(α + βXi+ ui− α − βXi)2= E(u2i) = σ2. (7)
∴Yiの期待値はXiに依存、しかし分散はσ2で一定。
⊲ さらにCA5よりYi = α + βXi+ uiの分布は、ui ∼ N(0, σ2)をα + βXiだけズラすと
Yi∼ N(α + βXi, σ2). (8)
∴ Xiに依存して母平均(重心)がシフトする正規分布。CA5が無いとYiの分布型が 決まらない。図1参照(β >0のケース)。
⊲ CA1∼CA5の下での回帰モデルを、 と呼ぶ。
0.0 0.2 0.4 0.6 0.8 1.0
01234
Xi
Yi
α + βXi
ui~N(0,σ2)
図1:古典的回帰モデルの例Yi= α + βXi+ ui、ui ∼ N(0, σ2)
2 OLS 推定量の確率的性質
2.1 回帰係数α, β の OLS 推定
未知の回帰係数α, βを、試しにOLS推定量b∗= SXY
SXX
、a∗= ¯Y − ˆβ ¯Xで推定してみる。 β =?, α =?, OLS 推定 a
∗,b∗
−−−−−−−−−−−−→ β =ˆ SXY
SXX, α = ¯ˆ Y − ˆβ ¯X. (9)
⊲ 古典的回帰モデルでは、 標本Yi(= α + βXi+ ui)は確率変数。→標本平均Y¯、偏差積 和SXYに依存するα, ˆˆ βもまた、確率変数。
⊲ α, ˆˆ βはどんな確率的性質 (期待値や分散) を持つ?α, βの推定にふさわしい ?
偏差積和SXYの別表現「その2」:(Xi− ¯X) = 0(講義ノート#06)に注意して偏差積和の 定義を変形すると
SXY= (Xi− ¯X)(Yi− ¯Y) = (Xi− ¯X)Yi− (Xi− ¯X) ¯Y
=
(Xi− ¯X)Yi− ¯Y (Xi− ¯X)
=0
= . (10)
⊲ 同様に、偏差2乗和も次の表現が可能。 SXX=
(Xi− ¯X)Xi, SYY =
(Yi− ¯Y)Yi. (11)
⊲ 別表現「その1」は?→講義ノート#06参照。
OLSウェイトとβˆの線形性:SXYの別表現を使ってOLS推定量βˆを変形すると ˆβ = 1
SXX
(Xi− ¯X)Yi = Xi− ¯X SXX
Yi = wiYi, wi= Xi− ¯X
SXX . (12)
ここでwiを と呼ぶ。
データの加重和(1次式)で得られる推定量を一般に、 線形推定量と呼ぶ。
OLSウェイトwiの性質:次式が成立。
1. 。講義ノート#06より(Xi− ¯X) = 0なので、 wi= Xi− ¯X
SXX = 1 SXX
(Xi− ¯X)
=0
= 0. (14)
2. 。(10)式を使えば wiXi=
(Xi− ¯X)Xi SXX =
1 SXX
(Xi− ¯X)Xi
=SXX
= 1. (15)
3. 。偏差2乗和の定義SXX=(Xi− ¯X)2より
w2i =
(Xi− ¯X)2 S2XX =
1 S2XX
(Xi− ¯X)2
=SXX
= 1 SXX
. (16)
2.2 OLS推定量の期待値と分散
OLS推定量βˆと回帰係数βの関係:(12)式のYiに回帰モデル(2)式を代入すると β =ˆ wiYi=
wi(α + βXi+ ui) = α wi
=0
+β
wiXi
=1
+
wiui = . (17)
∴ ˆβは、βの周りを推定誤差 wiui(uiの加重和)の分だけバラつく確率変数。
⊲ (17)式は、講義ノート#04で標本平均と母平均の関係を Y = µ +¯ 1
n
ui (18)
と書けたのと似ている !
⊲ 多くの確率モデルでは、 標本からデザインした推定量 ˆθとターゲットである未知の 母数θの関係を(正確にor近似的に)
推定量ˆθ =未知母数θ +確率的な推定誤差 (19) と表現できる。ˆθの確率的性質を調べるのに、 とても便利。
OLS推定量βˆの期待値:ˆβの期待値は
E( ˆβ) = β. (20)
∴ ˆβはβの不偏推定量(講義ノート#04)。
⊲ 証明:CA1よりXi(wi)は非確率、CA2よりE(ui) = 0。よって(17)式の期待値は E( ˆβ) = Eβ + wiui
= β + E
wiui
= β +
wiE(ui) = β. (21)
OLS推定量βˆの分散:βˆの分散は、
Var( ˆβ) = σ
2
SXX. (22)
⊲ 証明:(20)式よりE( ˆβ) = βなので、(17)式よりβ − E( ˆβ) = ˆβ − β =ˆ wiui。よって
Var( ˆβ) = E( ˆβ − E( ˆβ))2= E wiui
2
= E(w1u1+ · · · + wnun)2
= E [(w1u1+ · · · + wnun)(w1u1+ · · · + wnun)]
= E[w21u21+ · · · + w2nu2n
n 個の2 乗項 w2iu2i
+ w1w2u1u2+ · · · + wn−1wnun−1un
n(n − 1) 個の交差項 wiwjuiuj
].
(23) CA3よりE(u2i) = σ2、CA4よりE(uiuj) = 0なので
Var( ˆβ) = (w21σ2+ · · · + w2nσ2) + (0 + · · · + 0) = σ2 w2i. (24) OLSウェイトの性質3を使うと
Var( ˆβ) = σ2 w2i = σ2 1
SXX. (25)
Remark:OLS推定量βˆの期待値と分散をまとめると
E( ˆβ) = , Var( ˆβ) = . (26)
⊲ ˆβはβの 。ˆβは確率変数だが、β(=「当たり」)ぐらいが出やすい。
⊲ Xiの標本分散s2X = n−11 SXX = n−11 (Xi− ¯X)2に注意すれば、分散は Var( ˆβ) = σ
2
(n − 1)s2X. (27)
∴ が大きいほど、 が多いほど、ˆβの精度が上昇。
αのOLS推定量α = ¯ˆ Y − ˆβ ¯Xの性質は?⇒宿題#02にとっておく。 2.3 ガウス・マルコフの定理
一般的な線形不偏推定量 :適当な定数c1,c2, . . . ,cnで、適当な線形推定量を定義。
˜β = ciYi. (28)
ciをどう与えれば、 古典的仮定のもとで不偏推定量が造れる ?
= α
ci+ β ciXi. (29)
⊲ ∴ ˜βがβの不偏推定量になるための条件は
, ⇒ E( ˜β) = α ci+ β ciXi= β. (30) OLSウェイトの性質1、性質2より、wiは上の条件を満たす。
Remark:(30)式の条件を満たすようにciを取れば、βの線形不偏推定量は無限に造れる。
⊲ ∴OLS推定量に、不偏性を持つ「ライバル」が無数に存在!
⊲ 有効性(講義ノート#04)で勝負:一方β˜の分散は、(24)式のVar( ˆβ)と同じ導出法で
Var( ˜β) = σ2 c2i. (31)
OLSの分散Var( ˆβ) = σ2 w2i は、どんなVar( ˜β) = σ2 c2i よりも小さいか?
ガウス・マルコフの定理:古典的仮定のCA1∼CA4が成立するとき、OLS推定量α, ˆˆ βはα, β に対し最小分散の線形不偏推定量である。 これを と呼ぶ。
⊲ このときα, ˆˆ βは最良線形不偏推定量(best linear unbiased estimator、 )で ある、と言う。
⊲ ∴OLS推定量は、最も精度の高い不偏推定量。→CA1∼CA4が成立する限り、OLS 推定を使うのがベスト。
⊲ 最小2乗原理(予測誤差=残差2乗和の最小化) が、結果的に最高の性能を持つ推 定量を導き出す。 統計学・計量経済学で特に重要な大定理。
⊲ 証明⇒今回の補足資料。 テキストp60∼61も参照。
注意:ガウス・マルコフの定理で、CA5(誤差項の正規性)は不要。βの期待値・分散の 導出でも不要。
⊲ ∴定理に関与するCA1∼CA4だけを取り出して、 と呼ぶ。
⊲ CA5は何のために?→ βの仮説検定(次回)のために。
まとめと復習問題
今回のまとめ
古典的仮定の下での回帰モデル。
OLS推定量の確率的性質 :不偏性とガウス・マルコフの定理。
復習問題
出席確認用紙に解答し (用紙裏面を用いても良い)、 退出時に提出せよ。
1. 古典的仮定CA1∼CA4の下では、回帰係数βの線形不偏推定量は(OLS推定量βˆを含め) 無数に存在する。しかし実際の回帰分析では、その中でもβˆを使う。その根拠を、簡単に 説明せよ。