計量経済学#08
古典的回帰モデル (1)
鹿野繁樹
大阪府立大学
2017 年 10 月更新
Outline
1 回帰分析の古典的仮定
2 回帰係数のOLS 推定
テキスト:鹿野繁樹 [2015]、第 5.1 章・第 5.2 章。
前回の復習
1 OLS 回帰と OLS 残差
2 決定係数
Section 1
回帰分析の古典的仮定
線形回帰モデル:回帰直線と確率誤差の出会い
前回までの復習:二次元データ(Xi, Yi) の関係を、OLS 回帰 Yˆi = a∗+ b∗Xi. (1)
で分析。
回帰直線の散布図へのフィット(残差2 乗和 = 予測誤差の最 小化)でOLS 係数 a∗, b∗を決定。
a∗ = ¯Y − b∗X,¯ b∗ = SXY SXX =
(Xi− ¯X)(Yi − ¯Y)
(Xi− ¯X)2 . (2) ... いくら努力しても、OLS 残差 ˆui = Yi− ˆYiが残る。⇒ 説明 変数Xiだけで被説明変数Yiの変動を説明するのは、ムリ!
あらかじめ誤差を認め、Yiは線形回帰モデルに従って変動すると 仮定。
仮定 1 ( 線形回帰モデル )
Yi = α + βXi+ ui, i= 1, 2, . . . , n. (CA0) uiは誤差項。説明変数Xiで説明できないYiのバラつきをと らえた確率変数。(誤差項ui =OLS 残差 ˆui。)
∴Yiの変動・個体差の要因:
データとして観測できるXiの違い。 観測不能な確率的ノイズui。
改めて、切片α(アルファ)、傾き β(ベータ)を回帰係数と 呼ぶ。
統計的推測(講義ノート#04・#05)の立場で考えると?
母集団モデル= 回帰モデル (CA0):標本 (Xi, Yi) の観測プロセ スを表現。
未知の母数= 回帰係数 α と β:推定・検定の対象。
(CA0) 式に従って変動する標本 (Xi, Yi) を収集・分析 ⇒ さか のぼってα, β の値を推測することができるはず!
Remark 1
回帰係数α, β の統計的推測。
Yi = α + βXi+ ui 母集団(母数α, β)
↓ ↑
標本を観測↓ ↑ α, β の推定・仮説検定
↓ ↑
(X1, Y1), (X2, Y2), . . . , (Xn, Yn)
標本
古典的回帰モデル
以降、古典的仮定(classical assumption,CA)を満たす標本を 想定。
仮定 2 ( 回帰分析の古典的仮定 )
非確率的な説明変数: X1, X2, . . . , Xnはn 個の定数, (CA1) 期待値はゼロ: E(ui) = 0, (CA2) 母分散の均一性: Var(ui) = E(u
2 i) = σ
2, (CA3) 独立標本⇒ 無相関: Cov(ui, uj) = E(uiuj) = 0, (CA4)
正規性: ui ∼ N(0, σ
2). (CA5)
これらの仮定を満たすとき、(CA0) 式は古典的回帰モデルと 呼ばれる。
仮定(CA2) から仮定 (CA5) は誤差項 uiに関する仮定。標本の誤差 モデル(講義ノート#04)とほぼ同様。
仮定(CA2) と (CA5):uiは、ゼロの周りに分布する確率的ノ イズ。
仮定(CA3) と仮定 (CA5) の σ2は、uiの母分散。
注意:仮定(CA2)よりE(ui) = 0なので,uiの分散は
σ2 = Var(ui) = E(ui− E(ui))2 = E(u2i). (3)
∴単にu
2
i の期待値。
仮定(CA4):同様の理由で、仮定 (CA2) の誤差項の共分散は Cov(ui, uj) = E(uiuj) = 0。
仮定(CA1) について:なぜ Xiを非確率変数とする?⇒ 回帰分析 が、実験データ(講義ノート#01)の解析で発展したことに由来。
実験で、分析者がn 通りの Xiの値{x1, x2, . . . , xn}(例えば薬 品投与量)を被験者i に与え、それを受けて Yi(例えば血圧) の個体差が生じた状況を想定。
∴Yiを観測する前からXiの値は確定。⇒ Xiは非確率変数! ... 経済学で使う非実験データには、合わない仮定。あくまで 分析の簡単化のための仮定。
古典的仮定のもとで、Yiの振る舞いは?
期待値:(CA0) 式の期待値は、仮定 (CA1) と仮定 (CA2) より E(Yi) = Eα + βXi+ ui = α + βXi+ E(ui)
=0
= α + βXi.
(仮定(CA1) より Xiは定数なので、E(Xi) = Xi。)
分散:Yi− E(Yi) = α + βXi+ ui− (α + βXi) = uiなので、仮 定(CA3) より
Var(Yi) = E(Yi− E(Yi))2 = E(u2i)
=σ2
= σ2.
Xiに依存せず、母分散σ2で一定。 分布型:仮定(CA5) の ui ∼ N(0, σ
2) の中心を定数(母平均) E(Yi) = α + βXiだけシフト⇒ 正規分布に関する公式(講義 ノート#03)より
Yi ∼ N(α + βXi, σ 2).
古典的回帰モデルは結局、「Xiに依存して期待値がシフトするYi の正規母集団」!
公式 1
古典的回帰モデルは、次式の構造を持つ正規母集団である。 Yi ∼ N(α + βXi, σ2), E(Yi) = α + βXi
期待値(Xiに依存)
, Var(Yi) = σ2
母分散(一定)
. (4)
証明:前段で証明済み。
図1:β > 0 の古典的回帰モデルを、(Xi, Yi) 平面上に描いた イメージ。
Xiの値で期待値E(Yi) の位置が決まり、次いで誤差 uiが加わ
ることでE(Yi) を中心に Yiの正規分布が形成。
同じXiの値を持つ個体でも、uiの違いでYiの観測に差異が 生じる。
0.0 0.2 0.4 0.6 0.8 1.0
01234
Xi
Yi
α + βXi
ui~N(0,σ2)
図1 : 古典的回帰モデルYi = α + βXi+ ui,ui∼ N(0, σ
2)
発想の転換
OLS 回帰:まず散布図に n 個の観測点 (Xi, Yi) があり、そこに 回帰直線Yˆi = a + bXiをフィットさせる。
古典的回帰モデル:まずモデル(CA0) があり、モデルから n 組の(Xi, Yi) が発生する。⇒ いかにして (Xi, Yi) から α と β をリカバーするか?∴ 回帰係数の推定。
Remark 2
OLS 回帰(前回まで)と古典的回帰モデル(今回から)の違い。 OLS 回帰:はじめにデータありき。所与の散布図 (Xi, Yi) に、 回帰式Yˆi = a + bXiを当てはめ。∴ 記述統計の一種。
古典的回帰モデル:はじめにモデルありき。モデル(CA0) か ら(Xi, Yi) が発生。⇒ (Xi, Yi) から α と β を推定するには?
Section 2
回帰係数の OLS 推定
OLS 推定量
回帰係数α, β の推定量として、何がふさわしいか?⇒OLS 係数 a∗, b∗を「とりあえず」採用してみる。
ˆ
α= ¯Y − ˆβ ¯X, βˆ= SXY
SXX. (5) このときα, ˆˆ β(OLS)を、α, β のOLS 推定量と呼ぶ。
根拠:回帰直線と線形回帰モデルは見た目が良く似ている!
⇒OLS 係数を使うとうまく行きそう?
... OLS は、望ましい推定量の採用基準(不偏性と有効性、講 義ノート#05)を満たすか?⇒ コレを調べるには、いくつか の準備が必要。
公式 2 ( 偏差 2 乗和・偏差積和の別表現:その 2)
SXX =(Xi− ¯X)Xi, SXY =(Xi− ¯X)Yi. (6) 証明:講義ノート#07 より(Xi− ¯X) = 0 なので、
SXY =(Xi− ¯X)(Yi− ¯Y)
= (Xi− ¯X)Yi− (Xi− ¯X) ¯Y
=(Xi− ¯X)Yi− ¯Y (Xi − ¯X)
=0
=(Xi− ¯X)Yi.
SXXに関しては復習問題。
(5) 式の ˆβ の分子 SXY に(6) 式を代入し変形すると、 βˆ= 1
SXX
(Xi− ¯X)Yi = Xi− ¯X SXX
Yi
=wiYi, wi = Xi− ¯X
SXX . (7) 上式のw1, w2, . . . , wnをOLS ウェイトと呼ぶ。
公式 3 (OLS 推定量の線形性 )
β は、ˆ OLS ウェイト wiによるYiの加重和。
βˆ=wiYi = w1Y1+ w2Y2+ · · · + wnYn, wi = Xi− ¯X SXX . (8) 証明:前段で証明済み.
∴ ˆβ は、wiをウェイトとするYiの一次式。一般に線形推定 量と呼ばれる。
標本平均も Y¯ = 1
n
Yi = 1 nY1+
1
nY2+ · · · + 1 nYn と書けば、均等なウェイト
1
nの線形推定量と解釈できる。
OLS ウェイト wiの三つの性質⇒ 今後頻繁に利用。
公式 4 (OLS ウェイトの性質 )
和はゼロ:
wi = 0, (9) Xiとの積和は1 : wiXi = 1, (10) 2 乗和は SXXの逆数: w2i = 1
SXX. (11)
証明:前回の(Xi− ¯X) = 0、SXX =(Xi− ¯X)
2
(定義式)、お よび公式(6) を使えば
wi =Xi− ¯X SXX =
1 SXX
(Xi− ¯X)
=0
= 0.
wiXi =(Xi− ¯X) SXX Xi =
1 SXX
(Xi− ¯X)Xi
=SX X
= 1.
w2i =(Xi− ¯X)
2
SXX2 = 1 SXX2
(Xi− ¯X)2
=SX X
= 1 SXX.
OLS 推定量の期待値と分散
公式(8) の Yiに回帰モデル(CA0) を代入し、展開・整理すると βˆ=wiYi =wi(α + βXi + ui)
= αwi
=0
+βwiXi
=1
+wiui
= β +wiui. (12) ただし公式(9) と公式 (10) を利用。
∴OLS 推定量 ˆβ は、真の β の周りを誤差の加重和 wiuiだけ バラつく確率変数。一般にβˆ= β。
標本平均の誤差表現(講義ノート#04)と本質的に同じ!
Remark 3
推定量の誤差表現:多くの推定問題において、未知の母数θ とそ の推定量 ˆθ は正確に、または近似的に
θˆ= θ + 推定の誤差.
∴ ˆθ の性質を調べる際に便利。
例:標本Xiによるµ の推定で、 ¯X = µ +
1 nui。
例:二次元標本(Xi, Yi) による β の OLS 推定で、 βˆ= β + wiui。
(12) 式の推定誤差 wiuiの期待値:仮定(CA1) より wiは非確率、
仮定(CA2) より E(ui) = 0 なので Ewiui= w1E(u1)
=0
+w2E(u2) + · · · + wnE(un) = 0. (13)
wiuiの分散:仮定(CA4)(独立標本)および仮定 (CA3) により、 Varwiui= Var (w1u1+ w2u2+ · · · + wnun)
= Var(w1u1) + Var(w2u2) + · · · + Var(wnun)
= w12Var(u1)
=σ2
+w22Var(u2) + · · · + wn2Var(un)
= w12σ2 + w22σ2+ · · · + w2nσ2 = σ2w2i. (14)
(講義ノート#02:定数を分散記号の外に出すときは、2 乗で。) さらに公式(11) を使えば
Varwiui= σ2wi2 = σ
2
SXX. (15)
よって(12) 式から、 ˆβ の期待値・分散は E( ˆβ) = Eβ+wiui= E(β)
β
+ Ewiui
=0
= β, (16)
Var( ˆβ) = Varβ+wiui
= Var(β)
=0
+ Varwiui
=σ2/SX X
= σ
2
SXX. (17)
公式 5 (OLS 推定量 β ˆ の期待値・分散 )
古典的仮定(CA1) ∼ (CA4) を満たす標本ならば、 E( ˆβ) = β, Var( ˆβ) = σ
2
SXX =
σ2
(Xi− ¯X)2. (18) 証明:前段で証明済み。
E( ˆβ) = β より、OLS ˆβ は回帰係数 β の不偏推定量。
(n − 1)s2X = SXX =(Xi− ¯X)2を利用して分散Var( ˆβ) の分 母を変形すると
Var( ˆβ) = σ
2
(n − 1)s2X. (19)
∴ サンプル数n が大きいほどVar( ˆβ) が減少 =OLS 推定の精度 が向上!
α のOLS ˆα も、同様の性質を持つ。テキストp81 参照。
ガウス・マルコフの定理: OLS の有効性
回帰係数の不偏推定量は、実はOLS 以外にも存在。
不偏性の基準E( ˜β) = β を満たす推定量 ˜β を設計する方法は、 無限にある。(詳細はテキストp81∼p82 参照。)
不偏性の意味で同性能の推定量が複数ある場合、第二の基準・ 有効性(最小分散、講義ノート#05)を問う。
OLS ˆβ は、最小分散の不偏推定量か?
答え:OLS よりも分散(ブレ)の小さい不偏推定量を作ることは、 不可能!
公式 6 ( ガウス・マルコフの定理 )
古典的仮定(CA1) ∼ (CA4) が成立するならば、OLS 推定量 ˆβ の分 散は、β の線形不偏推定量の中で最小となる。
E( ˆβ) = β, Var( ˆβ) = σ2wi2 = σ
2
SXX <Var( ˜β). (20) ただしβ は任意の線形不偏推定量。˜
証明:テキストp93 参照。
OLS が統計ソフトに実装されている理由:有効性(最小分散)。
Remark 4
OLS 推定量が採用される理由 = ガウス・マルコフの定理。 OLS 推定量 ˆα, ˆβ は、回帰係数 α, β の最小分散の線形不偏推 定量。
単なる不偏推定量ではない。有効性(分散)の基準で優れて いる。
ガウス・マルコフの定理(OLS の有効性・最小分散)は、 データが古典的仮定を満たすことを前提とする。
古典的仮定に従わないデータでは、OLS 以外の推定法が最適 になるかも?
今回の復習問題
次の設問に答えよ。各自用意した紙に解答し、退出時に提出せよ。 講義名、日付、学籍番号、氏名を明記すること。
1 公式2、(6) 式の、S
XX に関するパートを証明せよ。
2 テキスト第5 章復習問題 5.1。
References
鹿野繁樹. 新しい計量経済学. 日本評論社, 2015.