計量経済学#06
OLS 回帰 (1)
鹿野繁樹
大阪府立大学
2017 年 10 月更新
Outline
1 回帰直線と最小2 乗法(OLS)
2 OLS 係数の代数的構造
テキスト:鹿野繁樹 [2015]、第 4.1 章・第 4.2 章。
前回の復習
1 母数の推定 2 母数の仮説検定
Section 1
回帰直線と最小 2 乗法( OLS )
回帰直線による散布図の要約
図1A:政令指定都市(2010 年、n = 19)の失業率 Xiと、生活保
護受給率Yi。
正の相関:失業率が高い都市ほど、受給率が高い。(共分散 sXY = 0.89、相関係数 rXY = 0.61。)
この散布図の傾向を回帰直線
Yˆi = a + bXi (1)
で「一筆書き」したい! ... コレを、「被説明変数 Yiを説明変
数Xiに回帰する」と言う。
注意:左辺のYˆiは「ハット」を付け、本物のYiと区別。
.
5 6 7 8 9
12345
A
Xi Yi
rxy=0.61 (sxy=0.89)
5 6 7 8 9
12345
B
Xi Yi
Y^i= −1.07+ 0.46Xi
5 6 7 8 9
12345
C
Xi Yi
Y^i= 2.41− 0.08Xi
1 :
(1) 式の切片 a、傾き b を回帰係数と呼ぶ。⇒ データ(Xi, Yi) に基 づき、適切なaとbを決めるには?
図1B
Yˆi = −1.07 + 0.46Xi. (a = −1.07, b = 0.46.) (2)
図1C
Yˆi = 2.42 − 0.08Xi. (a = 2.42, b= −0.08.) (3)
データの特徴をよくとらえているのは、直線(2)。
散布図に最もフィットする直線を求める方法⇒ 最小2 乗法
(ordinary least squares、OLS)。
図1B・直線 (2):統計ソフト grel の OLS コマンドで (a, b) を計 算。講義ノート#01 の式と同一。
図1C・直線 (3):最も失業率の低い観測と最も高い観測を結 んで作った直線。悪い例。
残差・残差 2 乗和と OLS 原理
本物のYiと、(1) 式による予測値 ˆYiの差 ei = Yi− ˆYi = Yi−(a + bXi)
予測値
, i= 1, 2, . . . , n (4)
を、残差と呼ぶ。回帰式の予測誤差。 a, bの与え方次第で、eiは変化。
n個の残差e1, e2, . . . , enが発生。⇒ 予測誤差の総和と a, b の 関係を、残差2 乗和
Q(a, b) =e2i =(Yi− a − bXi)2 (5) で示す。(ei <0 の場合を考慮し、2 乗して正の値に。) 残差2 乗和を最小にする (a, b) を求めるアルゴリズムこそ、 OLS。
Xi Yi
A
1 2
3
4
5
Xi Yi
B
X1
aY^ 1Y1
e1
e4
Y^i = a+bXi
∆b
図2 : 散布図上の回帰直線Yˆi= a + bXiと残差ei = Yi− ˆYi
残差・残差2 乗和をグラフで理解。
図2A:サンプル数 n = 5 の二次元データ(番号付き)。 適当な回帰直線Yˆi = a + bXiを描いてみる(図2B)。⇒ 残差 ei = Yi− ˆYiは、点(Xi, Yi) と回帰直線の「垂直距離」。
例:一つ目の観測点(X1, Y1)。X1のときの予測値 Yˆ1 = a + bX1、観測値Y1で、残差はe1 = Y1− ˆY1 >0。
その他の点も同様。
∴ 残差2 乗和 Q(a, b) を最小にする a と b をとれば、散布図に フィットする直線が得られる!
Remark 1
最小2 乗法(OLS)の二つの視点。
1 予測の視点:回帰直線の予測誤差(残差2 乗和)を最小化。
2 グラフィカルな視点:回帰直線の、散布図への当てはめ。 残差2 乗和 Q(a, b) = e2i は、所与の係数a, bのもとでの
「回帰式による予測誤差の総和」、また
「回帰式と散布図の不整合の度合い」。
OLS 係数の決定
残差2 乗和 Q(a, b) の最小化を、最小化問題として整理すれば mina,b Q(a, b) =
e2i =(Yi− a − bXi)2 −−−→最小化 a∗, b∗. (6)
目的関数はQ(a, b)、調節可能な変数は a, b。 得られた最小化の解a∗, b∗を,OLS 係数と呼ぶ。
b* b**
Q*Q**
Q(b)=Q(a~,b)
図3 : 残差2乗和Q(b)とOLS係数b∗(a= ˜aに固定)
Q(a, b) の最小化とは、Q(a, b) をグラフに描いたときの「谷底」に 相当するa, b の値を探す問題。
図3:a = ˜aに固定し、Q(b) = Q(˜a, b) と b の関係を示したイ メージ。
Q(b) の最小値 Q∗に対応するb∗において、Q(b) の傾きはゼロ。 Q(a, b) の傾きは、Q(a, b) の導関数∂Q(a,b)∂a 、∂Q(a,b)∂b 。
∴ 残差2 乗和 Q(a, b) を最小にする a∗とb∗は
∂Q(a, b)
∂a = 0
a側から見た傾きが平ら
, ∂Q(a, b)
∂b = 0
b側から見た傾きが平ら
(7)
を同時に満たす。
実際に導関数を求めゼロと置くと、次の最小化の一階条件を得る
(証明はテキストp72)。
ei =(Yi− a∗− b∗Xi) = 0,
eiXi =(Yi− a∗− b∗Xi)Xi = 0. (8)
OLS 係数 a∗, b∗は、連立方程式(8) の解。 二つの条件式× 二つの未知数。
最小化条件(8) を変形すれば正規方程式を得る。
公式 1 ( 正規方程式 )
OLS 係数 a∗, b∗は,次の条件式を満たす。
na∗+ b∗ Xi = Yi
a∗ Xi+ b∗ Xi2 = XiYi
. (9)
証明:テキストp59 参照。
まず(9) 式の n、 Xi、 Yi、 Xi2、 XiYi にデータを埋
め、解くことにより、OLS 係数 a∗とb∗が求まる。
Example 1
図1のデータ:n = 19、 Xi = 129.98、 Yi = 39.25、
Xi2 = 923.94、 XiYi = 284.45。
正規方程式を立て、a∗、b∗について解けば
19a∗+ 129.98b∗ = 39.25
129.98a∗+ 923.94b∗ = 284.45 ⇒
a∗ = −1.07 b∗ = 0.46.
(10)
(小数点第2 位まで表示。)
OLS による回帰直線は (2) 式の通り。
実際の回帰分析では、統計ソフトでOLS を計算。 統計ソフトgretl がお勧め。テキスト付録 A 参照。
Section 2
OLS 係数の代数的構造
準備:偏差 2 乗和と偏差積和
最終目標:正規方程式(9) を a∗, b∗について解ききり、a∗, b∗とデー タとの関係を明示。⇒ まずは XiとYiの基本統計を確認。
標本平均
X¯ = 1 n
Xi, Y¯ = 1 n
Yi. (11)
標本分散 s2X = 1
n−1
(Xi− ¯X)2, s2Y = 1 n−1
(Yi− ¯Y)2. (12)
標本共分散
sXY = 1 n−1
(Xi− ¯X)(Yi− ¯Y). (13)
計算効率化のため、偏差2 乗和と偏差積和を定義。 偏差2 乗和 : SXX =
(Xi− ¯X)2, SY Y =(Yi− ¯Y)2, (14) 偏差積和: SXY =
(Xi− ¯X)(Yi− ¯Y). (15)
∴ 分散・共分散との関係はSXX = (n − 1)s2X、 SXY = (n − 1)sXY。
公式 2 ( 偏差 2 乗和・偏差積和の別表現 )
SXX =Xi2 − n ¯X2, SY Y =Yi2− n ¯Y2, (16) SXY =XiYi− n ¯X ¯Y . (17) 証明:標本平均の定義からX¯ = 1
n Xi ⇔ Xi = n ¯X。SXXの
定義式左辺を展開・整理すると
SXX =(Xi2−2 ¯XXi+ ¯X2) = Xi2−2 ¯XXi
=n ¯X
+X¯2
=n ¯X2
=Xi2−2n ¯X2+ n ¯X2
=Xi2− n ¯X2. (18) S も同様。S
(Xi− ¯X) について、「2 乗せずに」和をとると次の性質が判明。
公式 3 ( 偏差和はゼロ )
(Xi− ¯X) = 0. (19)
証明:標本平均の定義X¯ = 1
n Xiより Xi = n ¯X。従って
(Xi− ¯X) =Xi−X¯ =Xi− n ¯X = 0. (20)
(Xi− ¯X) は見た目が SXX =(Xi− ¯X)2 = 0 と似ているの で注意!
正規方程式を解く
b∗を解く:正規方程式(9) 下段を、通常の連立方程式の要領で b∗ を解くと
b∗ = n XiYi− Xi Yi n Xi2− Xi Xi
. (21)
Xi = n ¯X、 Yi = n ¯Y および公式(16) に気付けば
b∗ = n XiYi− n ¯Xn ¯Y n Xi2− n ¯Xn ¯X =
=SXY
XiYi− n ¯X ¯Y
Xi2− n ¯X2
=SXX
= SXY
SXX. (22)
さらに上式左辺の分子・分母を(n − 1) で割れば b∗ =
1 n−1SXY
1 n−1SXX
=
1
n−1(Xi − ¯X)(Yi− ¯Y) 1
n−1(Xi− ¯X)2
= sXY
s2X . (23)
∴b∗は標本分散・共分散の比に等しい。
a∗を解く:(9) 式上段から a∗+ b∗ 1
n
Xi
= ¯X
= 1 n
Yi
= ¯Y
⇔ a∗ = ¯Y − b∗X.¯ (24)
先に求めたb∗を上式に代入し、a∗が定まる。
公式 4 (OLS 係数 )
a∗ = ¯Y − b∗X,¯ b∗ = SXY SXX =
sXY
s2X . (25) 証明:前段で証明済み.
最小化問題(6) の解である OLS 係数 a∗, b∗は、実は基本統計量 だけで計算できる!
b∗の分母(標本分散)は定義上s2X >0。∴ b∗の符号は分母・ 標本共分散sXY の符号で決まる。
Remark 2
公式(25):OLS 係数 a∗, b∗とその他の統計量の関係。
a∗, b∗は基本的な統計量X¯、 ¯Y、s2X、sXY から得られる。 b∗の符号= 共分散 sXY の符号。(∴b∗の符号はsXY を見れば 分かる。)
Example 2
データからX¯ = 10、 ¯Y = 20、s2X = 2、sXY = −1 を得た。⇒ OLS の公式(25) に当てはめると
b∗ = −1
2 = −0.5, a
∗ = 20 −
−1 2
×10 = 25. (26)
結果を回帰直線にまとめれば、 ˆYi = 25 − 0.5Xi。
今回の復習問題
次の設問に答えよ。各自用意した紙に解答し、退出時に提出せよ。 講義名、日付、学籍番号、氏名を明記すること。
1 テキスト第4 章復習問題 4.1。
2 データからsXY = −4、s2
X = 8、 ¯Y = 30、 ¯X = 50 を得た。回
帰直線Yi = a + bXiのOLS 係数 a∗、b∗を求めよ。(テキスト 第4 章復習問題 4.2 の類題。)
References
鹿野繁樹. 新しい計量経済学. 日本評論社, 2015.