• 検索結果がありません。

『新しい計量経済学』 鹿野研究室 slide06

N/A
N/A
Protected

Academic year: 2018

シェア "『新しい計量経済学』 鹿野研究室 slide06"

Copied!
30
0
0

読み込み中.... (全文を見る)

全文

(1)

計量経済学#06

OLS 回帰 (1)

鹿野繁樹

大阪府立大学

2017 年 10 月更新

(2)

Outline

1 回帰直線と最小2 乗法(OLS)

2 OLS 係数の代数的構造

テキスト:鹿野繁樹 [2015]、第 4.1 章・第 4.2 章。

前回の復習

1 母数の推定 2 母数の仮説検定

(3)

Section 1

回帰直線と最小 2 乗法( OLS

(4)

回帰直線による散布図の要約

図1A:政令指定都市(2010 年、n = 19)の失業率 Xiと、生活保

護受給率Yi

正の相関:失業率が高い都市ほど、受給率が高い。(共分散 sXY = 0.89、相関係数 rXY = 0.61。)

この散布図の傾向を回帰直線

i = a + bXi (1)

で「一筆書き」したい! ... コレを、「被説明変数 Yiを説明変

数Xiに回帰する」と言う。

注意:左辺のYˆiは「ハット」を付け、本物のYiと区別。

(5)

5 6 7 8 9

12345

A

Xi Yi

rxy=0.61 (sxy=0.89)

5 6 7 8 9

12345

B

Xi Yi

Y^i= −1.07+ 0.46Xi

5 6 7 8 9

12345

C

Xi Yi

Y^i= 2.41− 0.08Xi

1 :

(6)

(1) 式の切片 a、傾き b を回帰係数と呼ぶ。⇒ データ(Xi, Yi) に基 づき、適切なabを決めるには?

1B

i = −1.07 + 0.46Xi. (a = −1.07, b = 0.46.) (2)

1C

i = 2.42 − 0.08Xi. (a = 2.42, b= −0.08.) (3)

データの特徴をよくとらえているのは、直線(2)。

(7)

散布図に最もフィットする直線を求める方法 最小2 乗法

(ordinary least squares、OLS

図1B・直線 (2):統計ソフト grel の OLS コマンドで (a, b) を計 算。講義ノート#01 の式と同一。

図1C・直線 (3):最も失業率の低い観測と最も高い観測を結 んで作った直線。悪い例。

(8)

残差・残差 2 乗和と OLS 原理

本物のYiと、(1) 式による予測値 ˆYiの差 ei = Yi− ˆYi = Yi−(a + bXi)

予測値

, i= 1, 2, . . . , n (4)

を、残差と呼ぶ。回帰式の予測誤差。 a, bの与え方次第で、eiは変化。

n個の残差e1, e2, . . . , enが発生。⇒ 予測誤差の総和と a, b の 関係を、残差2 乗和

Q(a, b) =e2i =(Yi− a − bXi)2 (5) で示す。(ei <0 の場合を考慮し、2 乗して正の値に。) 残差2 乗和を最小にする (a, b) を求めるアルゴリズムこそ、 OLS。

(9)

Xi Yi

A

1 2

3

4

5

Xi Yi

B

X1

aY^ 1Y1

e1

e4

Y^i = a+bXi

∆b

2 : 散布図上の回帰直線Yˆi= a + bXiと残差ei = Yi− ˆYi

(10)

残差・残差2 乗和をグラフで理解。

図2A:サンプル数 n = 5 の二次元データ(番号付き)。 適当な回帰直線Yˆi = a + bXiを描いてみる(図2B)。⇒ 残差 ei = Yi− ˆYiは、点(Xi, Yi) と回帰直線の「垂直距離」。

例:一つ目の観測点(X1, Y1)X1のときの予測値1 = a + bX1、観測値Y1で、残差はe1 = Y1− ˆY1 >0

その他の点も同様。

∴ 残差2 乗和 Q(a, b) を最小にする a と b をとれば、散布図に フィットする直線が得られる!

(11)

Remark 1

最小2 乗法(OLS)の二つの視点。

1 予測の視点:回帰直線の予測誤差(残差2 乗和)を最小化。

2 グラフィカルな視点:回帰直線の、散布図への当てはめ。 残差2 乗和 Q(a, b) = e2i は、所与の係数a, bのもとでの

「回帰式による予測誤差の総和」、また

「回帰式と散布図の不整合の度合い」

(12)

OLS 係数の決定

残差2 乗和 Q(a, b) の最小化を、最小化問題として整理すれば mina,b Q(a, b) =

e2i =(Yi− a − bXi)2 −−−→最小化 a, b. (6)

目的関数はQ(a, b)、調節可能な変数は a, b。 得られた最小化の解a, bを,OLS 係数と呼ぶ。

(13)

b* b**

Q*Q**

Q(b)=Q(a~,b)

3 : 残差2乗和Q(b)OLS係数ba= ˜aに固定)

(14)

Q(a, b) の最小化とは、Q(a, b) をグラフに描いたときの「谷底」に 相当するa, b の値を探す問題。

3:a = ˜aに固定し、Q(b) = Q(˜a, b) と b の関係を示したイ メージ。

Q(b) の最小値 Qに対応するbにおいて、Q(b) の傾きはゼロ。 Q(a, b) の傾きは、Q(a, b) の導関数∂Q(a,b)∂a ∂Q(a,b)∂b

∴ 残差2 乗和 Q(a, b) を最小にする ab

∂Q(a, b)

∂a = 0

a側から見た傾きが平ら

, ∂Q(a, b)

∂b = 0

b側から見た傾きが平ら

(7)

を同時に満たす。

(15)

実際に導関数を求めゼロと置くと、次の最小化の一階条件を得る

(証明はテキストp72)。

 ei =(Yi− a− bXi) = 0,

 eiXi =(Yi− a− bXi)Xi = 0. (8)

OLS 係数 a, bは、連立方程式(8) の解。 二つの条件式× 二つの未知数。

(16)

最小化条件(8) を変形すれば正規方程式を得る。

公式 1 ( 正規方程式 )

OLS 係数 a, bは,次の条件式を満たす。

na+ b Xi = Yi

a Xi+ b Xi2 = XiYi

. (9)

証明:テキストp59 参照。

まず(9) 式の n、 Xi Yi Xi2 XiYi にデータを埋

め、解くことにより、OLS 係数 abが求まる。

(17)

Example 1

図1のデータ:n = 19、 Xi = 129.98、 Yi = 39.25、

 Xi2 = 923.94、 XiYi = 284.45。

正規方程式を立て、abについて解けば

19a+ 129.98b = 39.25

129.98a+ 923.94b = 284.45

a = −1.07 b = 0.46.

(10)

(小数点第2 位まで表示。)

OLS による回帰直線は (2) 式の通り。

実際の回帰分析では、統計ソフトでOLS を計算。 統計ソフトgretl がお勧め。テキスト付録 A 参照。

(18)

Section 2

OLS 係数の代数的構造

(19)

準備:偏差 2 乗和と偏差積和

最終目標:正規方程式(9) を a, bについて解ききり、a, bとデー タとの関係を明示。⇒ まずは XiとYiの基本統計を確認。

標本平均

X¯ = 1 n

Xi, Y¯ = 1 n

Yi. (11)

標本分散 s2X = 1

n−1

(Xi− ¯X)2, s2Y = 1 n−1

(Yi− ¯Y)2. (12)

標本共分散

sXY = 1 n−1

(Xi− ¯X)(Yi− ¯Y). (13)

(20)

計算効率化のため、偏差2 乗和と偏差積和を定義。 偏差2 乗和 : SXX =

(Xi− ¯X)2, SY Y =(Yi− ¯Y)2, (14) 偏差積和: SXY =

(Xi− ¯X)(Yi− ¯Y). (15)

∴ 分散・共分散との関係はSXX = (n − 1)s2X、 SXY = (n − 1)sXY

(21)

公式 2 ( 偏差 2 乗和・偏差積和の別表現 )

SXX =Xi2 − n ¯X2, SY Y =Yi2− n ¯Y2, (16) SXY =XiYi− n ¯X ¯Y . (17) 証明:標本平均の定義からX¯ = 1

n Xi  Xi = n ¯XSXX

定義式左辺を展開・整理すると

SXX =(Xi2−2 ¯XXi+ ¯X2) = Xi2−2 ¯XXi

=n ¯X

+X¯2

=n ¯X2

=Xi2−2n ¯X2+ n ¯X2

=Xi2− n ¯X2. (18) S も同様。S

(22)

(Xi− ¯X) について、「2 乗せずに」和をとると次の性質が判明。

公式 3 ( 偏差和はゼロ )

(Xi− ¯X) = 0. (19)

証明:標本平均の定義X¯ = 1

n Xiより Xi = n ¯X。従って

(Xi− ¯X) =XiX¯ =Xi− n ¯X = 0. (20)

(Xi− ¯X) は見た目が SXX =(Xi− ¯X)2 = 0 と似ているの で注意!

(23)

正規方程式を解く

bを解く:正規方程式(9) 下段を、通常の連立方程式の要領で b を解くと

b = n XiYi Xi Yi n Xi2− Xi Xi

. (21)

 Xi = n ¯X Yi = n ¯Y および公式(16) に気付けば

b = n XiYi− n ¯Xn ¯Y n Xi2− n ¯Xn ¯X =

=SXY

XiYi− n ¯X ¯Y

Xi2− n ¯X2

=SXX

= SXY

SXX. (22)

(24)

さらに上式左辺の分子・分母を(n − 1) で割れば b =

1 n−1SXY

1 n−1SXX

=

1

n−1(Xi − ¯X)(Yi− ¯Y) 1

n−1(Xi− ¯X)2

= sXY

s2X . (23)

∴bは標本分散・共分散の比に等しい。

(25)

aを解く:(9) 式上段から a+ b 1

n

Xi

= ¯X

= 1 n

Yi

= ¯Y

⇔ a = ¯Y − bX.¯ (24)

先に求めたbを上式に代入し、aが定まる。

(26)

公式 4 (OLS 係数 )

a = ¯Y − bX,¯ b = SXY SXX =

sXY

s2X . (25) 証明:前段で証明済み.

最小化問題(6) の解である OLS 係数 a, bは、実は基本統計量 だけで計算できる!

bの分母(標本分散)は定義上s2X >0。∴ bの符号は分母・ 標本共分散sXY の符号で決まる。

(27)

Remark 2

公式(25):OLS 係数 a, bとその他の統計量の関係。

a, bは基本的な統計量X¯、 ¯Ys2XsXY から得られる。 bの符号= 共分散 sXY の符号。(∴bの符号はsXY を見れば 分かる。)

(28)

Example 2

データからX¯ = 10、 ¯Y = 20、s2X = 2、sXY = −1 を得た。⇒ OLS の公式(25) に当てはめると

b = −1

2 = −0.5, a

= 20 −



1 2



×10 = 25. (26)

結果を回帰直線にまとめれば、 ˆYi = 25 − 0.5Xi

(29)

今回の復習問題

次の設問に答えよ。各自用意した紙に解答し、退出時に提出せよ。 講義名、日付、学籍番号、氏名を明記すること。

1 テキスト第4 章復習問題 4.1。

2 データからsXY = −4、s2

X = 8、 ¯Y = 30、 ¯X = 50 を得た。回

帰直線Yi = a + bXiOLS 係数 abを求めよ。(テキスト 第4 章復習問題 4.2 の類題。)

(30)

References

鹿野繁樹. 新しい計量経済学. 日本評論社, 2015.

図 3 : 残差 2 乗和 Q(b) と OLS 係数 b ∗ ( a = ˜ a に固定)
図 3:a = ˜ a に固定し、 Q (b) = Q(˜ a, b ) と b の関係を示したイ メージ。

参照

関連したドキュメント

URL http://doi.org/10.20561/00041066.. も,並行市場プレミアムの高さが目立つ (注3) 。

中国の農地賃貸市場の形成とその課題 (特集 中国 の都市と産業集積 ‑‑ 長江デルタで何が起きている か).

告した統計をもとに編集されている 1 。国際連合統 計委員会(United Nations Statistical Commission、以 下 UNSC

都市計画分野において余暇活動を扱った既存研究とし て,椎野ら 2)

荒神衣美(こうじんえみ) アジア経済研究所 地域研究センター研究員。ベトナム の農業・農村発展について研究しており、

脚注 [1] 一橋大学イノベーション研究センター(編) “イノベーション・マネジメント入門”, 日本経済新聞出版社 [2] Henry Chesbrough

内的効果 生産性の向上 欠勤率の低下、プレゼンティーイズムの解消 休業率 内的効果 モチベーションUP 家族も含め忠誠心と士気があがる

 当図書室は、専門図書館として数学、応用数学、計算機科学、理論物理学の分野の文