回帰分析経済統計鹿野研究室

(1)

担当：鹿野（大阪府立大学）

2014 年度前期

はじめに

前回の復習

二標本問題：母平均の差の_t検定。

処置効果と因果関係。

今回学ぶこと

回帰分析の基礎：回帰直線。

最小₂乗法（_OLS）による推定。

テキスト該当箇所：_3.4、₁₃章。

1 回帰分析の基礎：回帰直線

1.1 ^{二次元データの統計量}

例：家計の食費支出_Y_iと、可処分所得_X_iのデータ。

i ^食費Yi ^所得Xi

1 4.3 9.0

2 3.9 16.4

3 5.0 20.4

4 0.7 3.3

5 3.5 17.1

⊲ ^各観測i^{に、二つの変数}(Xi, Yi)^。^∴ ^データ。

⊲ 注意：二標本問題（講義ノート_#18、₂₁）では観測をグループ分けして_X_i、_Y_jと表記したが、ここでは変数のペア_(X_i_{, Y}_i₎が_n個観測されている、という意味。

_Remark：二次元データの記述統計は、講義ノート_#03で紹介済み。

⊲ 二次元データを分析する目的：二変数の相関（正、負、無相関）を測る。共分散、相関係数、散布図。

⊲ 二変数の関係を、より解釈しやすい形で測る方法。⇒回帰直線。

1

(2)

二次元データの統計量：まとめ

⊲

X =¯ ¹ n

n

i=1

X_i, _{Y =}^¯ ¹ n

n

i=1

Y_i. (1)

⊲ （注意：自由度調整→_{n − 1}）

s²_X ₌ ¹ n − 1

n

i=1

(X_i^{− ¯}X)², s²_Y ₌ ¹ n − 1

n

i=1

(Y_i^{− ¯}Y)². (2)

⊲ ^と、 ^{（注意：自由度調整}^→n − 1^）

s_XY ₌ ¹ n − 1

n

i=1

(X_i^{− ¯}X)(Y_i^{− ¯}Y) ^⇒ r_XY ₌ ^s^XY sXsY

. (3)

1.2 ^{回帰直線による予測}

説明変数と被説明変数：変数_X_iの値を見て、変数_Y_iの値を予測する問題を考える。

⊲ ^例：所得Xiから、その人の食費支出_Y_iを予測。

⊲ ^ここでX_i^を ^、Y_i^を ^と呼ぶ。

⊲ ^一方、Xi^に基づくYi^{の予測値を} ^{と置く。一般に}Yi ^ˆYi^。

回帰直線と残差：_X_iと_Y_iの間に一次式の法則性を仮定し、

Yˆ_i _{= a + bX}_i (4)

で_Y_iを予測するとき、この式をと呼び、「_Y_iを_X_iに回帰する」と言う。

⊲ a, b^を ^{と呼ぶ。所与の}a, b^{のもとで、}X_i^{に数字を代入}^→^予測値Y^ˆ_i^。

⊲ ^現実のYi^と予測値Y^ˆi^のズレ

e_i _{= Y}_i^{− ˆ}Y_i_{= Y}_i⁻_{(a + bX}_i), i = 1, 2, . . . , n ⁽⁵⁾

を、と呼ぶ。∴残差₌予測誤差のこと。_{a, b}次第で_e₁_{, e}₂, . . . , e_n^は変化。

_Remark：どんな方針で_{a, b}を決める？

⊲ ^残差e1, e2, . . . , en^を ^{小さくするよう、}a, b^{を決めたい。}

⊲ 残差をなるべく小さくし、予測誤差の少ない回帰直線をデータから求める方法⇒最小₂乗法。

(3)

0 5 10 15 20 25

0123456

Xi

Yi

1 2

3

4

5

0 5 10 15 20 25

0123456

Xi

Yi ^e¹

e₄

e₅ a₊bX_i

図_1:所得_X_iと食費_Y_iの散布図と回帰直線_Yˆ_i_{= a + bX}_i

2 ^最小 2 ^乗法（ OLS ^{）による推定}

2.1 ^最小 2 乗法（OLS）

残差₂乗和：データ全体で見た予測誤差の指標として、を考える。 Q(a, b) =^e²_i =

(Y_i^{− ˆ}Y_i)² ₌(Y_i⁻a − bX_i)². (6)

⊲ ^残差ei= Yi^{− ˆ}Yiは、正にも負にもなる。∴_e²

i ^{で個々の誤差を評価。}

⊲ 数学の最小化問題を使い、_{Q(a, b)}を最小にする_{a, b}を求めれば良い。

_Remark：散布図と回帰直線・残差（図₁）

⊲ a, b^を決める^→^{散布図上に直線}Y^ˆi = a + bXiが一本描ける。このとき各点_(X_i_{, Y}_i₎と直線のとして、各観測の残差（予測誤差）_e_i _{= Y}_i− ˆ_Y_iが決まる。

⊲ Q(a, b) = ^e²_i ^{を最小にする}^{a, b →}散布図の傾向に最もフィットした直線。∴残差₂ 乗和の小さい回帰直線＝散布図の傾向を要約した式。

最小₂乗法と_OLS推定量：最小化問題

mina,b ^{Q(a, b) =}

e²_i (7)

を解き、解_a

∗_{, b}∗

を見つける手順を、（_OLS、ordinary least squares^）と呼ぶ。そこで得た解をと呼ぶ。

⊲ ^{最小化の一階条件は}

∂Q(a, b)

∂a ⁼

∂e²_i

∂a ^{= 0,}

∂Q(a, b)

∂b ⁼

∂e²_i

∂b ^{= 0.} ⁽⁸⁾

(4)

⊲ (8)^{式を解けば、解として}OLS^推定量

b^∗₌ , a^∗₌ . (9)

を得る。解き方は山本拓『計量経済学』₂章など参照。

⊲ 以下、煩雑さを避けるため、_OLS推定量を単に_{a, b}と表す。

2.2 OLS 推定量と二次元の記述統計量の関係

_OLS推定量_bの別表現：₍₉₎式の_b右辺の分子・分母に ¹

n−1^{をかけると}

b = ^(X_(Xⁱ^{− ¯}^X)(Yⁱ^{− ¯}^Y)

i^{− ¯}X)² ⁼

1

n−1^(Xⁱ^{− ¯}^X)(Yⁱ^{− ¯}^Y) 1

n−1^(Xⁱ^{− ¯}^X)²

= ^. ⁽¹⁰⁾

∴共分散_s_XYを分散_s²

X^{で割れば、}^{OLS b}^を得る。

⊲ 相関係数_r_XY ₌

sXY

sXsY と上式を比較すると、両者の関係は

b = ^. ⁽¹¹⁾

⊲ ^二変数(X_i, Y_i)^{の相関を測る統計量}s_XY^、r_XY^、bは互いに密接な関係。特に

sXY^の符号= rXY^の符号= b^の符号^. ⁽¹²⁾

∴相関の正負を知りたいだけなら、共分散_s_XY を計算するだけで十分。

_Remark：共分散_s_XY をあえて相関係数_r_XY や回帰係数_bに直すメリット

⊲ r_XY のメリット：上限・下限の存在（講義ノート_#03）

−_{1 ≤ r}_XY ≤₁ ₍₁₃₎

より、「相関の強弱」が評価できる。ただし測定単位のない無名数なので、解釈が難しい。

⊲ b^{のメリット：回帰直線}(4)^{式に基づけば、}b^を「X_i^が1^{単位増えたとき、}Y^ˆ_i^がどれだけ変化するか」、つまり

b = ⁽¹⁴⁾

の推定値と解釈できる。ただし「相関の強弱」は不明。

(5)

2.3 ^決定係数

_Remark：回帰直線の目的は、_X_iの一次式による_Y_iの予測。→回帰直線で、どれだけホ

ンモノの_Y_iの動きを説明できているか？

⊲ モデルの説明力、データへの当てはまり具合を評価するには？⇒決定係数。

⊲ ^{重要な分解公式：}Y_i^{の標本分散}s²_Yは、次式のように分解できる。

s²_Y

Yi^{のバラつき}

=

Yˆi^{で説明できる変動}

+

説明できない残り

. (15)

ただし

回帰の分散_: _s²

Yˆ ⁼

1 n − 1

( ˆY_i^{− ¯}Y)², ^{残差の分散}: s²_e ₌ ¹ n − 1

e²_i. (16)

決定係数：_Y_iの分散_s²

Y^{に占める、回帰の分散}^s 2

Yˆ ^の割合

R² ₌ s²_ˆ

Y

s²_Y ⁼ ^, ^{0 ≤ R}

2_≤₁ ₍₁₇₎

を、と呼ぶ。

⊲ R²^が ^に近い^{⇔ ˆ}Y_i^はうまくY_iの動きを予測できている。

⊲ R²^が ^に近い^{⇔ ˆ}Yi^はYiの動きを捕捉できていない。

例：_2001∼2010年の日本の実質消費（_Y_i）を、実質_GDP（_X_i）に回帰

Yˆ_i= 101.84 + 0.37 Xi^, n = 10, ^R²= 0.80. ⁽¹⁸⁾

全て_Excelの分析ツールで計算。（_{a = 101.84}、_{b = 0.37}。）

⊲ ^宿題#01^{で使ったデータ。}

⊲ マクロ経済学で最初に習う「消費関数」を、データから推定したのがコレ。_{b = 0.37} は限界消費性向の推定値。

まとめと復習問題

今回のまとめ

回帰直線_{Y = a + bX}ˆ _i。

データから_{a, b}を_OLS推定。

(6)

復習問題

出席確認用紙に解答し（用紙裏面を用いても良い）、退出時に提出せよ。

1. (a) OLS^{基準（残差}2乗和の最小化）ではなく、「最初の二つの観測_{i = 1, 2}の残差_e₁_{, e}₂ をゼロにする」（注：残差₂乗ではない）という基準で回帰係数_{a, b}を決めると、

a^∗= ^X²^Y¹

−_X₁_Y₂ X2⁻X1

, _b^∗₌ ^Y²⁻^Y¹ X2⁻X1

(19)

となることを示せ。

(b) ^{この基準で導出した}a^∗, b^∗を採用すると、どんな問題が生じるか？ 2. ^{次の統計値から、}Y_i^をX_i^{に回帰した}OLS^回帰係数a, b^{を求めよ。}

X = 1,¯ Y = 2,^¯ ^s²_X = 10, ^s²_Y = 20, ^sXY = 5. ⁽²⁰⁾ ヒント：不要な数値が一つ混じってます。

回帰分析 経済統計 鹿野研究室

担当：鹿野（大阪府立大学）

はじめに

前回の復習

今回学ぶこと

1 回帰分析の基礎：回帰直線

1.1 二次元データの統計量

1.2 回帰直線による予測

2 最小 2 乗法（ OLS ）による推定

2.1 最小 2 乗法（OLS）

2.2 OLS 推定量と二次元の記述統計量の関係

2.3 決定係数

まとめと復習問題

今回のまとめ

復習問題

回帰分析経済統計鹿野研究室

1.1 ^{二次元データの統計量}

1.2 ^{回帰直線による予測}

2 ^最小 2 ^乗法（ OLS ^{）による推定}

2.1 ^最小 2 乗法（OLS）

2.3 ^決定係数