Microsoft PowerPoint - e-stat(OLS).pptx

(1)

経済統計学（補足）

最小

最小二乗法について

二乗法について

担当：小塚匡文 2015年11月19日（改訂版）神戸大学経済学部2015年度後期開講授業

(2)

補足：最小二乗法（単回帰分析）

１．（単純）回帰分析とは？１．（単純）回帰分析とは？１．（単純）回帰分析とは？１．（単純）回帰分析とは？標本サイズTの２変数（ここではXとY）のデータが存在 ⇒YをXで説明する回帰方程式を推定するための方法 Y：被説明変数（または従属変数） X：説明変数（または独立変数）。

(3)

ここでは最小二乗法最小二乗法最小二乗法最小二乗法とよばれる、最も標準的な方法を紹介この場合の真の回帰直線の式：通常は定数項αも含めるので、回帰方程式を求めるとき、 2つの係数（αとβ）を推定する推定する推定する推定する。（αは定数項、βは傾き）

)

,

3 ,

2 ,

1 (

)

1 (

T

t

u

X

Y

t t t

L

=

+

=

α

β

(4)

＜注意すべき点＞

回帰直線の式はXががががYに及ぼす影響を示すものに及ぼす影響を示すものに及ぼす影響を示すものに及ぼす影響を示すもの同じ2変数の関係を表すものに相関係数がある

XとYの相関係数は、XとYの２つの動きの傾向を見た

(5)

２．概念２．概念２．概念２．概念 X とYの関係を表す直線の、最もよい引き方は何か？ ⇒ⅩとＹの散布図を描き、その中にある直線を引く ⇒そして、各点とその直線との間の、縦軸と平行な方向縦軸と平行な方向縦軸と平行な方向縦軸と平行な方向で測った距離で測った距離で測った距離で測った距離を総計したものを最小にする回帰直線が、ここで求めるべきもの

(6)

（１）式におけるは、誤差項（または撹乱項）とよばれる確率変数である。については単純化のため、以下の仮定が置かれる。期待値は０共分散は０分散は一定

※

※Ｙは確率変数であるが、

Ｙは確率変数であるが、

Ｙは確率変数であるが、Xはそうでないものと

Ｙは確率変数であるが、

はそうでないものと

仮定

t u t u

(7)

またの推定値は、図1の点と直線の、垂直（上下）方向の差であらわされる。これを残差を呼び、と書くことが一般的なおこの残差を2乗して足した値＝残差２乗和 ※望ましい直線を引いた場合これは最小になる（＝もっとも点から離れていない直線） ⇒残差二乗和が最小になる傾き・定数項はどのようなものか？ t u t e

∑

e

t

=

0 ,

X

t

e

t

=

0 ,

Y

ˆ

t

e

t

=

0

(8)

図１：残差と回帰直線図１：残差と回帰直線図１：残差と回帰直線図１：残差と回帰直線ＹＹＹＹＸＸＸＸ t X 残差残差残差残差 t Yˆ t Y t e 推定回帰直線推定回帰直線推定回帰直線推定回帰直線真真真真ののの回帰直線の回帰直線回帰直線回帰直線

(9)

３．

３．導出

導出

αとβは、観測できない真の回帰式に含まれる未知のパラメータ（未知の係数） ⇒そのため、Ｘ・Ｙの得られたデータから推定を行う ⇒未知パラメータを書き換え、とする。はアルファハット、ベータハットとよび、 α、βの推定量である。

)

2 (

ˆ

_L

t t

X

Y

=

α

+

β

α

ˆ

,

ˆ

(10)

（２）式：推定回帰直線の式点と直線の垂直方向での距離＝残差の二乗の総和を最小にするようにを求める。なおは理論値と呼ぶ。ここで残差は、次のようにあらわすこともできる

β

α

ˆ

,

ˆ

Yˆ t t t

Y

e

=

−

ˆ

(11)

誤差項は、真の回帰式に存在する確率的な誤差残差は推定された回帰式の、説明しきれない部分説明しきれない部分説明しきれない部分説明しきれない部分

(12)

この残差を2乗し、その和（残差２乗和残差２乗和残差２乗和）が最小になる残差２乗和ようにを求める ⇒ 残差2乗和を

Ｌ

とし、とおく。これをについて偏微分して、その１階の導関数を０に等しいとすると・・・ ⇒

Ｌ

を最小とするが求まる。

β

α

ˆ

,

ˆ

(

ˆ

)

(

3 )

2 1 2 1

∑

L

∑

=

−

=

_t T_t t t T t

e

Y

X

L

α

β

α

ˆ

,

ˆ

β

α

ˆ

,

ˆ

(13)

（３）を偏微分した式を＝０とした式は次の通り：この（４）（５）を正規方程式という

(

ˆ

)

0 (

4 )

2 ˆ

=

−

∑

=1

−

=

L

∂

T t

X

t

Y

t

X

t

L

β

α

β

(

ˆ

)

0 (

5 )

2 ˆ

=

−

∑

=1

−

=

L

∂

T t

Y

t

X

t

L

β

α

(14)

正規方程式（４）（５）は連立の２元１次方程式であるので、これを解くとを得る。これが最小２乗推定量である

X

Y

β

α

ˆ

₌

₋

ˆ

(

)(

)

(

)

2 1 1

ˆ

X

Y

X

t T t T t t t

−

=

∑

= =

β

(15)

この推定量推定量推定量推定量に、具体的なデータを代入したものが、推定値推定値推定値推定値 ※

※※

(16)

4. 検定とは？検定とは？検定とは？検定とは？検定とは何か？母数についての仮説があり、それが支持されるか判断するもの。以下がその手順： ①帰無仮説帰無仮説帰無仮説帰無仮説と対立仮説対立仮説対立仮説対立仮説を設定する ②検定統計量を計算する ③帰無仮説が正しいという仮定で、確率分布を調べる

(17)

④有意水準を設定し、棄却域と臨界値を求める ⑤絶対値で

検定統計量が臨界値より大き

ければ帰無仮説を棄却

⇒棄却域に含まれる

検定統計量が臨界値より小さ

ければ帰無仮説を採択

(18)

棄却域とは？ ⇒そのエリアに検定統計量が入っていれば、帰無仮説を棄却する領域のこと臨界値とは？ ⇒絶対値で見た、棄却域の下限（棄却域の始まる点）（棄却域とそうでない個所の境界）

(19)

5. ｔｔｔｔ検定検定検定検定

Excelで計算すると、”ｔ”とよばれる値が掲載されるこれが、帰無仮説を「係数＝０」とした場合の、各推

定値のt統計量（検定統計量はｔｔｔｔ分布分布分布に従っている）分布

(20)

（単）回帰分析におけるｔ値はである。 (T-2)＝＝＝＝(標本数－推定する係数の数標本数－推定する係数の数標本数－推定する係数の数標本数－推定する係数の数) ＝＝＝＝ｔｔｔｔ統計量の自由度統計量の自由度統計量の自由度統計量の自由度 SE：：：：の標準誤差の推定値の標準誤差の推定値の標準誤差の推定値の標準誤差の推定値

)

2 (

~

)

ˆ

(

0 ˆ

−

=

t

T

SE

t

β

ˆ

(21)

6. 検定検定検定検定方法方法方法方法 ①帰無仮説・対立仮説を次のように設定する（両側検定の場合） ※ここでβは、正・負どちらの値も取り得ると考えられるケースである

0

0 ≠

=

β

帰無仮説：

対立仮説：

(22)

②有意水準５％で検定するとき（両側検定を想定して）t分布表より、2.5％点を見る（自由度に注意！） ※2.5％点：臨界値 ③絶対値で、ｔ値が臨界値より大きければ（分布の中心とは反対側にあれば）、帰無仮説を棄却する帰無仮説を棄却する帰無仮説を棄却する帰無仮説を棄却する（係数は（係数は（係数は （係数は0ではない）ではない）ではない）と判断ではない）

(23)

0 面積0.025 棄却域 -1.9799 面積0.025 1.9799 棄却域ここでｔ分布（ここでは自由度120とする）に従って、５％の有意水準でｔ検定を行うとき、棄却域は下図の太線で示した区間： ※ ※※ ※両側に存在両側に存在両側に存在することに注意両側に存在

(24)

Excelによる最小二乗推定量の求め方 ①データファイル内の「家計最終消費支出」を被説明変数に、「国内総支出」を説明変数にして、定数項ありのモデルで、ケインズ型消費関数を推定する。 ※データファイルは講義資料コーナーにアップロードしています。（Excel2013で作成）

(25)

(26)

②「ツール」メニューの、「分析ツール」を選び、その中の「回帰分析」を選択する

（「分析ツール」がメニューの中にない場合は、「アドイン」をクリックし、「分析ツール」の項目にチェックを入れる）

(27)

(28)

(29)

③「選択Ｙ変数」に被説明変数のデータの範囲を、「選択Ｘ変数」に説明変数のデータの範囲を入力 ※データファイルでは、B2からB77に被説明変数、C2からC77に説明変数がある ④出力箇所を指定し、「ＯＫ」をクリック ※データファイルでは、出力先を”E15”のセルにしている。

(30)

(31)

(32)

⑤結果の見方推定結果のうち、「係数」の上側にある「切片」が定数項の、下側の「X値１」が回帰係数の、それぞれの推定値である。ここで”ｔ”と表記されているものがｔ値（帰無仮説を当該係数＝0”としたときのt統計量）である。これは推定値を「標準誤差」で割ったものと等しい。また、P-値は、その検定統計量が何％点であるかを意味するもので、有意水準（1％、5％、10％のいずれかに設定）よりもその値が小さければ、帰無仮説を棄却し、その係数は有意（０ではない）と考える。

Microsoft PowerPoint - e-stat(OLS).pptx

経済統計学（補足）

経済統計学（補足）

経済統計学（補足）

経済統計学（補足）

最小

最小

最小

最小二乗法について

二乗法について

二乗法について

二乗法について

補足：最小二乗法（単回帰分析）

)

,

,

3

,

2

,

1

(

)

1

(

T

t

u

X

Y

L

L

=

+

+

=

α

β

※

※

※

※Ｙは確率変数であるが、

Ｙは確率変数であるが、

Ｙは確率変数であるが、Xはそうでないものと

Ｙは確率変数であるが、

はそうでないものと

はそうでないものと

はそうでないものと

仮定

仮定

仮定

仮定

∑

∑

∑

e

=

0

,

X

e

=

0

,

Y

ˆ

e

=

0

３．

３．

３．

３． 導出

導出

導出

導出

)

2

(

ˆ

３．導出

_L