• 検索結果がありません。

回帰分析 重回帰(3)

N/A
N/A
Protected

Academic year: 2021

シェア "回帰分析 重回帰(3)"

Copied!
31
0
0

読み込み中.... (全文を見る)

全文

(1)

回帰分析

重回帰(3)

(2)

内容

• 分散不均一性

– 分散不均一性とは何か

– 分散不均一性の検出

– Heteroskedsticity robust estimator

– 加重最小二乗法 (Weighted Least Square)

• 誤差項の系列相関

• 多重共線性

• 説明変数の誤差

(3)

回帰分析の前提

• モデルの線型性

• u

i

~N(0,s

2

) i.i.d.

– 誤差項の期待値は0

– 誤差項は互いに独立(系列相関は無い)

– 誤差項の分散は一定(分散均一性)

– 誤差項は正規分布(t検定,F検定のための前提)

• 説明変数と誤差項は独立

• 説明変数の行列Xはfull rank

– 説明変数間の多重共線性は存在しない

(4)

分散不均一性

heteroskedasticity

• 分散均一性(homoskedasticity) – 誤差項は互いに独立で同一の分布に従う • 回帰係数bの分布(特に分散)はこの仮定に依存 • 分散均一性の仮定が満たされなくても不偏性は成立。しかし,bの分散は 上式のようにはならない。 t 検定,F検定は正しくない。 2

)

var(

u

i

s

𝑏 = 𝛽 + σ𝑖 𝑥𝑖 − ҧ𝑥 𝑢𝑖 𝑆𝑥𝑥 E 𝑏 = 𝛽, var 𝑏 = σ𝑖 𝑥𝑖 − ҧ𝑥 2𝜎2 (𝑆𝑥𝑥)2 = 𝜎2 𝑆𝑥𝑥 𝑏 − 𝛽 s. e. (𝑏) ~𝑡 𝑛 − (𝑘 + 1)

(5)

分散不均一性(2)

• 誤差項の分散が不均一

– 誤差項の分散がある変数の関数になっている場合 • 例)賃金方程式で,高学歴者ほど賃金の分散が大 – 説明変数と残差の散布図でチェックする – 被説明変数(の推定値)と残差の散布図でチェックする – 分散不均一性のテスト

• 時系列データでの回帰分析では,誤差項に系列

相関があるかもしれない

(6)

分散不均一性の検出

• 残差の平方と説明変数またはyの予測値の

間に相関があるかどうかを調べる

• なぜ残差の平方か

– 最小二乗法による推計では,残差と説明変数は

直交する(相関がない)

• 単回帰,重回帰の理論の解説を参照せよ

– したがって,残差を,説明変数(yの予測値)に回

帰してもその係数はゼロ

– 残差の平方と,xやyの予測値との間にシステマ

ティックな関係があるかどうかを調べる。

(7)

分散不均一性の検出(2)

• Breusch and Paganのテスト

, ( 1)

~ )) 1 ( /( / )) 1 ( /( / ) ( 0 : test : estimate compure : save : estimate 2 1 0 , , 2 2 , 1 1 0 2 2 , , 2 2 , 1 1 , , 2 2 , 1 1                               k n k F k n RSS k ESS k n RSS k TSS RSS H v x x x e e x b x b x b a y e u x x x y k i i k k i i i i i k k i i i i i i k k i i i

   

(8)

分散不均一性の検出(3)

• Whiteのテスト

• 残差の平方 e

2

を被説明変数

• 説明変数:x

j

,x

j

の平方,x

j

とx

h

の交差項

• これらの説明変数の係数が全て0という仮説

を検定する

• 簡便な方法

– yの予測値(説明変数の線形関数),およびその

平方を説明変数に加える

(9)

Eviews: Breusch and Pagan の検定 回帰式を推定した後, View/ Residual Diagnostics/ Heteroskedasticity Tests を選択

Breusch and Pagan test White testなどの

(10)

Eviews: Whiteの検定

回帰分析の後,

View/ Residual Tests/ Heteroskedasticity tests を選択 Whiteのtestを選択すると, 自動的に説明変数のクロ ス項,平方を説明変数の リストに加えてくれる

(11)

Eviews: 分散不均一性の検定

メニューを使わない方法

• Breusch and Pagan

– 残差の平方を計算

• 直前の回帰の残差はresidに保存されている • series res2 = resid^2

• コマンドウィンドウで上のコマンドをタイプ – res2 を被説明変数にして回帰分析 – 説明変数の係数=0のF検定

• Whiteの検定

– 残差の平方を計算 • 直前の回帰の残差residと被説明変数の差で予測値を計算 • series res =resid

• series fit = lnwage - res

– res2を被説明変数に,fit , fitの平方を説明変数にした回帰 分析を行い,F検定

(12)

Rでの分散不均一性

wage1.lm <- lm(wage ~ educ + exper + tenure) 残差の平方はresid(wage1.lm)で取り出せる

残差の平方を被説明変数として回帰 > res <- resid(wage1.lm)

> res2 <- res^2

> wage1_bptest.lm <- lm(res2 ~ educ + exper + tenure) > summary(wage1_bptest.lm)

結果

---(途中省略)---F-statistic: 15.53 on 3 and 522 DF, p-value: 1.09e-09

パーケージ lmtest の bptest( ) という関数を用いる方法もあり res2を被説明変 数とした回帰で 全ての説明変数 の係数が0であ るという仮説は 棄却される

(13)

問題1

• wage1.rawで次の賃金方程式を推計する。

– 被説明変数 wage

– 説明変数 educ, exper, tenure, female

• 分散不均一性のテストを行え。

– Breusch and Paganのtest

– Whiteのtest

• 被説明変数をlog(wage)に変えて回帰分析を

行い,分散不均一性が検出されるかどうか確

かめよ。

(14)

問題2

• HPRICE1.RAW

• 次のモデルを推計せよ

– 被説明変数:price(住宅価格)

– 説明変数:lotsize, sqrft, bdrms

– 分散不均一性のテストを行え

• 上のモデルを対数形で推計せよ

– 被説明変数: log(price)

– 説明変数:log(lotsize), log(sqrft), log(bdrms)

– 分散不均一性のテストを行え

(15)

Heteroskedasticity Consistent

Estimator

• 分散不均一性係数の推定値は不偏性をもつが,分散の推 定値は正しくない  t検定,F検定は正しくない • Eviewsでは,最小二乗法のoptionで,heteroskedasticity robust estimator を算出してくれる – EviewsではWhiteの方法とHAC(Newey West)の方法が選択できる – HACは誤差項に系列相関がある場合の方法 • 漸近的に正しい統計量(サンプルサイズが十分に大きいとき)

2 2 2

)

var(

xx i i i

S

e

x

x

(16)

EviewsでのHC estimator

Menuから

Quick /Estimate Equation

specicficationに回帰式を書 き(method はLS), options のタブをクリック Coefficient covarianceの covariance method で Huber-Whiteを選択する。 (他のoptionはOrdinary(通 常のOLS),HAC) 通常のOLSと係数の値, s.e.,t値の比較をせよ。

(17)

RでのHC estimator

• vcov(object名)

– 回帰分析の係数の分散共分散行列

• vcovHC(object名)

– OLSの残差をもとに係数の分散共分散行列を修正

• パッケージ sandwitch が必要

– library(sandwich)

• 回帰分析の結果-->wage1.lm

– vcov(wage1.lm)で通常の分散共分散行列, – vovHC(wage1.lm)で誤差項の分散不均一性を考慮した 分散共分散行列

(18)

RでのHC estimator (2)

• OLSの結果をobjectとして保存(例えばwage1.lm)

• coeftest(wage1.lm)

– 係数の推定値,標準誤差,t値,p値などが出力される

• coeftest(wage1.lm, vcov=vcovHC)

– 分散不均一性を考慮して,標準誤差,t値,p値が修正さ れた結果が出力される

• 係数の推定値自体は,分散不均一性があっても変

わらない(不偏性を持つ)ことに注意

• 複数の制約がある場合はwaldtest(制約なしモデル,

制約付きモデル)を用いる

(19)

加重最小二乗法 Weighted Least Square

• 不均一性のテストは検出のみ

– どのような方法で対処すべきかは教えてくれない – 推定する方程式の関数型を変えることで解決する場 合もある

• 誤差項の分散がある変数に比例していることが

わかっている場合

Weighted Least Square 加重最小二乗法

• WLS : 次の式を最小化するように係数を決定

𝑖=1 𝑛

𝑤

𝑖

𝑦

𝑖

− 𝑎 − 𝑏

1

𝑥

1,𝑖

− ⋯ 𝑏

𝑘

𝑥

𝑘,𝑖 2

w

i

: weight

(20)

Weighted Least Square

次のモデルを考える

𝑦

𝑖

= 𝛼 + 𝛽

1

𝑥

1,𝑖

+ ⋯ + 𝛽

𝑘

𝑥

𝑘,𝑖

+ 𝑢

𝑖

(1)

ただし,var 𝑢𝑖 = 𝜎𝑖2 = ℎ𝑖𝜎2 (誤差項の分散が変数hに比 例している 分散不均一性)。このとき次のように式変換す れば 𝑦𝑖𝑖

= 𝛼

1 ℎ𝑖

+ 𝛽

1 𝑥1,𝑖𝑖

+ ⋯ + 𝛽

𝑘 𝑥𝑘,𝑖𝑖

+

𝑢𝑖𝑖

(2)

var

𝑢𝑖 ℎ𝑖

= 𝜎

2

 分散は均一

(21)

Weighted Least Square (2)

(2)式をもとに係数を推定次の式の最小化

𝑖=1 𝑛

𝑦

𝑖

𝑖

− 𝑎

1

𝑖

− 𝑏

1

𝑥

1,𝑖

𝑖

− ⋯ − 𝑏

𝑘

𝑥

𝑘,𝑖

𝑖 2

= ෍

𝑖=1 𝑛

1

𝑖

𝑦

𝑖

− 𝑎 − 𝑏

1

𝑥

1,𝑖

− ⋯ − 𝑏

𝑘

𝑥

𝑘,𝑖 2

= ෍

𝑖=1 𝑛

𝑤

𝑖

𝑦

𝑖

− 𝑎 − 𝑏

1

𝑥

1,𝑖

− ⋯ 𝑏

𝑘

𝑥

𝑘,𝑖 2

元のモデルの誤差項の分散がhに比例する

weight変数を1/hにする

(22)

EviewsでのWLS

• Quick/Estimate Equation で最小二乗法(LS)を選択し,モ デル式を記述  Option のタブを選択  Weightsの欄 – Type  Variance (誤差項の分散がhに比例) – Weight Seriese  変数hを指定 • 例)賃金方程式で残差の分散がEDUC(教育年数)に比例 している場合

– Type: Variance ; Weight Seriese: EDUC とする

• Eviews のWLSのoptionの指定はわかりにくいので注意。 w=1/h のweigtの場合,weight変数にhを指定する – Option のType • Std.dev (誤差項の標準偏差がhに比例) • Inverse Variance (誤差項の分散が1/hに比例) • Inverse Std.dev(誤差項の標準偏差が1/hに比例)

(23)

RでのWLS

• wls: lm(y~x1+x2+x3,weights=w) で実行(w=1/h)

• 例)賃金方程式で誤差項の分散が教育年数(EDUC)

に比例する場合,weights=1/EDUC とし

wage.wls <- lm(lwage ~educ + expre + tenure,

weights=1/educ, subset=(educ>0))

summary(wage.wls)で結果を取り出す

注意)weight変数に0があるとエラーが出ます(自動的に除外してく れない)。lm()のoptionでsubset=( )を指定すると,( )内の条件 を満たすようなデータについてのみの回帰を行うことができる

(24)

誤差項の系列相関

• 回帰分析の前提:誤差項は互いに独立

• 誤差項に系列相関がある場合

– 回帰係数bの分散がs

2

(X’X)

-1

にならない

– クロスセクションデータの場合には問題にならな

• オブザベーションの並び方が,隣接した地域や人の順 番になっている場合には意味がある場合あり。

– 時系列データの場合には意味がある

• ある時点で生じたショックがしばらく尾をひく(誤差項の 系列相関アリ)

(25)

Durbin Watson検定

• 1階の系列相関を調べる検定

) 1 ( 2 2 1 2 1 1 1 1 1 2 2 2 1 2 2 2 1        

          T t t T t t t T t t T t t T t t T t t t e e e e e e e e DW DW比は多くの統計パッケージでは自動的に出力される Rではdwtest( )関数を用いる(パッケージlmtestが必要) 経済データでは,>0のケースが普通 (は1階の相関係数) 大雑把なルールではDW比が1に近いと系列相関あり 現在では,誤差項 はもっと一般的に AR(p)過程に従う として,推計がで きる また,時系列デー タの分析では,説 明変数が定常過 程か非定常過程 かの区別が重要

(26)

多重共線性 multicolinearity

• 説明変数間の相関が高いこと – 回帰分析において,個々の変数の影響を分離して推計することがで きなくなる – 単相間だけで判断してはいけない – 変数間の単相間は低くても,ある説明変数が別の複数の説明変数 の線形結合でかなり説明できる場合もある • 多重共線性が存在すると – 回帰式全体では当てはまりが良いが,個々の説明変数の係数が有 意でない(s.e.が大きい)という現象が生じる – 実験データ個々の変数の影響が十分に分離できるように実験計画 を立てる – 経済データ上のようなことは不可能分析方法の再検討

(27)

多重共線性の検出

• OLSにおいて説明変数xjの係数の分散は次の通りになる。 var 𝑏𝑗 = 𝜎 2 𝑆𝑗 1 − 𝑅𝑗2 s2: 誤差項の分散, S j : 説明変数xjの平均値の回りの平方和, Rj2: 説明変数xj他の説明変数に回帰した場合のR2(決定係数) 多重共線性Rj2が高いb jの分散が大きくなる • VIF ( Variance inflation factor 分散増幅因子)

𝑉𝐼𝐹 𝑏𝑗 = 1 1 − 𝑅𝑗2

• VIFは手動でも計算できるが,eviewsではestimation outputのwindowのmenuか ら

View /Coefficient Diagnostics /Variance Inflation Factors とたどれば求められる Rの場合: vif(回帰分析のobject名)で出力される。ただし,carというpackageを読み 込んでおく必要がある。

(28)

多重共線性の例

• 地方政府の行動(支出)を,地域の財政状況(債務残高,税 収,国からの補助金,交付税額),地域の属性(山間地,豪 雪地帯,..),所得,面積等で説明 – 国からの補助金は,その地域属性によって決まる • 所得が低い,中山間地,…. – 財政状況と地域属性の間の多重共線性 – 個々の変数の効果が捉えられない • MLBプレイヤーの年俸の決定要因の分析 – HR数と打点数に非常に強い単相間 – HR数の効果と打点の効果を分離できない

(29)

説明変数の誤差

i i i

x

u

y

*

 

v

u

v

i

j

v

x

x

j i i i i i

,

all

for

0

)

,

cov(

,

0

E

*

真のモデル 説明変数xi*は観察できない:そのかわりxiが観察できる

i i i i i i i i i

w

x

v

u

x

u

v

x

y

誤差項wiの期待値は0,分散は一定。しかし,wiとxiには相 関がある

(30)

説明変数の誤差(2)

• 説明変数の誤差誤

差項と説明変数の相関

• 最少二乗推定量

• 特に単回帰の場合

w

X

X

X

y

X

X

X

b

(

'

)

1

'

(

'

)

1

'

s

s

s

s

s

s





2 2 * 2 * 2 2 * 2 * *

)

var(

)

,

cov(

)

var(

)

,

cov(

plim

v x x v x v

v

x

v

u

v

x

x

w

x

b

(31)

説明変数の誤差(3)

• 例)恒常所得仮説

 

0

,

cov

,

cov

,

0

E

i T i T i P i T i T i P i i i P i i

u

Y

Y

Y

Y

Y

Y

Y

u

kY

C

Y:観察される所得, YP: 恒常所得, YT:変動所得

消費は観察不可能な恒常所得に比例する(kはほぼ1に近い)

消費関数を推計すると,消費性向はケインズ型消費関数の消費性向(0.6~ 0.7)と推定される

参照

関連したドキュメント

今回チオ硫酸ナトリウム。クリアランス値との  

[今日のタブ]から Fitbit アプリ内で、[プロファイル写真]>[ Inspire HR のタイ ル]をタップします。..

今回は、会社の服務規律違反に対する懲戒処分の「書面による警告」に関する問い合わせです。

これはつまり十進法ではなく、一進法を用いて自然数を表記するということである。とは いえ数が大きくなると見にくくなるので、.. 0, 1,

本番前日、師匠と今回で卒業するリーダーにみん なで手紙を書き、 自分の思いを伝えた。

⑤調査内容 2015年度 (2015年4月~2016年3月) 1年間の国内宿泊旅行(出張・帰省・修学旅行などを除く)の有無について.

今回、新たな制度ができることをきっかけに、ステークホルダー別に寄せられている声を分析

非政治的領域で大いに活躍の場を見つける,など,回帰係数を弱める要因