回帰分析
単回帰
単回帰モデル
simple regression model
• y
– 従属変数 (dependent variable)
– 被説明変数(explained variable)
• x
– 独立変数 (independent variable)
– 説明変数 (explanatory variable)
• u
– 誤差項 (error term)
– 撹乱項 (disturbance term)
– 他の要因,観察されない変数の影響,yの測定誤差
𝑦 = 𝛼 + 𝛽𝑥 + 𝑢
x
y
左のようなモデルを仮定し,
現実に観察されたデータから,
パラメータ
a,bを推計する
直線を当てはめる
推計された
a,b当てはめ
られた直線の切片と傾き
傾き
xが1単位増加したと
きyは何単位増加するか
𝑦 = 𝛼 + 𝛽𝑥 + 𝑢
重回帰モデル
multiple regression model
• 説明変数が2個以上
u
x
x
x
y
a
b
1 1
b
2 2
b
k k
i ix
y
b
他の説明変数を一定に保っておいて,
x
iだけを1単位増加させたときに y が何
単位増えるか
他の要因をコントロールした x
i固有の
影響
単回帰モデルにおける仮定
i i ix
u
y
a
b
1. 線型モデル(パラメータに関し)
2. 誤差項の期待値は0
3. 誤差項は互いに独立
4. 誤差項の分散は一定(分散均一性)
5. 誤差項は正規分布に従う
– BLUEの成立のためにはこの条件は不要
最小二乗法
• 残差平方和を最小にするようにパラメータを決定
– a,b: 未知パラメータ a,b の推定値
– e: 残差
0
,
0
b
S
a
S
n i i i n i iy
a
bx
e
b
a
S
1 2 1 2)
,
(
1階の条件
2本の方程式からa,bを
決定する
最小二乗推定量
x
b
y
a
y
x
x
S
S
S
b
n i i i xx xx xy
1)
(
1
n i ie
n
RSS
n
s
1 2 22
1
2
1
最小二乗推定量はBLUE (Best Linear Unbiased Estimator)という望ましい
性質を持っている
誤差項の分散の推定量
n-2の2は説明変数の個数(定数項とx)
Eviewsでの回帰分析
メニューから Quick/Estimate Equation 下の画面が表れる 被説明変数,説 明変数をスペー スで区切って並 べる。 c は定数項 (constant term) 最小二乗法の指定 (他にも推定方法の optionあり) 分析に用いるサンプル を指定することもできるRでの回帰分析
• データのimport, load
– ここではwage1.csvを用いる
– データ・フレーム wage1 にimport されているとして
--->attach(wage1)
> wage1.lm <- lm(wage ~ educ)
> summary(wage1.lm)
---• attach(wage1)でwage1データセット内の変数に直接アクセ
スできるようにする
• lm( y~ x1 + x2 + x3 ) 回帰分析
• wage1.lm に回帰分析の結果を代入し,summary( ) で結果
の要約を表示
仮説の検定
0
,
1
~
2N
S
b
xx
b
2
~
)
.(
.
2 0 0
n
t
S
s
b
b
e
s
b
xxb
b
H
0
: b=b
0
n−2 : 2は説明変数の個数(定数項とx)
当てはまりの良さ
• TSS=ESS+RSS
• 決定係数
– 0から1の間の値
– 1に近いほど当てはまりが良いことを表す
TSS
RSS
TSS
ESS
R
2
1
回帰係数
wage と educ の散布図
0 5 10 15 20 25 30 0 4 8 12 16 20 EDUC W A G E残差のプロット
Eviewsではresidという変 数に直前の回帰分析の残差 が保存される 残差を検討することで回帰 分析の前提(分散均一性) が満たされているかどうか チェックする グラフをみる限り,分散の 均一性の前提が満たされて いないようである 教育年数の増加とも分散 が大きくなっている 残差を後の分析でも使いた い場合は新しい変数に residを代入して保存する -8 -4 0 4 8 12 16 20 0 4 8 12 16 20 EDUC R E S ID-8 -4 0 4 8 12 16 20 -2 0 2 4 6 8 10 WAGEHAT R E S ID
残差と被説明変数wageの推定値(wagehat)の関係
• 重回帰の場合には,被説明変数の
推定値と残差の関係を調べる(単
回帰の場合は前のページと同じ結
果)
• wagehatの求め方
menu
genr新しい変数を次のよ
うに作成
wagehat= @coefs(1)+@coefs(2)*
educ
または
Rでの回帰分析
> summary(wage1.lm) Call:
lm(formula = wage ~ educ) Residuals:
Min 1Q Median 3Q Max -5.3396 -2.1501 -0.9674 1.1921 16.6085 Coefficients:
Estimate Std. Error t value Pr(>|t|) (Intercept) -0.90485 0.68497 -1.321 0.187 educ 0.54136 0.05325 10.167 <2e-16 ***
---Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 3.378 on 524 degrees of freedom
Multiple R-squared: 0.1648, Adjusted R-squared: 0.1632 F-statistic: 103.4 on 1 and 524 DF, p-value: < 2.2e-16
係数の推定値,標準誤差,t値, p値が出力される