エコノメトリックス
(2016 年度前期 講義ノート )
April 19, 2016 ( 火 ) 版
教科書『計量経済学』
( 山本拓著,新世社, 1995 年 )
谷
﨑久志 大阪大学・経済学部
Contents
1
計量経済学について1
1.1
例1
: マクロの消費関数. . . . 1 1.2
例2
: 日本酒の需要関数. . . . 4
2
行列について6
3
最小二乗法について20
3.1
最小二乗法と回帰直線. . . . 20
3.2
切片α
と傾きβ
の推定. . . . 21
3.3
残差b u
i の性質について. . . . 29
3.4
決定係数R
2について. . . . 31
3.5
まとめ. . . . 36
4
統計学の回帰分析への応用38 4.1
回帰モデルの仮定. . . . 42
4.2
誤差項(
攪乱項)
の経済学的意味. . . . 44
4.3 b α
,bβ
の統計的性質. . . . 45
4.3.1 b β
について. . . . 46
4.3.2 b α
について. . . . 47
4.3.3 b α
,bβ
の平均. . . . 48
4.3.4 b α
,bβ
の分散. . . . 50
4.3.5 b α
,bβ
の分布( σ
2が既知の場合) . . . . 61
4.3.6 b α
,bβ
の性質:最良線型不偏性と一致性. . . . 64
4.4
誤差項(
または,攪乱項) u
iの分散σ
2について. . . . 74
4.4.1 b α
,bβ
の分散の不偏推定量. . . . 84
4.5 b α
,bβ
の分布. . . . 88
4.5.1
統計学の復習(t
分布) . . . . 88
4.5.2 b β
について:. . . . 91
4.5.3 b α
について:. . . . 93
4.5.4
まとめ:. . . . 94
4.6 α
,β
の区間推定(
信頼区間) . . . . 94
4.6.1
統計学の復習: 区間推定(
信頼区間) . . . . 94
4.6.2 α
,β
の区間推定(
信頼区間) . . . . 97
4.7 α
,β
の仮説検定. . . . 100
4.7.1
統計学の復習: 仮説検定. . . . 100
4.7.2 α
,β
の仮説検定. . . . 103
4.7.3 t
値について. . . . 105
5
多重回帰111 5.1
重回帰モデルにおける回帰係数の意味. . . . 116
5.2
推定量の性質. . . . 119
5.3
ダミー変数について. . . . 126
5.3.1
異常値. . . . 126
5.3.2
構造変化. . . . 130
6
関数型について132
7
系列相関:DW
について137 7.1 DW
について. . . . 137 7.2
最小二乗推定量の分散について. . . . 147 7.3
系列相関のもとで回帰式の推定. . . . 149
8
不均一分散(
不等分散) 152
8.1
不均一分散(
不等分散)
の意味と推定方法. . . . 152 8.2
最小二乗推定量の分散について. . . . 155
9
多重共線性について157
10 F
検定について162
10.1
いくつかの例. . . . 163 10.2
統計学の復習. . . . 164 10.3
検定の方法. . . . 165
11
応用例168
11.1
マクロの消費関数. . . . 168
11.2
ミクロの消費関数(需要関数). . . . 181
11.3
株価,金利,為替レート. . . . 196
12
推定量の求め方201
12.1
最小二乗法. . . . 201
12.2
最尤法. . . . 203
12.2.1
変数変換. . . . 224
12.2.2
回帰分析への応用. . . . 226
12.2.3
誤差項に系列相関がある場合. . . . 234
12.3
尤度比検定. . . . 238
13
時系列分析と季節調整251 13.1
季節変動. . . . 253
13.2
トレンド. . . . 255
13.3
循環変動. . . . 256
14
時系列分析と定常性256 14.1
時系列モデルの特定化. . . . 260
14.1.1
自己回帰(AR)
モデル. . . . 260
14.1.2
移動平均(MA)
モデル. . . . 261
14.1.3
より複雑なモデル. . . . 261
14.2
時系列モデルの作成手順と予測. . . . 263
14.3
非定常時系列. . . . 263
14.3.1
単位根. . . . 263
14.3.2
見せかけ回帰. . . . 270
14.3.3
共和分. . . . 271
•
この講義ノートは,http://www2.econ.osaka-u.ac.jp/˜tanizaki/class/2014 からダウンロード可。
教科書
『計量経済学』
(
山本拓著,1995
,新世社)
『基本統計学
(
第3
版)
』(
豊田他著,東洋経済新報社,2010
年)
1 計量経済学について
•
経済理論(
ミクロ,マクロ,財政,金融,国際経済,・・・)
•
データ(GNP
,消費,投資,金利,為替レート,・・・)
計量経済学
= ⇒
経済理論が現実に成り立つものかどうかを,データを用いて,統計的に検証する。
1.1 例 1 : マクロの消費関数
C = f (Y)
ただし,C
は消費,Y
は所得。1. Y % = ⇒ C % 2. dC
dY =
限界消費性向=
所得1
円増加で消費が何円増加するか3.
すなわち,dC
dY > 0
モデルの定式化1. C = a + bY 2. b = dC
dY =
限界消費性向3. a =
基礎消費(Y = 0
のときに必要な消費)
4.
符号条件:a > 0
,b > 0 (
しかも,1 > b)
図
1: 消費 (C
i)
と所得(Y
i)
0 500 1000 1500 2000 2500 3000
Ci
0 1000 2000 3000 4000
Yi
×
×
×
×
×
×
× ×
×
90 91 92
93 94 95
96 97 98
1.
×−→
実際のデータ2. (Y
i, C
i) = ⇒ t
期のデータ, i.e., i = 1 , 2 , · · · , 9 3. i = 1 = ⇒ 1990
年,i = 2 = ⇒ 1991
年,· · ·
,i = 9 = ⇒ 1998
年,1.
実際のデータを用いて,a,b
を求める。2. a, b
を求める≡
現実の経済構造を求める3.
その結果,もしa > 0
,1 > b > 0
なら,経済理論は現実経済を説明してい ると言える。1.2 例 2 : 日本酒の需要関数
Q = f (Y , P
1, P
2)
ただし,
Q
は日本酒の需要量,Y
は所得,P
1は日本酒の価格,P
2は洋酒の価格。1. Y % = ⇒ Q % ,
P
1% = ⇒ Q & ,
P
2% = ⇒ Q %
2. ∂ Q
∂ Y > 0, ∂ Q
∂ P
1< 0, ∂ Q
∂ P
2> 0 3.
日本酒と洋酒は代替財4.
モデルの定式化(A)
Q = a + b
1Y + b
2P
1+ b
3P
25. Q, Y, P
1, P
2を用いて,a, b
1, b
2, b
3を求める(
日本酒の需要構造を求める)
。6.
符号条件:b
1> 0, b
2< 0, b
3> 0, a ?
7. t
期のデータ(Q
i, Y
i, P
1i, P
2i) 8. n
組のデータ, i.e., i = 1 , 2 , · · · , n 9.
モデルの定式化(B)
Q = a + b
1Y + b
2P
1P
2 符号条件:b
1> 0, b
2< 0
10.
モデルの定式化(C)
log(Q) = a + b
1log(Y ) + b
2log( P
1P
2)
符号条件:b
1> 0, b
2< 0
11.
モデル(A), (B), (C)
のどれが最も現実的かを得られた結果から判断する。2 行列について
A
を2 × 2
行列とすると,A = ( a
11a
12a
21a
22)
と表される。
a
i j= A
の第i
行,第j
列の要素a
を2 × 1
行列(
縦ベクトル)
とすると,a = ( a
1a
2)
と表される。
a
i= a
の第i
要素a
を1 × 2
行列(
横ベクトル)
とすると,a = ( a
1a
2)
と表される。a
i= a
の第i
要素A
をn × k
行列とすると,A =
a
11· · · a
1k... ... ...
a
n1· · · a
nk
と表される。
a
i j= A
の第i
行,第j
列の要素(i j
要素) a
をn × 1
行列(
縦ベクトル)
とすると,a =
a
1...
a
n
と表される。
a
i= a
の第i
要素a
を1 × k
行列(
横ベクトル)
とすると,a = ( a
1· · · a
k)
と表される。a
i= a
の第i
要素行列の等号:
A
,B
をn × k
行列とする。A = B
は,すべてのi = 1 , · · · , n, j = 1 , · · · , k
について,a
i j= b
i j を意味する。ただし,a
i j, b
i jは,それぞれ,A, B
のi j
要素とする。x = 3, y = 2
の2つの等式を行列で表す。( x y
) = ( 3 2 )
または
( x y ) = ( 3 2 )
行列の和と差:A, B
をn × k
行列とする。A + B =
a
11· · · a
1k... ... ...
a
n1· · · a
nk
+
b
11· · · b
1k... ... ...
b
n1· · · b
nk
=
a
11+ b
11· · · a
1k+ b
1k... ... ...
a
n1+ b
n1· · · a
nk+ b
nk
すなわち,
A + B
のi j
要素は,a
i j+ b
i j となる。A = ( 1 2 3 4 )
B = ( 5 6
7 8
)
A + B = ( 1 + 5 2 + 6 3 + 7 4 + 8
) = ( 6 8 10 12
)
A − B = ( 1 − 5 2 − 6 3 − 7 4 − 8
) = ( − 4 − 4
− 4 − 4 )
要素と行列の積:
A
をn × k
行列とする。c
を スカラー(1 × 1
行列のこと)
と する。cA = c
a
11· · · a
1k... ... ...
a
n1· · · a
nk
=
ca
11· · · ca
1k... ... ...
ca
n1· · · ca
nk
A = ( 1 2
3 4
)
c = 5
のときcA = 5
( 1 2
3 4
) = ( 5 × 1 5 × 2 5 × 3 5 × 4
) = ( 5 10 15 20 )
行列と行列の積:
A, B
をn × k,k × n
行列とする。AB =
a
11· · · a
1k... ... ...
a
n1· · · a
nk
b
11· · · b
1n... ... ...
b
k1· · · b
kn
=
∑
km=1
a
1mb
m1· · · ∑
km=1
a
1mb
mn... ... ...
∑
km=1
a
nmb
m1· · · ∑
km=1
a
1mb
mn
すなわち,
AB
はn × n
行列で,AB
のi j
要素は,a
i1b
1j+ a
i2b
2j+ · · · + a
ikb
k j=
∑
km=1
a
ikb
k jとなる。BA =
b
11· · · b
1n... ... ...
b
k1· · · b
kn
a
11· · · a
1k... ... ...
a
n1· · · a
nk
=
∑
nm=1
b
1ma
m1· · · ∑
nm=1
b
1ma
mk... ... ...
∑
nm=1
b
kma
m1· · · ∑
nm=1
b
1ma
mk
すなわち,
BA
はk × k
行列で,BA
のi j
要素は,b
i1a
1j+ b
i2a
2j+ · · · + b
ika
k j=
∑
km=1
a
ikb
k jとなる。このように,
AB
とBA
の次元は異なる。A = ( 1 2 3 4 )
B = ( 5 6
7 8
)
AB = ( 1 2
3 4
) ( 5 6
7 8
)
= ( 1 × 5 + 2 × 7 1 × 6 + 2 × 8 3 × 5 + 4 × 7 3 × 6 + 4 × 8 )
= ( 19 22
43 50
)
BA = ( 5 6
7 8
) ( 1 2
3 4
)
= ( 5 × 1 + 6 × 3 5 × 2 + 6 × 4 7 × 1 + 8 × 3 7 × 2 + 8 × 4 )
= ( 23 34 31 46 )
一般的に,AB
, BA
となる。c
をスカラーとする。cAB = AcB = (Ac)B = A(cB) = ABc c
をどこで掛けても値は変わらない。連立方程式:
{ x + 2y = 3 4x + 5y = 6
行列表示すると,( 1 2
4 5
) ( x y
) = ( 3
6
)
となる。
また,
x + 2y + 3z = 4 5x + 6y + 7z = 8 9x + 10y + 11z = 12
行列表示すると,
1 2 3
5 6 7
9 10 11
x y z
=
4 8 12
となる。
単位行列: 単位行列とは,対角要素
1
,その他0
となる行列であり,I
で表す。I =
1 0 · · · 0
0 1
... ... ...
1 0
0 · · · 0 1
I
がn × n
行列のとき,I
n と書くことも多い。A
をn × n
行列,x
をn × 1
行列(
ベクトル)
とする。I
nA = AI
n= A I
nx = x
1 0
...
0 1
a
11· · · a
1n... ... ...
a
n1· · · a
nn
=
a
11· · · a
1n... ... ...
a
n1· · · a
nn
1 0
...
0 1
=
a
11· · · a
1n... ... ...
a
n1· · · a
nn
1 0
...
0 1
x
1...
x
n
=
x
1...
x
n
逆行列:
A
をn × n
とする。A
の逆行列とは,AB = I
n またはBA = I
nとなるB
を指す。A
もB
も次元は同じ。B
をA
−1と表す。すなわち,
A
の逆行列はA
−1であり,A
−1の逆行列はA
である。A = ( a b c d )
のとき,
A
−1= 1 ad − bc
( d − b
− c a )
となる。
A
−1A = 1 ad − bc
( d − b
− c a
) ( a b c d )
= 1 ad − bc
( da − bc db − bd
− ca + ac − bc + ad )
= ( 1 0
0 1
) = I
2AA
−1= ( a b c d
) × 1 ad − bc
( d − b
− c a )
= 1 ad − bc
( ad − bc − ab + ba cd − dc − cb + da )
= ( 1 0
0 1
) = I
2連立方程式の解:
A
をn × n
行列,x
とb
をn × 1
行列(
ベクトル)
とする。Ax = b
両辺にA
−1を左から掛ける。A
−1Ax = A
−1b A
−1A = I
nなので,I
nx = A
−1b
となる。また,I
nx = x
なので,
x
をA, b
で表すと,x = A
−1b
となる。例
{
x + 2y = 3 4x + 5y = 6
の行列表示は,( 1 2
4 5
) ( x y
) = ( 3 6 )
となる。
x, y
の解は,( 1 2
4 5
)
−1( 1 2
4 5
) ( x y
) = ( 1 2
4 5
)
−1( 3 6 )
なので,
( 1 0
0 1
) ( x y
) = ( 1 2 4 5
)
−1( 3
6
)
すなわち,
( x y
) = ( 1 2
4 5
)
−1( 3 6 )
= 1
1 × 5 − 2 × 4
( 5 − 2
− 4 1 ) ( 3
6 )
= − 1 1 × 3
( 5 × 3 − 2 × 6
− 4 × 3 + 1 × 6
) = ( − 1 2
)
例
x + 2y + 3z = 4 5x + 6y + 7z = 8 9x + 10y + 11z = 12
の行列表示は,
1 2 3
5 6 7
9 10 11
x y z
=
4 8 12
となる。
x, y, z
の解は,
x y z
=
1 2 3
5 6 7
9 10 11
−1
4 8 12
となる。
転置行列:
A
をn × k
行列とする。A
のi j
要素をa
i j とする。A
の転置行列(A
0 またはtA)
のi j
要素は,a
jiとなる。A =
a
11· · · a
1k... ... ...
a
n1· · · a
nk
A
0=
a
11· · · a
n1... ... ...
a
1k· · · a
nk
A
0 はk × n
となる。(A
0)
0= A
x =
x
1x
2...
x
n
x
0= ( x
1x
2· · · x
n)
3 最小二乗法について
経済理論に基づいた線型モデルの係数の値をデータから求める時に用いられる 手法
= ⇒
最小二乗法3.1 最小二乗法と回帰直線
(X
1, Y
1), (X
2, Y
2), · · · , (X
n, Y
n)
のようにn
組のデータがあり,X
i とY
i との間に以 下の線型関係を想定する。Y
i= α + β X
i,
X
i は説明変数,Y
i は被説明変数,α , β
はパラメータとそれぞれ呼ばれる。上の式は回帰モデル
(
または,回帰式)
と呼ばれる。目的は,切片α
と傾きβ
をデータ{ (X
i, Y
i), i = 1 , 2 , · · · , n }
から推定すること,データについて:
1.
タイム・シリーズ(
時系列)
・データ:i
が時間を表す(
第i
期)
。2.
クロス・セクション(
横断面)
・データ:i
が個人や企業を表す(
第i
番目の 家計,第i
番目の企業)
。3.2 切片 α と傾き β の推定
次のような関数
S ( α, β )
を定義する。S ( α, β ) =
∑
n i=1u
2i=
∑
n i=1(Y
i− α − β X
i)
2 このとき,min
α,βS ( α, β )
となるような
α , β
を求める(
最小自乗法)
。このときの解をb α , b β
とする。最小化のためには,
∂ S ( α, β )
∂α = 0
∂ S ( α, β )
∂β = 0
を満たすα , β
がb α , b β
となる。すなわち,
b α , b β
は,∑
n i=1(Y
i− b α − b β X
i) = 0 , (1)
∑
n i=1X
i(Y
i− b α − b β X
i) = 0 , (2)
を満たす。さらに,
∑
n i=1Y
i= n b α + b β
∑
n i=1X
i, (3)
∑
n i=1X
iY
i= b α
∑
n i=1X
i+ b β
∑
n i=1X
i2,
行列表示によって,( ∑
n i=1Y
i∑
n i=1X
iY
i) = ( n ∑
ni=1
X
i∑
ni=1
X
i∑
ni=1
X
2i) (b α
b β ) ,
逆行列の公式:
( a b c d
)
−1= 1 ad − bc
( d − b
− c a )
b
α , b β
について,まとめて,(b α b β )
= ( n ∑
ni=1
X
i∑
ni=1
X
i∑
n i=1X
i2)
−1( ∑
n i=1Y
i∑
n i=1X
iY
i)
= 1
n ∑
ni=1
X
i2− ( ∑
ni=1
X
i)
2× ( ∑
ni=1
X
i2− ∑
ni=1
X
i− ∑
n=
X
in
) ( ∑
n i=1Y
i∑
n=
X
iY
i)
さらに,b
β
について解くと,b β = n ∑
ni=1
X
iY
i− ( ∑
ni=1
X
i)( ∑
n i=1Y
i) n ∑
ni=1
X
2i− ( ∑
n i=1X
i)
2=
∑
ni=1
X
iY
i− nXY
∑
ni=1
X
i2− nX
2=
∑
ni=1
(X
i− X)(Y
i− Y )
∑
ni=1
(X
i− X)
2 連立方程式の(3)
式から,b
α = Y − b β X
となる。ただし,X = 1 n
∑
n i=1X
i, Y = 1 n
∑
n i=1Y
i,
とする。数値例: 以下の数値例を使って,回帰式
Y
i= α + β X
i のα
,β
の推定値b α
,bβ
を求める。i Y
iX
i1 6 10
2 9 12
3 10 14
4 10 16
b α
,bβ
を求めるための公式はb β =
∑
ni=1
X
iY
i− nXY
∑
ni=1
X
2i− nX
2b α = Y − b β X
なので,必要なものは
X
,Y
,∑
n i=1X
i2,∑
n i=1X
iY
i である。i Y
iX
iX
iY
iX
i21 6 10 60 100
2 9 12 108 144
3 10 14 140 196
4 10 16 160 256
合計
∑ Y
i∑ X
i∑ X
iY
i∑ X
i235 52 468 696
平均
Y X
8.75 13
よって,
b β = 468 − 4 × 13 × 8 . 75 696 − 4 × 13
2= 13
20 = 0 . 65 b α = 8 . 75 − 0 . 65 × 13 = 0 . 3
となる。
注意事項:
1. α , β
は真の値で未知2. b α , b β
はα , β
の推定値でデータから計算される 回帰直線はb Y
i= b α + b β X
i,
として与えられる。上の数値例では,
b Y
i= 0 . 3 + 0 . 65X
i となる。i Y
iX
iX
iY
iX
i2b Y
i1 6 10 60 100 6.8
2 9 12 108 144 8.1
3 10 14 140 196 9.4
4 10 16 160 256 10.7
合計
∑
Y
i∑
X
i∑
X
iY
i∑
X
i2∑ b Y
i35 52 468 696 35.0
平均
Y X
8.75 13
図
2: Y
i,Xi,bY
i0 5 10 Yi
0 5 10 15 20
Xi
×
×
× ×
bYi→
b Y
i を実績値Y
i の予測値または理論値と呼ぶ。b u
i= Y
i− b Y
i, b u
i を残差と呼ぶ。Y
i= b Y
i+ b u
i= b α + b β X
i+ b u
i,
さらに,
Y
を両辺から引いて,(Y
i− Y) = ( b Y
i− Y) + b u
i,
3.3 残差 b u
iの性質について
b u
i= Y
i− b α − b β X
i に注意して,(1)
式から,∑
n i=1b u
i= 0 ,
を得る。(2)
式から,∑
n i=1X
ib u
i= 0 ,
を得る。b Y
i= b α + b β X
i から,∑
n i=1b Y
ib u
i= 0 ,
を得る。なぜなら,
∑
n i=1b Y
ib u
i=
∑
n i=1( b α + b β X
i) b u
i= b α
∑
n i=1b u
i+ b β
∑
n i=1X
ib u
i= 0
である。i Yi Xi bYi bui Xibui bYibui 1 6 10 6.8 −0.8 −8.0 −5.44
2 9 12 8.1 0.9 10.8 7.29
3 10 14 9.4 0.6 8.4 5.64 4 10 16 10.7 −0.7 −11.2 −7.49 合計 ∑
Yi ∑
Xi ∑ bYi ∑bui ∑
Xibui ∑ bYibui
35 52 35.0 0.0 0.0 0.00
3.4 決定係数 R
2について
次の式
(Y
i− Y) = ( b Y
i− Y) + b u
i,
の両辺を二乗して,総和すると,∑
n i=1(Y
i− Y)
2=
∑
n i=1( ( b Y
i− Y) + b u
i)
2=
∑
n i=1( b Y
i− Y)
2+ 2
∑
n i=1( b Y
i− Y) b u
i+
∑
n i=1b u
2i=
∑
n i=1( b Y
i− Y)
2+
∑
n i=1b u
2i となる。まとめると,∑
n i=1(Y
i− Y)
2=
∑
n i=1( b Y
i− Y)
2+
∑
n i=1b u
2iを得る。さらに,
1 =
∑
ni=1
( b Y
i− Y)
2∑
ni=1
(Y
i− Y)
2+
∑
n i=1b u
2i∑
ni=1
(Y
i− Y )
2 それぞれの項は,1.
∑
n i=1(Y
i− Y)
2= ⇒ y
の全変動2.
∑
n i=1(b Y
i− Y)
2= ⇒ b Y
i(
回帰直線)
で説明される部分3.
∑
n i=1b u
2i= ⇒ b Y
i(
回帰直線)
で説明されない部分 となる。回帰式の当てはまりの良さを示す指標として,決定係数
R
2を以下の通りに 定義する。R
2=
∑
ni=1
( b Y
i− Y)
2∑
ni=1
(Y
i− Y)
2または,
R
2= 1 −
∑
n i=1b u
2i∑
ni=1
(Y
i− Y)
2,
として書き換えられる。または,
Y
i= b Y
i+ b u
i と∑
n i=1( b Y
i− Y)
2=
∑
n i=1( b Y
i− Y)(Y
i− Y − b u
i)
=
∑
n i=1( b Y
i− Y)(Y
i− Y) −
∑
n i=1( b Y
i− Y) b u
i=
∑
n i=1( b Y
i− Y)(Y
i− Y)
を用いて,R
2=
∑
ni=1
( b Y
i− Y)
2∑
n=
(Y
i− Y)
2=
(∑
ni=1
(b Y
i− Y)
2)
2∑
ni=1
(Y
i− Y)
2∑
ni=1
( b Y
i− Y )
2=
∑
ni=1
( b Y
i− Y)(Y
i− Y)
√∑
ni=1
(Y
i− Y)
2∑
ni=1
( b Y
i− Y )
2
2
と書き換えられる。すなわち,R2は
Y
i とb Y
iの相関係数の二乗と解釈される。∑
n i=1(Y
i− Y )
2=
∑
n i=1( b Y
i− Y)
2+
∑
n i=1b u
2i から,明らかに,0 ≤ R
2≤ 1 ,
となる。
R
2 が1
に近づけば回帰式の当てはまりは良いと言える。しかし,t
分 布のような数表は存在しない。したがって,「どの値よりも大きくなるべき」と いうような基準はない。慣習的には,メドとして
0.9
以上を判断基準にする。数値例: 決定係数の計算には以下の公式を用いる。
R
2= 1 −
∑
ni=1
b u
2i∑
ni=1
(Y
i− Y )
2= 1 −
∑
ni=1
b u
2i∑
ni=1
Y
i2− nY
2 計算に必要なものは,b u
i= Y
i− ( b α + b β X
i)
,Y
,∑
n i=1Y
i2である。i Yi Xi bYi bui bui Yi2 1 6 10 6.8 −0.8 0.64 36
2 9 12 8.1 0.9 0.81 81
3 10 14 9.4 0.6 0.36 100 4 10 16 10.7 −0.7 0.49 100 合計 ∑
Yi ∑
Xi ∑ bYi ∑bui ∑bu2i ∑ Yi2 35 52 35.0 0.0 2.30 317
∑ b u
2i= 2 . 30
,X = 13
,Y = 8 . 75
,∑
n i=1Y
i2= 317
なので,R
2= 1 − 2 . 30
317 − 4 × 8 . 75
2= 1 − 2 . 30
10 . 75 = 0 . 786
3.5 まとめ
b α
,bβ
を求めるための公式はb β =
∑
ni=1
X
iY
i− nXY
∑
ni=1
X
2i− nX
2b α = Y − b β X
なので,必要なものは
X
,Y
,∑
n i=1X
i2,∑
n i=1X
iY
i である。決定係数の計算には以下の公式を用いる。
R
2= 1 −
∑
n i=1b u
2i∑
ni=1
(Y
i− Y )
2= 1 −
∑
n i=1b u
2i∑
ni=1
Y
i2− nY
2 計算に必要なものは,∑ b u
2i,Y
,∑
n i=1Y
i2である。4 統計学の回帰分析への応用
(X
1, Y
1), (X
2, Y
2), · · · , (X
n, Y
n)
のようにn
組のデータがあり,X
i とY
i との間に線 型関係を想定する。Y
i= α + β X
i最小二乗法を用いて,データに直線のあてはめを行った。
b
α
,bβ
,bY
iを求めるための公式はb β=
∑
ni=1
(X
i− X)(Y
i− Y)
∑
ni=1
(X
i− X)
2=
∑
ni=1
(X
i− X)Y
i∑
ni=1
(X
i− X)
2b α = Y − b β X , b Y
i= b α + b β X
i,
である。Y
i,bY
i,b u
i,b α
,bβ
の関係は以下の通りである。Y
i= b Y
i+ b u
i= b α + b β X
i+ b u
i 残差b u
i が必ず含まれることから,Y
i= α + β X
i+ u
i,
として誤差項
(
または,攪乱項) u
i を含め,それを確率変数として考える。= ⇒
確率的モデルY
i: 被説明変数,従属変数X
i: 説明変数,独立変数α , β
: 未知母数(
未知パラメータ) b α , b β
: 推定量(
特に,最小二乗推定量)
1.
残差b u
iはu
i の実現値としてみなすことができる。2. b α
,bβ
の性質を統計学的に考察可能となる。統計学の復習