エコノメトリックス II (2011 年度後期 講義ノート )
平成
23
年9
月29
日(木)
版谷﨑 久志
大阪大学大学院経済学研究科
目 次
1
最小二乗法(2変数)について1
1.1
最小二乗法と回帰直線. . . . 1
1.2
切片α
と傾きβ
の推定. . . . 1
1.3
残差u b
i の性質について. . . . 2
1.4
決定係数R
2について. . . . 3
1.5
まとめ. . . . 4
2
重回帰の行列表示4 3
行列について6 3.1
行列の微分. . . . 6
3.2
分布関数. . . . 6
4
多重回帰: 再考6 5
制約付き最小自乗法13 6 F
分布(制約付き最小自乗法と制約なし最小自乗
法との関係) 15 7
例:F
分布(制約付き最小自乗法と制約なし最小
自乗法との関係) 16 8
一般化最小自乗法(GLS) 18 8.1
例: 混合推定(Theil and Goldberger Model) 20 9
最尤法(MLE) 20 9.1
回帰モデルの最尤法:2
変数の場合. . . . 22
9.2
回帰モデルの最尤法: 多変数の場合I . . . 23
9.3
回帰モデルの最尤法: 多変数の場合II . . 23
9.4 AR(1)
モデルの最尤法. . . . 24
9.5
回帰モデルの最尤法:一階の自己相関のケース25 9.6
回帰モデルの最尤法: 不均一分散のケース26 10
漸近理論26 11
最小自乗推定値の一致性と漸近的正規性28 12
操作変数法30 12.1
測定誤差. . . . 30
12.2
操作変数法. . . . 31
12.3 2
段階最小二乗法. . . . 32
13
大標本検定33
13.1 Wald, LM, LR
テスト. . . . 33
13.2
尤度比検定の使用例. . . . 34
14
不均一分散38 15
自己相関39 16
特定化誤差43 17
多重共線性44 18
時系列分析45 18.1
時系列分析の準備. . . . 45
18.2 AR
モデル. . . . 46
18.3 MA
モデル. . . . 51
18.4 ARMA
モデル. . . . 53
18.5 ARIMA
モデル. . . . 54
18.6 SARIMA
モデル. . . . 54
18.7
最適予測. . . . 54
18.8
識別(同定, Identification)
・推定問題. . 55
18.9
周波数領域. . . . 61
18.10ARCH
モデル. . . . 61
19
単位根,共和分62 19.1
単位根(Unit Root) . . . . 62
19.2
共和分(Cointegration) . . . . 69 20 GMM (Generalized Mothod of Moments) 70
21
その他のトピック72
•
この講義ノートは,http://www2.econ.osaka-u.ac.jp/~tanizaki/class/2011
からダウンロード可。1 最小二乗法(2変数)について
経済理論に基づいた線型モデルの係数の値をデータから求 める時に用いられる手法
= ⇒
最小二乗法1.1
最小二乗法と回帰直線(X
1, Y
1), (X
2, Y
2), · · · , (X
n, Y
n)
のようにn
組のデータが あり,Xi とY
i との間に以下の線型関係を想定する。Y
i= α + βX
i,
X
iは説明変数,Yi は被説明変数,α,β
はパラメータとそ れぞれ呼ばれる。上の式は回帰モデル
(または,回帰式)
と呼ばれる。目的 は,切片α
と傾きβ
をデータ{ (X
i, Y
i), i = 1, 2, · · · , n }
から推定すること,データについて:
1.
タイム・シリーズ(時系列)・データ: i
が時間を表す(第 i
期)。2.
クロス・セクション(横断面)・データ: i
が個人や企 業を表す(第 i
番目の家計,第i
番目の企業)。1.2
切片α
と傾きβ
の推定次のような関数
S(α, β)
を定義する。S(α, β) =
∑
n i=1u
2i=
∑
n i=1(Y
i− α − βX
i)
2 このとき,min
α,β
S(α, β)
となるような
α, β
を求める(最小自乗法)。このときの解
をα, b β b
とする。最小化のためには,
∂S(α, β)
∂α = 0
∂S(α, β)
∂β = 0
を満たす
α, β
がα, b β b
となる。すなわち,b
α, β b
は,∑
n i=1(Y
i− α b − βX b
i) = 0, (1)
∑
n i=1X
i(Y
i− α b − βX b
i) = 0, (2)
を満たす。さらに,
∑
n i=1Y
i= n α b + β b
∑
n i=1X
i, (3)
∑
n i=1X
iY
i= α b
∑
n i=1X
i+ β b
∑
n i=1X
i2,
行列表示によって,( ∑
n i=1Y
i∑
n i=1X
iY
i)
=
( n ∑
n i=1X
i∑
n i=1X
i∑
n i=1X
i2) ( α b β b
) ,
逆行列の公式:( a b c d
)
−1= 1
ad − bc
( d − b
− c a )
b
α, β b
について,まとめて,( α b β b
)
=
( n ∑
n i=1X
i∑
ni=1
X
i∑
n i=1X
i2)
−1( ∑
n i=1Y
i∑
n i=1X
iY
i)
= 1
n ∑
ni=1
X
i2− ( ∑
n i=1X
i)
2× ( ∑
ni=1
X
i2− ∑
n i=1X
i− ∑
ni=1
X
in
) ( ∑
n i=1Y
i∑
n i=1X
iY
i)
さらに,
β b
について解くと,β b = n ∑
ni=1
X
iY
i− ( ∑
ni=1
X
i)( ∑
n i=1Y
i) n ∑
ni=1
X
i2− ( ∑
n i=1X
i)
2=
∑
ni=1
X
iY
i− nXY
∑
ni=1
X
i2− nX
2=
∑
ni=1
(X
i− X )(Y
i− Y )
∑
ni=1
(X
i− X)
2 連立方程式の(3)
式から,b
α = Y − βX b
となる。ただし,X = 1 n
∑
n i=1X
i, Y = 1 n
∑
n i=1Y
i,
とする。数値例: 以下の数値例を使って,回帰式
Y
i= α + βX
i のα,β
の推定値α, b β b
を求める。i Y
iX
i1 6 10
2 9 12
3 10 14 4 10 16 b
α, β b
を求めるための公式はβ b =
∑
ni=1
X
iY
i− nXY
∑
ni=1
X
i2− nX
2b
α = Y − βX b
なので,必要なものは
X,Y
,∑
n i=1X
i2,∑
n i=1X
iY
i である。i Y
iX
iX
iY
iX
i21 6 10 60 100
2 9 12 108 144
3 10 14 140 196
4 10 16 160 256
合計
∑ Y
i∑ X
i∑ X
iY
i∑ X
i235 52 468 696
平均
Y X
8.75 13
よって,
β b = 468 − 4 × 13 × 8.75 696 − 4 × 13
2= 13
20 = 0.65 b
α = 8.75 − 0.65 × 13 = 0.3
となる。注意事項:
1. α, β
は真の値で未知2. α, b β b
はα, β
の推定値でデータから計算される 回帰直線はY b
i= α b + βX b
i,
として与えられる。上の数値例では,
Y b
i= 0.3 + 0.65X
i となる。i Y
iX
iX
iY
iX
i2Y b
i1 6 10 60 100 6.8
2 9 12 108 144 8.1
3 10 14 140 196 9.4
4 10 16 160 256 10.7
合計
∑
Y
i∑
X
i∑
X
iY
i∑
X
i2∑ b Y
i35 52 468 696 35.0
平均
Y X
8.75 13
図
2: Y
i,Xi,Y b
i0 5 10
Yi
0 5 10 15 20
Xi
×
×
× ×
b
Yi→
Y b
i を実績値Y
i の予測値または理論値と呼ぶ。b
u
i= Y
i− Y b
i, b
u
i を残差と呼ぶ。Y
i= Y b
i+ u b
i= α b + βX b
i+ u b
i,
さらに,Y を両辺から引いて,(Y
i− Y ) = ( Y b
i− Y ) + b u
i,
1.3
残差u b
i の性質についてb
u
i= Y
i− α b − βX b
i に注意して,(1)式から,∑
n i=1b u
i= 0,
を得る。(2)
式から,∑
n i=1X
ib u
i= 0,
を得る。
Y b
i= α b + βX b
i から,∑
n i=1Y b
iu b
i= 0,
を得る。なぜなら,∑
n i=1Y b
iu b
i=
∑
n i=1( α b + βX b
i) u b
i= α b
∑
n i=1b u
i+ β b
∑
n i=1X
iu b
i= 0
である。i Y
iX
iY b
iu b
iX
iu b
iY b
ib u
i1 6 10 6.8 − 0.8 − 8.0 − 5.44
2 9 12 8.1 0.9 10.8 7.29
3 10 14 9.4 0.6 8.4 5.64
4 10 16 10.7 − 0.7 − 11.2 − 7.49
合計
∑ Y
i∑ X
i∑ b Y
i∑ u b
i∑
X
iu b
i∑ b Y
ib u
i35 52 35.0 0.0 0.0 0.00
1.4
決定係数R
2 について次の式
(Y
i− Y ) = ( Y b
i− Y ) + b u
i,
の両辺を二乗して,総和すると,∑
n i=1(Y
i− Y )
2=
∑
n i=1(
( Y b
i− Y ) + u b
i)
2=
∑
n i=1( Y b
i− Y )
2+ 2
∑
n i=1( Y b
i− Y ) u b
i+
∑
n i=1b u
2i=
∑
n i=1(b Y
i− Y )
2+
∑
n i=1b u
2i となる。まとめると,∑
n i=1(Y
i− Y )
2=
∑
n i=1( Y b
i− Y )
2+
∑
n i=1b u
2i を得る。さらに,1 =
∑
ni=1
( Y b
i− Y )
2∑
ni=1
(Y
i− Y )
2+
∑
n i=1b u
2i∑
ni=1
(Y
i− Y )
2 それぞれの項は,1.
∑
n i=1(Y
i− Y )
2= ⇒ y
の全変動2.
∑
n i=1( Y b
i− Y )
2= ⇒ Y b
i(回帰直線)
で説明される部分3.
∑
n i=1b
u
2i= ⇒ Y b
i(回帰直線)
で説明されない部分 となる。回帰式の当てはまりの良さを示す指標として,決定係数
R
2 を以下の通りに定義する。R
2=
∑
ni=1
( Y b
i− Y )
2∑
ni=1
(Y
i− Y )
2 または,R
2= 1 −
∑
n i=1b u
2i∑
ni=1
(Y
i− Y )
2,
として書き換えられる。または,Yi
= Y b
i+ u b
i と∑
n i=1( Y b
i− Y )
2=
∑
n i=1( Y b
i− Y )(Y
i− Y − u b
i)
=
∑
n i=1( Y b
i− Y )(Y
i− Y ) −
∑
n i=1( Y b
i− Y ) b u
i=
∑
n i=1( Y b
i− Y )(Y
i− Y )
を用いて,R
2=
∑
ni=1
( Y b
i− Y )
2∑
ni=1
(Y
i− Y )
2=
(∑
ni=1
(b Y
i− Y )
2)
2∑
ni=1
(Y
i− Y )
2∑
ni=1
( Y b
i− Y )
2=
∑
ni=1
( Y b
i− Y )(Y
i− Y )
√∑
ni=1
(Y
i− Y )
2∑
ni=1
( Y b
i− Y )
2
2
と書き換えられる。すなわち,R2は
Y
i とY b
i の相関係数 の二乗と解釈される。∑
n i=1(Y
i− Y )
2=
∑
n i=1( Y b
i− Y )
2+
∑
n i=1b
u
2i から,明らかに,0 ≤ R
2≤ 1,
となる。R2 が
1
に近づけば回帰式の当てはまりは良いと 言える。しかし,t分布のような数表は存在しない。した がって,「どの値よりも大きくなるべき」というような基準 はない。慣習的には,メドとして
0.9
以上を判断基準にする。数値例: 決定係数の計算には以下の公式を用いる。
R
2= 1 −
∑
n i=1b u
2i∑
ni=1
(Y
i− Y )
2= 1 −
∑
n i=1b u
2i∑
ni=1
Y
i2− nY
2 計算に必要なものは,bu
i= Y
i− ( α b + βX b
i),Y
,∑
n i=1Y
i2 で ある。i Y
iX
iY b
ib u
ib u
iY
i21 6 10 6.8 − 0.8 0.64 36
2 9 12 8.1 0.9 0.81 81
3 10 14 9.4 0.6 0.36 100
4 10 16 10.7 − 0.7 0.49 100
合計
∑ Y
i∑ X
i∑ b Y
i∑ b u
i∑ b u
2i∑ Y
i235 52 35.0 0.0 2.30 317
∑ b u
2i= 2.30,X = 13,Y = 8.75,
∑
n i=1Y
i2= 317
なので,R
2= 1 − 2.30
317 − 4 × 8.75
2= 1 − 2.30
10.75 = 0.786
1.5
まとめb
α, β b
を求めるための公式はβ b =
∑
ni=1
X
iY
i− nXY
∑
ni=1
X
i2− nX
2b
α = Y − βX b
なので,必要なものは
X,Y
,∑
n i=1X
i2,∑
n i=1X
iY
i である。決定係数の計算には以下の公式を用いる。
R
2= 1 −
∑
n i=1b u
2i∑
ni=1
(Y
i− Y )
2= 1 −
∑
n i=1b u
2i∑
ni=1
Y
i2− nY
2 計算に必要なものは,∑
b u
2i,Y,∑
n i=1Y
i2 である。2 重回帰の行列表示
1.
回帰モデルy
t= β
1x
1t+ β
2x
2t+ · · · + β
kx
kt+ u
t,
ただし,t= 1, 2, · · · , T
とする。2.
攪乱項u
tの仮定(a) u
t∼ iid (0, σ
2)
(b) x
1t, x
2t, · · · , x
kt とu
tは無相関(c) x
1t, x
2t, · · · , x
kt, y
tは定常(大標本特性を調べる
場合に必要)(d) β
の推定値の仮説検定を行うときには,ut∼ iid N (0, σ
2)
の仮定が必要3. x
1t= 1
のとき,β1 は定数項となる。4.
最小自乗法S(β
1, β
2, · · · , β
k)
=
∑
T t=1(y
t− β
1x
1t− β
2x
2t− · · · − β
kx
kt)
2S(β
1, β
2, · · · , β
k)
を最小にするβ
1, β
2, · · · , β
k をその 推定値とする。=⇒ β b
1, β b
2, · · · , β b
kそれぞれの要素で偏微分する。
∂S(β
1, β
2, · · · , β
k)
∂β
1t= − 2
∑
T t=1x
1t(y
t− β
1x
1t− β
2x
2t− · · · − β
kx
kt)
= 0
∂S(β
1, β
2, · · · , β
k)
∂β
2t= − 2
∑
T t=1x
2t(y
t− β
1x
1t− β
2x
2t− · · · − β
kx
kt)
= 0 .. .
∂S(β
1, β
2, · · · , β
k)
∂β
kt= − 2
∑
T t=1x
kt(y
t− β
1x
1t− β
2x
2t− · · · − β
kx
kt)
= 0
まとめて,
∑ x
1ty
t= β
1∑ x
21t+ β
2∑ x
1tx
2t+ · · · + β
k∑ x
1tx
kt∑ x
2ty
t= β
1∑ x
2tx
1t+ β
2∑ x
22t+ · · · + β
k∑
x
2tx
kt.. .
∑ x
kty
t= β
1∑ x
ktx
1t+ β
2∑ x
ktx
2t+ · · · + β
k∑ x
2ktさらに,行列でまとめて,
∑ x
21t∑
x
1tx
2t· · · ∑ x
1tx
kt∑ x
2tx
1t∑
x
22t· · · ∑ x
2tx
kt.. . .. . .. . · · ·
∑ x
ktx
1t∑ x
ktx
2t· · · ∑ x
2kt
×
β
1β
2.. . β
k
=
∑ x
1ty
t∑ x
2ty
t.. .
∑ x
kty
t
5.
行列表示が簡単y
t= β
1x
1t+ β
2x
2t+ · · · + β
kx
kt+ u
t= (x
1tx
2t· · · x
kt)
β
1β
2.. . β
k
+ u
t= x
tβ + u
t ただし,x
t= (x
1tx
2t· · · x
kt),
β =
β
1β
2.. . β
k
,
とする。
y
1= x
1β + u
1y
2= x
2β + u
2.. .
y
T= x
Tβ + u
T行列でまとめる。
y
1y
2.. . y
T
=
x
1x
2.. . x
T
β +
u
1u
2.. . u
T
y = Xβ + u
ただし,
y =
y
1y
2.. . y
T
,
X =
x
1x
2.. . x
T
,
u =
u
1u
2.. . u
T
とする。
6.
それぞれの行列の次元は以下のとおり。x
t: 1 × k,
β: k × 1,
y: T × 1,
X : T × k,
u: T × 1
3 行列について
A : T × T , B : n × m, C : m × k, D : k × n,
1. tr(A) =
∑
T i=1a
ii, where A = [a
ij] . 2. If A is idempotent, A = A
2= A
0A .
3. A is idempotent if and only if the eigen values of A consist of 1 and 0.
4. If A is idempotent, rank(A) =tr(A) . 5. tr(BCD) =tr(CDB)
3.1
行列の微分a, x : T × 1, y : K × 1, A : T × T , B : T × K 1. ∂a
0x
∂x = ∂x
0a
∂x = a a
0x,x
0a
共にスカラー2. ∂x
0Ax
∂x = (A + A
0)x 3. ∂
2x
0Ax
∂x∂x
0= (A + A
0) 4. ∂x
0By
∂B = xy
05. ∂tr A
∂A = I 6. ∂ log | A |
∂A = (A
0)
−13.2
分布関数a, x, y, µ : T × 1, Σ, A, B : T × T , σ : scalar
1. If x ∼ N (µ, Σ), then a
0x ∼ N (a
0µ, a
0Σa) .
2. If x ∼ N (µ, Σ), then (x − µ)
0Σ
−1(x − µ) ∼ χ
2(T ) 3. x: n × 1,
y: m × 1
とする。x∼ N (µ
x, Σ
x), y ∼ N(µ
y, Σ
y), x
とy
は独立(E (
(x − µ
x)(y − µ
y)
0)
= 0)
のとき,(x − µ
x)
0Σ
−x1(x − µ
x)/n
(y − µ
y)
0Σ
−y1(y − µ
y)/m ∼ F (n, m)
4. If x ∼ N (0, σ
2I) and A is a symmetric idempotent T × T matrix of rank G, then x
0Ax/σ
2∼ χ
2(G).
5. If x ∼ N (0, σ
2I), A and B are symmetric idempotent T × T matrices of rank G and K, and AB = 0, then
x
0Ax Gσ
2/ x
0Bx
Kσ
2= x
0Ax/G
x
0Bx/K ∼ F(G, K).
4 多重回帰: 再考
y : T × 1, X : T × k, β : k × 1, u : T × 1,
1. u = (u
1, u
2, · · · , u
t)
0 とする。∑
T t=1u
2t= u
0u
2. Regression model: y = Xβ + u, u ∼ (0, σ
2I)
最小二乗推定量min
β
(y − Xβ)
0(y − Xβ)
u
0u = (y − Xβ)
0(y − Xβ)
= y
0y − 2β
0X
0y + β
0X
0Xβ
最小化のためには∂u
0u
∂β = − 2X
0y + 2X
0Xβ = 0
で,これを満たす
β
を最小二乗推定量と呼び,β b
で 表す。β b = (X
0X )
−1X
0y
3.
最小化のための2
階の条件:∂
2u
0u
∂β∂β
0= 2X
0X
は正値定符号行列c = Xd
とすると,任意のd 6 = 0
についてc
0c = d
0X
0Xd > 0
となる。(*)
正値定符号行列,負値定符号行列について(a)
正値定符号行列:任意のベクトル
x 6 = 0
について,x0Ax > 0
が成 り立つとき,Aは正値定符号行列(positive defi- nite matrix)
という。正値定符号行列の固有値はすべて正である。
(b)
負値定符号行列:任意のベクトル
x 6 = 0
について,x0Ax < 0
が成 り立つとき,Aは負値定符号行列(positive defi- nite matrix)
という。負値定符号行列の固有値はすべて負である。
4. β b = (X
0X)
−1X
0y
= (X
0X)
−1X
0(Xβ + u)
= β + (X
0X )
−1X
0u
5.
最小二乗推定量β b = (X
0X )
−1X
0y
はy
に関して線形= ⇒
線形推定量6. E( β) = b β + (X
0X )
−1X
0E(u) = β
= ⇒
線形不偏推定量7. V( β) = E b (
( β b − β)(b β − β)
0)
= E (
((X
0X )
−1X
0u)((X
0X )
−1X
0u)
0)
= (X
0X)
−1X
0E(uu
0)X(X
0X)
−1= σ
2(X
0X)
−18. u ∼ N(0, σ
2I
T)
のとき,β b ∼ N (β, σ
2(X
0X )
−1)
さらに,
( β b − β)
0X
0X( β b − β)
σ
2∼ χ
2(k)
を得る。(*) x
をk × 1
の確率変数とする。x ∼ N(µ, Σ) = ⇒ (x − µ)
0Σ
−1(x − µ) ∼ χ
2(k)
9. Properties of β b : BLUE (best linear unbiased estima- tor), i.e., Unbiased and efficient estimator in linear class (Gauss-Markov theorem)
証明:
適当な他の線形不偏推定量を
β e = Cy
とする。β e = Cy
= C(Xβ + u)
= CXβ + Cu
なので,E( β e ) = CXβ + CE(u)
= CXβ
を得る。β e = Cy
を線形不偏推定量と仮定したので,E( β e ) = β
, すなわち,CX= I
を得る。次に,
β e = Cy
の分散を求める。β e = C(Xβ + u)
= β + Cu
なので,V( β e ) = E( β e − β )( β e − β)
0= E(Cuu
0C
0)
= σ
2CC
0 を得る。D = C − (X
0X )
−1X
0 を定義する。V( β) = e σ
2CC
0= σ
2(
D + (X
0X)
−1X
0)(
D + (X
0X )
−1X
0)
0 さらに,CX = I = (
D + (X
0X)
−1X
0)
X = DX + I
により,DX = 0
を得る。したがって,
V( β) e
= σ
2CC
0= σ
2(
D + (X
0X )
−1X
0)(
D + (X
0X)
−1X
0)
0= σ
2(X
0X )
−1+ σ
2DD
0= V( β) + b σ
2DD
0よって,V(
β) e − V( β) b
は正値定符号行列= ⇒ β b
は最小分散不偏推定量10. σ
2 の推定量をs
2とする。s
2= 1
T − k (y − X β) b
0(y − X β), b because
y − X β b = y − X (X
0X )
−1X
0y
= (I
T− X(X
0X )
−1X
0)y
= (I
T− X(X
0X )
−1X
0)(Xβ + u)
= (I
T− X(X
0X )
−1X
0)u and
E ( 1
T − k (y − X β) b
0(y − X β) b )
= 1
T − k E (
((I
T− X (X
0X )
−1X
0)u)
0((I
T− X (X
0X )
−1X
0)u) )
= 1
T − k E (
u
0(I
T− X (X
0X )
−1X
0)
0(I
T− X (X
0X)
−1X
0)u )
= 1
T − k E (
u
0(I
T− X (X
0X )
−1X
0)u )
= 1
T − k E (
tru
0(I
T− X (X
0X )
−1X
0)u )
= 1
T − k tr (
(I
T− X (X
0X )
−1X
0)E(uu
0) )
= 1
T − k σ
2tr (
(I
T− X(X
0X)
−1X
0) )
= 1
T − k σ
2(T − k)
= σ
2トレースについて:
1. A: k × k tr(A) = ∑
ki=1
a
iia
ii はA
の第i
行,第j
列の要素2. a:
スカラー(1 × 1)
tr(a) = a
3. A: T × k, B: k × T
のとき,tr(AB) = tr(BA)
4. tr[X(X
0X )
−1X
0] = tr[(X
0X)
−1X
0X] = tr(I
k) 5. X :
確率変数行列のとき,E[tr(X)] = tr[E(X )]
F
分布(H
0: β = 0)
について:1. If u ∼ N (0, σ
2I
T), then β b ∼ N (β, σ
2(X
0X)
−1) . Therefore,
( β b − β)
0X
0X ( β b − β)
σ
2∼ χ
2(k).
(a) ( β b − β)
0X
0X ( β b − β)
σ
2∼ χ
2(k)
の証明:β b − β = (X
0X)
−1X
0u
なので,(b β − β)
0X
0X (b β − β)
= (
(X
0X )
−1X
0u )
0X
0X(X
0X)
−1X
0u
= u
0X (X
0X)
−1X
0X(X
0X)
−1X
0u
= u
0X (X
0X)
−1X
0u
を得る。X(X
0X )
−1X
0 はべき等行列(idempotent, i.e., A
0A = A)
であることに注意すると,u
0X (X
0X )
−1X
0u σ
2∼ χ
2(
tr (
X (X
0X )
−1X
0))
しかも,
tr (
X (X
0X )
−1X
0)
= tr (
(X
0X)
−1X
0X )
= tr(I
k)
= k
なので,u
0X(X
0X )
−1X
0u
σ
2∼ χ
2(k) (b) (*)
公式:確率変数
x ∼ N (0, I
k)
とする。このとき,x
0Ax ∼ χ
2(
Rank(A) )
となる。また,Aがべき等行列
(idempotent, i.e., A
0A = A)
のとき,Rank(A) = tr(A)
なので,x
0Ax ∼ χ
2( tr(A) )
となる。ここでは,
u ∼ N (0, σ
2I
T)
なので,1
σ u ∼ N(0, I
T)
を当てはめればよい。行列の階数
(Rank)
について:一次独立な行ベクトル
(または,列ベクトル)
の 最大個数(行ベクトルが張る空間の次元) 2.
残差平方和について,b
u = y − X β b
= y − X(X
0X)
−1X
0y
= (
I − X (X
0X )
−1X
0) y
= (
I − X (X
0X )
−1X
0)
(Xβ + u)
= (
I − X (X
0X )
−1X
0) Xβ
+ (
I − X (X
0X )
−1X
0) u
= (
X − X (X
0X )
−1X
0X ) β + (
I − X (X
0X )
−1X
0) u
= (
I − X (X
0X )
−1X
0) u
なので,b u
0u b = ((
I − X(X
0X )
−1X
0) u
)
0( I − X (X
0X )
−1X
0)
u
= u
0(
I − X(X
0X)
−1X
0) ( I − X (X
0X )
−1X
0)
u
= u
0(
I − X(X
0X)
−1X
0) u
と変形され,b u
0b u
σ
2= u
0(
I − X (X
0X )
−1X
0) u σ
2∼ χ
2(
tr (
I − X (X
0X )
−1X
0))
を得る。tr (
I − X (X
0X )
−1X
0)
= tr(I
T) − tr (
X(X
0X )
−1X
0)
= tr(I
T) − tr (
(X
0X )
−1X
0X )
= tr(I
T) − tr(I
k)
= T − k
なので,b u
0b u
σ
2= (T − k)s
2σ
2∼ χ
2(T − k)
途中で以下の式が使われている。