担当:鹿野(大阪府立大学)
2013 年度後期
はじめに
前回の復習
ダミー変数を、 回帰モデルの説明変数として使う。
係数ダミー、線形確率モデル、 複数のグループのダミー。
今回学ぶこと
仮説検定の上級編 :回帰係数への線形制約。
F検定の考え方。
テキスト該当箇所 :6.1章。
1 線形制約と OLS 残差 2 乗和
1.1 回帰係数への線形制約とは?
複数の回帰係数への仮説値 :重回帰モデル
Yi = α + β1X1i+ β2X2i+ · · · + βKXKi+ ui (1)
の、係数に関する仮説検定を考える。
⊲ の仮説検定⇒t検定(講義ノート#09、#11)。特に有意性のt検定 H0 : βj= 0が重要。
⊲ 上級編: について仮説値の検定をするには ?
例:説明変数がK = 3個の重回帰モデル
Yi= α + β1X1i+ β2X2i+ β3X3i+ ui. (2)
⊲ X3iの係数の有意性検定⇒t検定。
H0: β3 = 0 ⇒ t0= ˆβ3
s.e.( ˆβ3). (3)
およそ|t0|>2なら上記帰無仮説を棄却、X3iはYiに有意な影響。 1
⊲ 複数の係数の有意性 ( )
H0: β1 = β2= β3 = 0 (4)
の有意性を検定するには ?
例:対数線形化したコブ ・ダグラス型生産関数 (講義ノート#13)
log(Qi) = α + β1log(Li) + β2log(Ki) + ui. (5) β1=労働(Li)弾力性、β2=資本(Ki)弾力性。
⊲ 規模に関する (一次同次性) の仮定
H0: β1+ β2= 1 (6)
を、どうやって仮説検定する ?
線形制約:回帰モデルの複数の係数にまたがる帰無仮説を、 と呼ぶ。
⊲ 例:「H0: β1+ β2= 1」、「H0: β3 = β4= 0」など。
⊲ 制約の数をGと置く。
⊲ 注意:「H0: β1+ β2= 1」ならG = 1、「H0 : β3= β4 = 0」ならG = 2。∴制約の数は、 をカウント。(間違えやすいので注意。)
Remark:t検定では、線形制約を検定できない。
⊲ 複数の仮説を、 するには?⇒F検定。F統計量による検定。
⊲ より実用的な、 カイ2乗統計量による近似。
1.2 線形制約の OLS 残差 2 乗和への影響
通常のOLS残差2乗和:簡単化のため、説明変数が二つ(K = 2)の重回帰モデル Yi= α + β1X1i+ β2X2i+ ui (7) のOLS推定を考える。(古典的仮定CR1∼CR5は成立すると仮定。)
⊲ OLS推定量は、残差2乗和(予測誤差)最小化の解(講義ノート#06、#11)。 Q( ) =e2i =(Yi−a − b1X1i−b2X2i)2 −−−−−−−−−−−−−a, b1, b2で最小化→ α, ˆˆ β1, ˆβ2.
(8)
⊲ OLS残差ˆuiの2乗和は
Q( ˆα, ˆβ1, ˆβ2) =ˆu2i, ˆui= Yi−α − ˆˆ β1X1i− ˆβ2X2i. (9) ...これは決定係数R2(講義ノート#07) の計算で登場した数値。 最小化されたOLS の目的関数。
⊲ 以下、制約なしのナチュラルなOLS残差2乗和を
(10)
(sum of squared errors)と置く。
線形制約下のOLS残差2乗和:いま分析者が、線形制約
H0: α = 5, β2= 2 (11)
を置いたとする。
⊲ この制約下で、(7)式は
Yi = 5 + β1X1i+ 2X2i+ vi. (12)
⊲ 注意:制約なしのモデル(7)式と区別するために、 誤差項をviと表記。
⊲ このとき残差2乗和とOLS推定量は
Q( ) =(Yi−5 − b1X1i−2X2i)2 −−−−−−−−−b1で最小化→ β˜1. (13) 線形制約よりα = 5、β2 = 2。∴OLSで決めることができるのは、 のOLS推 定量β˜1のみ。
⊲ 線形制約の下でのOLS残差2乗和は
Q(5, ˜β1,2) =ˆv2i, ˆvi= Yi−5 − ˜β1X1i−2X2i. (14)
これを以下のように略記する。
. (15)
Remark:線形制約なし・線形制約ありの残差2乗和を比較。
⊲ SSE = ˆu2i: を調節して、 残差2乗和を最小化。 すべての調節弁を
操作。
⊲ SSE0= ˆv2i: 調節して、残差2乗和を最小化。(一部の係数は、 線形制約であらかじめ固定。) 一部の調節弁しか操作できない。
⊲ ∴一般的に、
SSE0
線形制約あり
SSE
線形制約なし
. (16)
が成立。OLS原理に基づかない線形制約を一部の係数に置くと、 残差2乗和が大き
くなる=モデルの なる。
⊲ ∴両者の差
SSE0−SSE ≥ 0 (17)
は、「線形制約H0によって 」を測る。
2 F 検定
2.1 F 統計量
F検定の考え方:残差2乗和のギャップ、(17)に着目。
⊲ 線形制約H0が正しい(データと整合的)⇒モデルの当てはまりを、それほど悪く しないはず。∴SSE0−SSEは 。
⊲ H0 が誤り(データに合わない)⇒モデルの当てはまりをかなり悪くするはず。∴
SSE0−SSEは 。
⊲ ... ただし、これでは「いくら以上なら大きいズレ⇒アウト」なのか判断できない!
Remark:線形制約による当てはまりの悪化SSE0−SSEを、 な統
計量(F統計量)に換算。
⊲ t検定で、係数の推定値と仮説値の差β − βˆ 0をt統計量に換算してジャッジするのと 同じ発想。
F統計量:残差2乗和の差を変換した次の統計量 F = (SSE0−SSE)/m1
SSE/m2 =
(SSE0−SSE) SSE
m2 m1,
m1= G, m2= n − (K + 1) (18) を、 と呼ぶ。F統計量は自由度m1, m2の に従う。
F ∼F(m1, m2). (19)
二つの自由度m1、m2を持つ点に注意。
⊲ 自由度m1:線形制約H0の、制約の数G。
⊲ 自由度m2:t検定の自由度(講義ノート#11) と同じ。
F分布の性質:図1(自由度m1 = 4, m2= 20)。
⊲ 左右 のゆがんだ分布。 二つの自由度m1, m2で形状が変化。
⊲ 分子SSE0−SSE ≥ 0、分母SSE > 0なので、必ず 。∴F統計量がゼロ以下 の値をとる確率は、 ゼロ。
2.2 F 検定
F検定の手順
1. (18)式に従い、データからF値F0を求める。(OLS推定で制約下のSSE0を求める
方法は、次回講義ノート#16で。)
2. F分布表(テキストp354)から自由度m1, m2の F(m1, m2)を調べ、 (a) F0 F(m1, m2) ⇒差SSE0−SSEは無視できないほど大きい。 線形制約H0を
。
(b) F0 F(m1, m2) ⇒差SSE0−SSEは誤差の範囲内。線形制約H0を 。
0.00.20.40.6
F
f(F; 4, 20)
0 F(4,20)=2.87
1−α
α α=0.05
図1:自由度m1= 4, m2= 20のF分布と、その右端5%臨界値F(4, 20) = 2.87
Remark:線形制約のF検定は「F0がゼロより十分大きいかどうか」 のチェック。F0は 負にならない。
⊲ ∴ となるように、臨界値を求める。いわゆる 。
⊲ これまでの両側t検定(左右合わせて5%)と異なるので注意。
例:G = 2の線形制約H0のもとでSSE0= 12、制約なしでSSE = 10を得た。説明変数は K = 4個、サンプル数はn = 25。この線形制約H0をF検定せよ。
⊲ 自由度はm1= G = 、m2= n − (K + 1) = 。F値は F0 = (SSE0−SSE)
SSE
m2
m1 =
12 − 10 10 ×
20
2 = . (20)
⊲ F分布表より、m1= 2, m2= 20の臨界値はF(2, 20) = 3.49。
⊲ F0= 2 < 3.49 ⇒線形制約H0は、 。
⊲ ここで「棄却されない」とは、「H0であらかじめ指定したパラメータ値でも、モデ ルの当てはまりが悪くならない⇒H0は妥当だろう」という意味。
Remark:カイ2乗分布によるF統計量の近似(おススメ!)
⊲ F検定は、自由度を二つ見ないといけないので、 不便。⇒一方、サンプル数nが十 分大きければ、次の統計量χ2は自由度m1の に従う。(χ =ギリシ ア文字のカイ。)
χ2= m2 SSE0−SSE SSE
= m1F ∼Chi(m1). (21)
⊲ カイ2乗分布の自由度は一つ。∴Fではなく、 (テキストp353) の5%臨界値、χ2(m1)で検定するほうが良い。(サンプルが少ない場合は、面倒でも F分布表で検定。)
⊲ nが多いときに、t分布ではなく正規分布の臨界値1.96 ≈ 2で判断するのと同じこと。
例:先ほどの数値例で、 カイ2乗値は χ20 = m2 SSE0−SSE
SSE
= 20 × 12 − 10
10 = 4. (22)
⊲ カイ2乗分布表より、m1= 2の5%臨界値はχ2(2) = 5.991。
⊲ χ20 = 4 < 5.991 ⇒線形制約H0は、 。Fの臨界値による結論と同じ。
⊲ 注意:このサンプル数(n = 25)の場合、カイ2乗近似がうまく働くかどうかは微妙 なところ… 。
まとめと復習問題
今回のまとめ
線形制約(複数の回帰係数への仮説値) による、OLS残差2乗和の変化。
F検定の考え方と手順。⇒より勘弁な、カイ2乗検定。
復習問題
出席確認用紙に解答し (用紙裏面を用いても良い)、 退出時に提出せよ。 1. 次の線形制約について、 制約の数Gを求めよ。
(a) H0 : β1= 0.5, β3= −0.2。 (b) H0 : β1+ 2β2= 4。
(c) H0 : β1= β2 = · · · = βK= 0。
2. 一般的に、制約下のOLS残差2乗和SSE0が、制約なしの(通常の)OLS残差2乗和SSE を上回る理由を、 簡潔に説明せよ。
3. 制約の数がG = 5の線形制約H0のもとでSSE0 = 15、また制約なしでSSE = 10を得た。 説明変数はK = 8個、サンプル数はn = 58。この線形制約H0をカイ2乗検定せよ。
(a) カイ2乗値χ20を求めよ。
(b) カイ2乗分布表から、自由度m1= G = 5の右端5%臨界値χ2(5)を求めよ。 (c) H0が棄却されれば○ 、 されなければ× と答えよ。