計量経済学II ハンドアウト 7 – 説明変数の過不足 1/ 3
7 説明変数の過不足
7.1 変数の過不足とその影響
A. (1) がわかっているというのはまれな話
B. 余分な説明変数がある場合や、必要な説明変数がない場合の影響を検討
7.1.1 変数の過剰とその影響
A. 余分な説明変数の係数がほぼ 0 であれば、問題はなさそう B. 真のモデルを次のように与える
yi = α∗ + β1∗x1,i+ ϵ∗i (7.1) C. 実際に推定したモデルを次のように与える
yi = ˆα+ ˆβ1x1,i+ ˆβ2x2,i+ ˆϵi (7.2)
D. (2) が余分な変数として入っている推定量は次の通り βˆ1 = (S1yS22− S12S2y)
S11S22− S122 (7.3)
= (
∑N
i=1(yi−y¯)(x1,i−x¯1)S22− S12
∑N
i=1(yi −y¯)(x2,i−x¯2))
S11S22− S122 (7.4) E. 分子だけを着目すると、次のように計算できる
(分子)= S22
∑N i=1
[(α∗+ β1∗x1,i+ ϵ∗i) − (α∗ + β1∗x¯1+ ¯ϵ∗)] (x1,i−x¯1)
− S12
∑N i=1
[(α∗ + β1∗x1,i+ ϵ∗i) − (α∗+ β1∗x¯1 + ¯ϵ∗)] (x2,i−x¯2) (7.5)
= S22
∑N i=1
[(β1∗(x1,i−x¯1) + (ϵi∗−¯ϵ∗)] (x1,i−x¯1)
− S12
∑N i=1
[(β1∗(x1,i−x¯1) + (ϵi∗−¯ϵ∗)] (x2,i−x¯2) (7.6)
= β1∗S22S11+ S22
∑N i=1
ϵ∗i (x1,i−x¯1) − β1∗S122 − S12
∑N i=1
ϵ∗i (x2,i−x¯2)
= β1∗(S22S11− S122 ) +
∑N i=1
ϵ∗i[S22(x1,i−x¯1) − S12(x2,i−x¯2)] (7.7)
Ver. 1.3 Masumi Kawade, 2009
計量経済学II ハンドアウト 7 – 説明変数の過不足 2/ 3 F. 元の式に代入にすると次のようになる
βˆ1 = β∗1 +
∑N
i=1ϵ∗i[S22(x1,i−x¯1) − S12(x2,i−x¯2)]
S11S22− S122 (7.8) G. ˆβ2も全く同様に計算すれば、次のようになる
βˆ2 = 0 +
∑N
i=1ϵ∗i[S11(x2,i−x¯2) − S12(x1,i−x¯1)]
S11S22− S122 (7.9) H. 双方とも期待値の意味 ( (3) ) では問題はない
E[ ˆβ1] = β1∗+
∑N
i=1E[ϵ∗i][S22(x1,i−x¯1) − S12(x2,i−x¯2)]
S11S22− S122 = β
∗
1 (7.10)
I. (4) もあることが分かっている
J. ただし、 (5) がなく、 (6) も下がる
K. そのため、不要な変数のない正しいモデルを推定する方が望ましい
7.1.2 変数の不足とその影響
A. 真のモデルを次のように考える
yi = α∗ + β1∗x1,i+ β2∗x2,i+ ϵ∗i (7.11) B. 実際に推定したモデルを次のように与える
yi = ˆα+ ˆβ1x1,i+ ˆϵi (7.12)
C. (7) が不足したβˆ1の推定量は次のようになる
βˆ1 =
∑N i=1
(x1,i−x¯1) (yi−y)¯
∑N i=1
(x1,i−x¯1)2
(7.13)
=
∑N i=1
(x1,i−x¯1) [(α∗+ β1∗x1,i+ β2∗x2,i+ ϵ∗i) − (α∗+ β1∗x¯1,i+ β2∗x¯2,i+ ¯ϵ∗i)]
∑N i=1
(x1,i−x¯1)2
(7.14)
Ver. 1.3 Masumi Kawade, 2009
計量経済学II ハンドアウト 7 – 説明変数の過不足 3/ 3
= β1∗ + β2∗
∑N i=1
(x1,i−x¯1)(x2,i−x¯2)
∑N i=1
(x1,i−x¯1)2
+
∑N i=1
(x1,i−x¯1)(ϵ∗i −¯ϵ∗)
∑N i=1
(x1,i−x¯1)2
(7.15)
= β1∗ + β2∗
∑N i=1
(x1,i−x¯1)x2,i
∑N i=1
(x1,i−x¯1)2 +
∑N i=1
(x1,i−x¯1)ϵ∗i
∑N i=1
(x1,i−x¯1)2
(7.16)
D. (7.16) 式の第 2 項目を見れば、不足した変数の影響が残っている E. β2∗ ̸= 0 ゆえ、推定量がゆがんでいる ( (8) がなくなっている)
F. 説明変数が不足すると推定全体が (9) という大きな問題を抱える G. 標本を十分大きくしたとしても β∗に収束せず、 (10) もない H. 推定式が真のモデルであることを「前提」に、推定量は計算されている
I. 少なくとも (11) がすべてなければ、正しい推定はできない J. 必要な説明変数が不足していても、推定には問題がない場合もある
1. 不足した説明変数と推定された説明変数に (12) が全くないこと 2. 説明変数の間に何らかの (13) があることは一般的で、このような
条件を満たすことは珍しい
K. 実際の分析では (14) に注意しつつ、まず必要な説明変数を含めて多め の説明変数で推定し、
(15)
を用いながら不要な説明変数を外して行く
Ver. 1.3 Masumi Kawade, 2009