3 計量経済学の復習 2 — 計量経済学 II
3.1 最小二乗法の望ましさ
A. 推定量の望ましさは最小二乗推定量でも当然必要 1. 不偏性:推定量の期待値が母数に等しい
2. 一致性:十分に標本を増やすと推定値は母数に (確率) 収束する 3. 正規性:推定量が正規分布に従う
4. 効率性:推定量がすべての推定量の中で最も分散が小さい
B. 古典的仮定を満たす場合には最小二乗推定量は推定量の中で最も望ましい推 定量(ガウス=マルコフの定理)
1. 古典的仮定は常に成り立つとは限らない 2. 古典的仮定が成り立つかどうかの検証が必要 3. 古典的仮定が成り立たない場合には対応が必要
3.2 回帰分析における問題 — 多重共線性
A. 下記の重回帰モデルにおいて、分析上多く直面する問題がある
yi=α+β1x1,i+β2x2,i+εi (3.1)
1. 回帰係数の推定量は以下のように示される βˆ1= (S1yS22− S12S2y)
S11S22− S212 =
S1y−SS12
22S2y
S11(1−SS12
22
S12 S11
) (3.2)
2. 分母の一部は下記のように相関係数で書き直せる S12
S11 S12 S22 =
∑(x1,i− ¯x1)(x2,i− ¯x2)
∑(x1,i− ¯x1)2
∑(x1,i− ¯x1)(x2,i− ¯x2)
∑(x2,i− ¯x2)2
(3.3)
= [∑(x1,i− ¯x1)(x2,i− ¯x2)]
2
∑(x1,i− ¯x1)2∑(x2,i− ¯x2)2 (3.4)
=
[ ∑(x1,i− ¯x1)(x2,i− ¯x2)
√∑(x1,i− ¯x1)2√∑(x2,i− ¯x2)2 ]2
= r122 (3.5) 3. 説明変数の間の相関が推定量に影響を与えている
B. 説明変数の相関が高いと推定量に大きな問題が起きる 1. 推定量は以下のようにも書き直せる
βˆ1= S1y−
S12 S22S2y
S11(1 − r122 ) (3.6)
=β1∗+∑
Ni=1εi∗[S22(x1,i− ¯x1) − S12(x2,i− ¯x2)]
S11(1 − r212) (3.7)
2. 説明変数の間の相関係数の高まりは以下のような影響を与える ε∗j[S22(x1,i− ¯x1) − S12(x2,i− ¯x2)]
S11(1 − r212) → ±∞, (r
2
12→ 1,ε∗j ̸= 0) (3.8)
3. 誤差項の影響が無限大になり、真の値を不明確にする
C. 説明変数の相関が高いと推定量がある事の問題を多重共線性という 1. 多重共線性はデータの性質に由来
2. 確率構造上の問題ではないので対処のしようがない D. 症状としては以下のようなもの
1. 係数の分散が拡大する
⇔ 係数の推定が不安定 (いくつかの大きい誤差の影響に左右されやすい) 2. 符号条件が合わない
3. 理論的に想定される値からかけ離れた結果になる 4. データの標本追加で推定値が大きく変わる
5. 決定係数が高いのに個別の係数の標準誤差が高くなってしまうことで、t 検定等で帰無仮説を棄却しにくくなってしまう
6. 説明変数の変更で結果が可変的となり、精度が突然変化する E. 対処法は以下のようなもの
1. 標本数を増やす⇔ 一致性を利用する
2. データの種類や性質、モデルの代替案がないかを検討する
3. 変数間の関係を規定する⇔ 何らかの係数制約を課すことで、ある程度の 説明変数間の
4. 係数のゆがみを覚悟の上で、変数をはずす
分散拡大要因(VIF) が大きなものをはずすことになります。 5. 不偏性をあきらめてリッジ回帰を行う
6. 無理はしないで、あきらめる
3.3 回帰分析において注意すべき点 — 説明変数の過不足
A. 推定の際のモデルは正しい真のモデルと考えられることが前提 B. 正しくない場合には2つのケースが考えられる
1. 説明変数の過剰:真のモデルに必要な説明変数はあるが、余分な変数もある 2. 説明変数の不足:真のモデルとして必要な説明変数が足りない
C. 真のモデルと異なるモデルを推定した差の問題はあるのか考える D. 説明変数の過剰
1. まず、真のモデルを
yi=α∗+β1∗x1,i+εi∗ (3.9)
と考え、実際に推定したモデルを
yi= ˆα+ ˆβ1x1,i+ ˆβ2x2,i+ ˆεi (3.10)
とする。
2. 余分な説明変数がある際の推定量は βˆ1= (∑
Ni=1(yi− ¯y)(x1,i− ¯x1)S22− S12∑Ni=1(yi− ¯y)(x2,i− ¯x2))
S11S22− S212 (3.11) となる。真のモデルを代入すると、
βˆ1=β1∗+∑
Ni=1εi∗[S22(x1,i− ¯x1) − S12(x2,i− ¯x2)]
S11S22− S212 (3.12) となる。
3. (3.13) 式の期待値は E[ ˆβ1] =β1∗+∑
Ni=1E[εi∗][S22(x1,i− ¯x1) − S12(x2,i− ¯x2)]
S11S22− S212 =β
∗
1 (3.13)
であり不偏性には問題がない。 E. 説明変数の不足
1. まず、真のモデルを
yi=α∗+β1∗x1,i+β2∗x2,i+εi∗ (3.14)
と考え、実際に推定したモデルを
yi= ˆα+ ˆβ1x1,i+ ˆεi (3.15)
とする。
2. 説明変数が不足する際の推定量は ˆβ1の推定量は
βˆ1=
∑
N i=1(x1,i− ¯x1) (yi− ¯y)
∑
N i=1(x1,i− ¯x1)2
(3.16)
=β1∗+β2∗
∑
N i=1(x1,i− ¯x1)x2,i
∑
N i=1(x1,i− ¯x1)2 +
∑
N i=1(x1,i− ¯x1)εi∗
∑
N i=1(x1,i− ¯x1)2
(3.17)
となる。
3. (3.17) 式の期待値は
E[ ˆβ1] =β1∗+β2∗
∑
N i=1(x1,i− ¯x1)x2,i
∑
N i=1(x1,i− ¯x1)2 +
∑
N i=1(x1,i− ¯x1)E[εi∗]
∑
N i=1(x1,i− ¯x1)2
(3.18)
=β1∗+β2∗
∑
N i=1(x1,i− ¯x1)x2,i
∑
N i=1(x1,i− ¯x1)2
̸=β1∗ (3.19)
であり不偏性が崩れる。
3.4 回帰分析における問題 — 不均一分散
A. 各観測点での誤差項の分散は観測点を問わず未知だが一定(V (εi) =σ2) とい う古典的仮定が成立しない場合を考える
1. ショックを表す誤差項の多様性が時点で異なる場合がその例 2. より具体的には株式市場で様子見や荒れるような場合 B. どんな問題が起きるのか
1. 不偏性や一致性に与える問題はない
2. 誤差項の分散が V(εi) =σi2なので、推定量の分散が以下のようになる Var( ˆβ) = ∑
N
i=1σi2(xi− ¯x)2
{∑Ni=1(xi− ¯x)2}2 (3.20) 3. 推定量の分散が大きくなると、仮説検定で帰無仮説が棄却しにくくなる 4. パソコンでは不均一分散がないとする推定量で計算されるため間違った仮
説検定になる
5. 推定量の分散が可変的になるが、それを回避するよりよい推定量がある C. どのように検出するか
1. 分散が何らかの要因で説明できないかを考える
εˆi2= ˆδ0+ ˆδ1z1,i+ ˆδ2z2,i· · · + ˆδkzk,i+ ˆui (3.21)
2. 仮説は以下のようになり、(3.21) 式を F 検定する H0:δ1∗=δ2∗= · · · =δk∗= 0
H1: H0ではない
3. ただ、決定係数 R2を標本数(N) でかけた NR2が、(3.21) 式の定数項以外の 説明変数の数k を自由度とするχ2分布(χ2(k)) に従うことが分かっている
4. これをブルーシュ=ペーガンのラグランジュ乗数検定とよぶ D. どう対処するか
1. 分散の不均一関係が分かっていれば、誤差項の影響だけを除去した最小二 乗法を考える
∑
εwls,i2 =∑
σεi22i
(3.22)
=
∑
1σi2(yi− ( ˆαwls+ ˆβwls,1x1,i+ · · · + ˆβwls,KxK,i))2 (3.23) 2. 誤差項の構造が分かっていない場合には以下の式で不均一関係の理論値を
得てそれを使う
εˆˆi2= ˆδ0+ ˆδ1z1,i+ ˆδ2z2,i· · · + ˆδkzk,i (3.24)
3. これを加重最小二乗法とよぶ
3.5 回帰分析における問題 — 系列相関
A. 異なる時点での誤差項の相関が 0 である (Cov[εi,εj] = 0, i̸= j ⇒ E[εiεj] ̸= 0, i̸= j) という古典的仮定が成立しない場合を考える
1. ショックを表す誤差項が他の時点に影響として残る場合が例 2. 一般的な社会現象でよく見られるショックの余波
B. どんな問題が起きるのか
1. 自己ラグがなければ不偏性や一致性に与える問題はない
2. 誤差項の分散が E[εiεj] ̸= 0 なので、推定量の分散が以下のようになる
Var[ ˆβ] = σ
2
∑Ni=1(xi− ¯x)2+
∑∑
i̸= j
E[εiεj](xi− ¯x)(xj− ¯x)
∑Ni=1(xi− ¯x)2 (3.25) 3. 推定量の分散が大きくなると、仮説検定で帰無仮説が棄却しにくくなる 4. パソコンでは不均一分散がないとする推定量で計算されるため間違った仮
説検定になる
5. 自己ラグがあると不偏性と一致性が崩れる C. どのように検出するか
1. 分散の相関を求めようと考える
d=
∑
n 2(ˆεt− ˆεt−1)2
∑
n 1εˆt2
= ∑(ˆεt− ˆεt−1)
2
∑εˆt2
≈ 2 − 2∑εˆtεˆt−1
∑εˆt2
(3.26)
2. 仮説は以下のようになり、(3.21) 式を F 検定する H0: d= 2(誤差項に相関がない)
H1: H0ではない
3. d が 0 に近づけば正の相関、d が 4 に近づけば負の相関になる 4. 通常パソコンでは正の相関を判定する
5. 分布が特殊な形になることが知られているので、判定が困難なグレーゾー ンとよばれるものが存在する(パソコンでは p 値を用いられる)
6. これをダービン=ワトソン検定とよぶ
7. 自己ラグがある場合には下記のような Durbin-h 検定を使う h=
( 1−d
2
) √ N 1− N · s2β
Lag
(3.27)
D. どう対処するか
1. 分散の相関を求めて、それを除去する
εˆi= ˜ρεˆi−1+ ˜ui (3.28) 2. その除去法として代表的なのはウェイトを付けた準階差を取る
yi− ˜ρyi−1= ˆα(1)+ ˆβ1(1)(x1,i− ˜ρx1,i−1) + · · · + ˆβK(1)(xK,i− ˜ρxK,i−1) + ˆεi(1) (3.29) 3. この手法では回帰係数が除去前のモデルと同じ役割を維持していて便利で
あり、コクランオーカット法とよぶ
3.6 回帰分析における問題 — 内生性と観測誤差
A. 説明変数と誤差項に相関がない(Cov[xi,εj] = 0, という古典的仮定が成立しな い場合を考える
1. ショックが説明変数に影響を与えたり、その逆はないとする
2. 経済モデルが連立方程式タイプの説明変数と被説明変数が互いに影響関係 になっている場合
3. このような関係を内生性と呼ぶ B. どんな問題が起きるのか
1. 推定量を求める段階で説明変数と誤差項の仮定は使われている 2. 推定量は以下のように不偏性も一致性もなくなる
β∗+Cov[xi,εi] Var[x] = ˜β
∗̸=β∗ (3.30)
C. どのように検出するか
1. 定式化の妥当性を評価する
H0: モデルは正しく定式化されている
H1: モデルは正しく定式化されていない (3.31) 2. 最も効率的とされる内生性を考えない推定法による推定量を ˆβE、効率的
ではない内生性を考慮した推定方法による推定量をβˆIとして、 ( ˆβI− ˆβE)2
Var[ ˆβI] +Var[ ˆβE]∼χ
2(1) (3.32)
3. これをハウスマン検定とよぶ D. どう対処するか
1. 説明変数と誤差項の相関を迂回する操作変数 ziによる操作変数法を用いる 2. 操作変数は誤差項との相関はないが説明変数と相関する変数で、最小二乗
法を用いる場合には、以下の式を最小二乗推定する
xi=γ0+γ1z1,i+ · · · +γkzk,i+ ui (3.33)
3. 操作変数から得られた理論値 ˆxiを説明変数と見なして推定すると推定量は 以下のようになる
β˜ =
∑
N i=1( ˆxi− ¯x)(yi− ¯y)
∑
N i=1( ˆxi− ¯x)2
=
∑
N i=1(zi− ¯z)(yi− ¯y)
∑
N i=1(zi− ¯z)(xi− ¯x)
(3.34)
4. 操作変数法の一種で、二段階最小二乗法とよぶ