計量経済学II ハンドアウト 3 – ラグと多重共線性 1/ 3
3 ラグと多重共線性
3.1 実際の分析で有用な変数 — ラグ変数
A. 実際の経済現象では遅れを伴いながら (1) してゆくような現象を扱う B. 遅れを (2) (Lag) とよび、変数を (3) (Lag Variables) と呼ぶ
yt= α + β1x1,t+ βm+1x2,t+ · · · + βKxK,t
+ γ1x1,t−1+ γ2x1,t−2· · ·+ γmx1,t−m
+ δ1y1,t−1+ δ2y1,t−2· · ·+ δny1,t−n+ ϵt (3.1)
C. ここではラグ変数が x1,t−1で変数x1,tの
(4)
の値 D. 被説明変数である ytのラグ変数がy1,t−1である事を
(5)
と呼ぶ E. 自己ラグの場合 (6) (dynamic regression model) とも呼ぶ1
3.1.1 ラグ変数の問題
A. ラグ変数は利点だけでなく、便益と問題を総合的に判断することが必要 B. (7) の減少
1. ラグ変数は推定での利用な可能データ (自由度) を (8) から減少 2. ラグデータ利用のため推定期間を遅らせることに伴う (9) の縮小 3. (10) の増加に伴う、推定量及び検定統計量の自由度の減少 C. 説明変数と (11) の相関
1. 「yt−1とϵtの共分散は0」か「yt−1とϵtは確率的に独立」が崩れる可能性 Cov(yt−1, ϵt) = Cov(α + β1x1,t−1· · ·+ βKxK,t−1+ γyt−2+ ϵt−1, ϵt) (3.2)
= Cov(ϵt−1, ϵt) ̸= 0 (3.3)
2. これは (12) に反し、推定に甚大な影響を与える
1自己ラグ(またはその要素) のないモデルを静学的回帰モデル (static regression model) と呼ぶ。
Ver. 1.2 Masumi Kawade, 2008
計量経済学II ハンドアウト 3 – ラグと多重共線性 2/ 3
3.2 多重共線性とは
A. 重回帰分析の β1の推定量は次のように示される βˆ1 = (S1yS22− S12S2y)
S11S22− S122
= S1y−
S12 S22S2y
S11
(1 −SS1222SS1211)
(3.4)
B. その分母は次のように ρ12は
(13)
の相関係数となる S12
S11
S12
S22
=
[ ∑(x1,i−x¯1)(x2,i−x¯2)
√∑(x1,i−x¯1)2√∑(x2,i−x¯2)2 ]2
= ˆρ212 (3.5)
C. (14) (Multicollinearity) とはこの相関の程度を表すρˆ212が1 に非常 に近いときに起こる現象
D. 説明変数が 3 つ以上ならば、対象となる説明変数を被説明変数とし、その他 の説明変数を説明変数とする最小二乗推定の
(15)
E. 説明する側の変数のいくつかが互いに (16) をすること F. まったく同じ動きをすれば、一方の変数はいらない
3.2.1 何が問題なのか
A. (3.4) 式で、ρˆ212が限りなく1 に近づくと分母が限りなく (17) に近づくこと から、誤差の影響力が非常に大きくなる
βˆ1 = S1y−
S12 S22S2y
S11(1 − ˆρ212) (3.6)
= β∗1 +
∑N
i=1ϵ∗i[S22(x1,i−x¯1) − S12(x2,i−x¯2)]
S11(1 − ˆρ212) (3.7) B. 誤差項の期待値を取れば、 (18) には問題はない
E( ˆβ1) = β1∗+
∑N
i=1E(ϵ∗i)[S22(x1,i−x¯1) − S12(x2,i−x¯2)]
S11(1 − ˆρ212) = β
1∗ (3.8)
C. (19) も、ρ12が一定ゆえ、S11は標本に応じて増加するので問題がない
Var( ˆβ1) = σ2 S22 S11S22− S122
= σ2 1
S11(1 − ˆρ212) (3.9)
Ver. 1.2 Masumi Kawade, 2008
計量経済学II ハンドアウト 3 – ラグと多重共線性 3/ 3
D. 一致性には (20) が必要で、標本が少なければ、推定結果が不安定
E. 以下のように、少しの (21) に振り回される 1. 係数の (22) 拡大する
⇔ 係数の推定が不安定 (いくつかの大きい誤差の影響に左右されやすい)
• 符号条件が合わない
• 理論的に想定される値からかけ離れた結果になる
• データの標本追加で推定値が大きく変わる
• 決定係数が高いのに個別の係数の標準誤差が高くなってしまうことで、 t 検定等で帰無仮説を棄却しにくくなってしまう
2. (23) の変更などに脆弱で、結果が大きく変化する
3.2.2 どのように検出したらいいのか
A. 仮説検定のような検出方法はないが、 (24) や (25) を見て、 その二乗が限りなく1 に近ければ、多重共線性がある
B. 厳密には、分散拡大要因 (VIF: Variance Inflation Factor) を評価する方法がある
3.2.3 どのように対処したらいいのか
A. 説明変数間に相関があるのは通常のケースでは当たり前
B. それらの影響からは全く自由になることはほぼ不可能で、それ自身が大きな 問題ではなく、関係が近すぎるのが問題なので、次の対策しかない
1. 標本数を増やす ⇔ 一致性を利用する 2. モデルを再検討する
i. データの種類や性質、モデルの代替案がないかを検討する
ii. 変数間の関係を規定する ⇔ 何らかの係数制約を課すことで、ある程 度の説明変数間の相関を抑える
3. 係数のゆがみを覚悟の上で、分散拡大要因 (VIF) が大きい変数をはずす 4. リッジ回帰を行う
リッジ回帰は推定量にある変数を計算に加えるため、不偏性が崩れる 5. あきらめる
消極的な判断だが、多重共線性では変数を外したりリッジ回帰を行うなど して無理をするよりも自然
C. これを用いれば、絶対解決するという問題でもない
D. 理論的には問題もなく、実際的な問題があるというのが多重共線性の特徴
Ver. 1.2 Masumi Kawade, 2008