回帰診断:特定化の誤り
特定化の誤り
•
必要な変数を除いてしまった場合•
真のモデル:𝑌 = 𝛽
0+ 𝛽
1𝑋
1+ 𝛽
2𝑋
2+ 𝑢
•
推計モデル:𝑌 = 𝛼
0+ 𝛼
1𝑋
1+ 𝑣
•
不必要な変数を加えてしまった場合•
真のモデル:𝑌 = 𝛽
0+ 𝛽
1𝑋
1+ 𝑢
•
推計モデル:𝑌 = 𝛼
0+ 𝛼
1𝑋
1+ 𝛼
2𝑋
2+ 𝑣
特定化の誤り
• 必要な変数を除いてしまった場合
• 真のモデル:𝑌 = 𝛽0 + 𝛽1𝑋1 + 𝛽2𝑋2 + 𝑢
• 推計モデル:𝑌 = 𝛼0 + 𝛼1𝑋1 + 𝑣
• 攪乱項の分散の推計量は正しくない、係数の標準誤差も不正確
• 𝑋1と𝑋2とが相関
• 𝛼0、𝛼1はバイアスを持ち、一致推定量にもならない
• 𝑋1と𝑋2とが無相関
• 𝛼0はバイアスを持つが、𝛼1はバイアスを持たない
特定化の誤り:例
特定化の誤り
•
不必要な変数を加えてしまった場合•
真のモデル:𝑌 = 𝛽
0+ 𝛽
1𝑋
1+ 𝑢
•
推計モデル:𝑌 = 𝛼
0+ 𝛼
1𝑋
1+ 𝛼
2𝑋
2+ 𝑣
•
推計モデルのパラメーターは不偏性、一致性を持つ、攪乱項の分散 も正しい• 𝐸 𝛼
0= 𝛽
0、𝐸 𝛼
1= 𝛽
1、𝐸 𝛼
2= 𝛽
2= 0
•
但し、パラメーターの分散は効率的ではない。•
不必要な変数を加えても問題なさそうだが、検定に歪みが生ずるば かりか、マルチコの原因となることもある。入れ子型モデル非入れ子型モデル
•
モデルA
:𝑌 = 𝛽
0+ 𝛽
1𝑋
1+ 𝛽
2𝑋
2+ 𝛽
3𝑋
3+ 𝛽
4𝑋
4+ 𝑢
•
モデルB
:𝑌 = 𝛽
0+ 𝛽
1𝑋
1+ 𝛽
2𝑋
2+ 𝑢
•
モデルC
:𝑌 = 𝛼
0+ 𝛼
1𝑋
1+ 𝛼
2𝑋
2+ 𝑢
•
モデルD
:𝑌 = 𝛽
0+ 𝛽
1Z
1+ 𝛽
2𝑍
2+ 𝑢
•
モデルD
:𝑌 = 𝛽
0+ 𝛽
1Z
1+ 𝛽
2𝑍
2+ 𝑢
•
モデルE
:𝑌 = 𝛽
0+ 𝛽
1𝑙𝑜𝑔Z
1+ 𝛽
2𝑙𝑜𝑔𝑍
2+ 𝑢
入れ子型モデル非入れ子型モデル
•
モデルA
:𝑌 = 𝛽
0+ 𝛽
1𝑋
1+ 𝛽
2𝑋
2+ 𝛽
3𝑋
3+ 𝛽
4𝑋
4+ 𝑢
•
モデルB
:𝑌 = 𝛽
0+ 𝛽
1𝑋
1+ 𝛽
2𝑋
2+ 𝑢
•
モデルA
を推計して、𝐻
0: 𝛽
3= 𝛽
4= 0
を検定入れ子型モデル非入れ子型モデル
•
モデルC
:𝑌 = 𝛼
0+ 𝛼
1𝑋
1+ 𝛼
2𝑋
2+ 𝑢 Y
C•
モデルD
:𝑌 = 𝛽
0+ 𝛽
1Z
1+ 𝛽
2𝑍
2+ 𝑢 Y
D•
モデル𝑌 = 𝛼
0+ 𝛼
1𝑋
1+ 𝛼
2𝑋
2+ 𝛼
3𝑍
1+ 𝛼
4𝑍
2+ 𝑢
• 𝐻
0: 𝛼
1= 𝛼
2= 0
を検定• 𝐻
0: 𝛼
3= 𝛼
4= 0
を検定•
マッキノンのJ
テスト• C: 𝑌 = 𝛼
0+ 𝛼
1𝑋
1+ 𝛼
2𝑋
2+ 𝛼
3Y
C+ 𝑢
を推計し𝐻
0: 𝛼
3= 0
を検定•
どちらが正しいか判断できないことがある入れ子型モデル非入れ子型モデル
• モデルD:𝑌 = 𝛽0 + 𝛽1Z1 + 𝛽2𝑍2 + 𝑢
• モデルE:𝑌 = 𝛽0 + 𝛽1𝑙𝑜𝑔Z1 + 𝛽2𝑙𝑜𝑔𝑍2 + 𝑢
• モデルの当て嵌まりの良さで判断することも・・・
• 決定係数で判断R2
• 自由度調整済み決定係数で判断R2
※ 決定係数は左辺の変数が同じでないと比較可能ではない!
• AICで判断 AIC = 𝑒2𝑘 𝑛 ×𝑅𝑆𝑆𝑛 or 𝑙𝑛𝐴𝐼𝐶 = 2𝑘𝑛 +𝑙𝑛 𝑅𝑆𝑆𝑛
• SICで判断 SIC = 𝑛𝑘 𝑛 ×𝑅𝑆𝑆𝑛 or 𝑙𝑛S𝐼𝐶 = 𝑛𝑘ln(𝑛)+𝑙𝑛 𝑅𝑆𝑆𝑛
• 𝑘は説明変数の数(定数項を含める)、𝑛はデータのサンプル数。
特定化の誤り:
•
賃金関数の例特定化の誤り:
gretl
を使ってみる•
データの読込特定化の誤り:
•
回帰分析特定化の誤り:
•
計測結果特定化の誤り:
•
変数を加えてみる•
経験の二乗特定化の誤り:
•
再推計特定化の誤り:
•
さらに変数を加える•
交差項•
追加→
新規変数の定義特定化の誤り:
•
計測結果特定化の誤り:検定
•
線型制約の検定• 𝑅𝑆𝑆 = 𝑇𝑆𝑆(1 − 𝑅
2)
に注意すると• 𝐹 =
(𝑅𝑆𝑆𝑈𝑅−𝑅𝑆𝑆𝑅) 𝑞𝑅𝑆𝑆𝑈𝑅 (𝑛−𝑘)
=
(𝑅𝑈𝑅2 −𝑅𝑅2) 𝑞(1−𝑅𝑈𝑅2 ) (𝑛−𝑘)
•
今の例では、𝐹 =
(𝑅𝑈𝑅2 −𝑅𝑅2) 𝑞(1−𝑅𝑈𝑅2 ) (𝑛−𝑘)
=
(0.340315−0.323339)/2(1−0.340315)/(1298−8)=16.598
変数が落ちていることを確認する方法
• Ramsey
のRESET
•
最初の回帰分析で、被説明変数の理論値を求める•
最初の回帰分析に、理論値の二乗、三乗を加えでOLS
推計•
理論値の係数がすべてゼロなら、除外変数なし変数が落ちていることを確認する方法
変数が落ちていることを確認する方法
変数が落ちていることを確認する方法
変数が落ちていることを確認する方法
賃金関数の推計では、
log(
賃金)
が用いられ る理由賃金関数の推計では、
log(
賃金)
が用いられ る理由賃金関数の推計では、
log(
賃金)
が用いられ る理由賃金関数の推計では、