計量経済学#21
標準誤差と検定の頑健化 (2)
鹿野繁樹
大阪府立大学
2017 年 11 月更新
鹿野繁樹 (大阪府立大学) 計量経済学#21 2017 年 11 月更新 1 / 30
Outline
1 比例的不均一分散
2 加重最小2 乗法(WLS)
テキスト:鹿野繁樹 [2015]、第 11.3 章・第 11.4 章。
前回の復習
1 OLS の頑健な標準誤差
2 漸近正規性に基づく仮説検定
Section 1
比例的不均一分散
鹿野繁樹 (大阪府立大学) 計量経済学#21 2017 年 11 月更新 3 / 30
不均一因子による分散の不均一性
前回から、回帰モデルYi = α + βXi+ ui について、誤差項uiの不 均一分散を許容:
Var(ui|Xi) = E(u2i|Xi) = σi2, i = 1, 2, . . . , n. (1)
... 上式は単に「観測 i によって誤差項の分散が異なってもよ い」と言っているだけ。
場合によっては、事前に分散の構造を特定化できることも。
⇒ この情報を、分析に活かすことができるか?
uiの条件付き分散が比例的不均一分散
E(u2i|Xi) = σi2 = hiσ2 (2) で与えられ、また不均一因子hi(hi > 0)がデータとして観測で きる状況を考える。
分散のベースラインはσ
2
で一定。⇒ hiの違いで分散の不均 一性が発生。
∴hiは、分散の違いを説明する「説明変数」のようなもの! 簡単化のため、hiは非確率的なn 個の定数値であると仮定。
鹿野繁樹 (大阪府立大学) 計量経済学#21 2017 年 11 月更新 5 / 30
例:グループ平均による回帰分析
いかなる状況で比例的な不均一分散が起こる?⇒ 変数のグループ 平均による回帰分析が典型的。
政府の調査データ:刊行物(『○ ○ 年鑑』や『× × 白書』)・サ イト上で、グループ平均に集計・加工され公開。
ここでグループの数をG,グループ内の観測の数を
ng, g = 1, 2, . . . , G (3) と置く。
例:全国10 万人の消費支出を調査し、47 都道府県・年齢 7 階 級に分け、各グループの平均値を公開。⇒ 元々n =10 万あっ た観測は、G = 47 × 7 = 329 個のグループ平均に圧縮。
Example 1
表1:総務省統計局『平成 21 年全国消費実態調査』を一部抜粋・ 整理。
n = 16480 の家計を、世帯主の年齢や配偶者の就業状況で G = 32 のグループに分け。⇒ その平均がレポート。
鹿野繁樹 (大阪府立大学) 計量経済学#21 2017 年 11 月更新 7 / 30
g ng 消費 可処分所得 子ども数 世帯主年齢 持家 共働き
1 166 26.70 39.03 0.00 26.90 19.20 1.00 2 514 28.33 41.79 0.00 34.10 36.60 1.00 3 366 32.09 47.14 0.00 44.70 70.10 1.00
.. .
32 68 45.03 42.96 3.12 52.30 82.50 0.00
表1 : グループデータの例(『平成21年全国消費実態調査』より抜粋)
一方、集計・平均化される前のデータを個票データ(マイクロ データ)と呼ぶ。
政府実施の調査の個票データは、政府関係者・研究者以外ア クセス不可。
一般公開された集計(平均)値を用いて回帰分析を行うには?
鹿野繁樹 (大阪府立大学) 計量経済学#21 2017 年 11 月更新 9 / 30
集計前の個票に基づく回帰式を
個票: Yjg = α + βXjg+ ujg, j = 1, 2, . . . , ng, g = 1, 2, . . . , G (4) と置く。(観測j は必ず、g = 1, 2, . . . , G のいずれかに属す。)
各グループ毎に上式両辺の平均をとれば、 1
ng
j
Yjg = α + β 1 ng
j
Xjg+ 1 ng
j
ujg
⇒ グループ平均: Y¯g = α + β ¯Xg+ ¯ug, g = 1, 2, . . . , G. (5)
∴( ¯Xg, ¯Yg) を「サンプル数 G」の標本とみなし、 ¯YgをX¯gに
OLS 回帰すれば α、β を推定できる。
問題は、(5) 式の誤差項の分散。
簡単化のため、個票による(4) 式の分散は均一であると仮定。 E(u2jg| ¯Xg) = σ2. (6) ... しかしグループ平均による (5) 式の分散は、グループ内の 観測数ngに反比例。
鹿野繁樹 (大阪府立大学) 計量経済学#21 2017 年 11 月更新 11 / 30
公式 1
Y¯gをX¯gに回帰すると、その誤差項u¯gの分散は
E(¯u2g| ¯Xg) = 1 ng
σ2. (7)
証明:復習問題とする。
(7) 式は、グループ内サンプル数 ngの逆数を不均一因子とす る、比例的不均一分散の一種。
ngが多いグループほど分散が縮小する点に注目。... ¯Ygは平 均値なので、ngが多いほど精度が上がる(分散が下がる)こ とに由来。
Section 2
加重最小 2 乗法( WLS )
鹿野繁樹 (大阪府立大学) 計量経済学#21 2017 年 11 月更新 13 / 30
ウェイト付き回帰の WLS 推定
一般論に戻る。比例的不均一分散を持つ回帰モデル
Yi = α + βXi+ ui, E(u2i|Xi) = hiσ2 (8)
に関し、その両辺を
√hiで割った
√1 hi
Yi
= ˜Yi
= α√1 hi
=Ii
+β√1 hi
Xi
= ˜Xi
+√1 hi
ui
= ˜ui
⇒ Y˜i = αIi+ β ˜Xi+ ˜ui
(9) をウェイト付き回帰と呼ぶ。
事前に変数変換でY˜i、Ii、 ˜Xiを作れば、(9) 式は OLS 推定可能。 注意:定数項がなくなり、α は変数 Ii(
√hiの逆数)の係数と
して現れる。
Y˜iをIiとX˜iに回帰してα と β を OLS 推定することを、加重 最小2 乗法(WLS)と呼ぶ。
(9) 式の WLS 推定は、元々の回帰モデル (8) 式の OLS 推定と 何が違う?
鹿野繁樹 (大阪府立大学) 計量経済学#21 2017 年 11 月更新 15 / 30
誤差項u˜iの条件付き期待値をとり、 E(˜ui|Xi) =
1
√hi
ui|Xi
= √1 hi
E(ui|Xi)
=0
= 0 (10)
より、外生性条件(FA1)は満たされる。
hiは説明変数の一種として観測されるので、(Xi, hi, Yi) は異 なる観測で互いに独立(FA2)。
∴(9) 式に OLS を適用することで得られる WLS は、OLS と同 様不偏性・一致性・漸近正規性を持つ。
(9) 式の誤差項 ˜uiの条件付き分散は
Var( ˜ui|Xi) = E( ˜ui
2|Xi) = E 1h
i
ui 2|Xi
= 1 hi
E(u2i|Xi)
=hiσ2
= 1 hi
hiσ2 = σ2. (11)
コレは均一分散!
Remark 1
WLS の効能:誤差項に比例的な不均一分散があるならば、不均一 因子を利用したIi =
1
√hi
で変数Xi、Yiをウェイト付けすること で、均一分散へ補正できる。
WLS は、gretl の加重最小 2 乗法(WLS)コマンドで実行で きる。
鹿野繁樹 (大阪府立大学) 計量経済学#21 2017 年 11 月更新 17 / 30
OLS vs. WLS :モンテカルロ実験による検証
(比例的な)不均一分散でも、OLS は回帰係数の一致推定量。
⇒GLS のメリットは?
(9) 式は均一分散。∴WLS は均一分散を前提とした標準誤差・ t 値の計算をそのまま使える。
... ホワイトの頑健な標準誤差で対処できる問題。現在はそれ ほど積極的な理由ではない。
WLS の最大の利点は有効性(推定精度の改善)にあり!
ガウス・マルコフの定理(前期の講義ノート):誤差項分散の 均一性は、OLS が最小分散となるための条件の一つ。
∴ 誤差項が不均一分散ならば、均一分散に補正することで、 推定効率を改善させる余地がある。
OLS 推定は、モデルの構造を利用し尽くしていない状態。
Remark 2
WLS により、不均一分散を均一分散に補正する意義:有効性(推 定精度)の改善。
鹿野繁樹 (大阪府立大学) 計量経済学#21 2017 年 11 月更新 19 / 30
注意:WSL の有効性は、小標本理論からの類推。
漸近理論(n → ∞)で議論するには、より細かい条件の精査 を要する。
∴ 代わりに、シミュレーションで、WLS の分散が OLS のそれ よりも小さくなるかどうか確認。
コンピュータ上で既知の母集団モデルからデータを発生させ、 そのデータに特定の推定法(例えばOLS と WLS)を適用する ことで性能を検証する実験を、モンテカルロ実験と呼ぶ。
Remark 3
モンテカルロ実験の手順。
1 まずモデルとパラメータの値を設定。(パラメータの真の値を あらかじめ知っている点が、この実験のポイント。)
2 次のステップをr 回繰り返し、r 個の推定値を記録。
1 コンピュータで、モデルからサンプル数nの擬似データを 発生。
2 その擬似データに特定の推定法を適用し、推定値を記録。
3 r 個の推定値を元に、その推定法の性能を検証。
鹿野繁樹 (大阪府立大学) 計量経済学#21 2017 年 11 月更新 21 / 30
OLS vs. WLS のモンテカルロ実験:n = 50 とし、回帰係数を α = 1、β = 1 と置いた次の回帰モデルを推定。
Yi = 1 + Xi+hiu˜i
=ui
. (12)
ここでXiとu˜iおよびhiは,次の分布から発生。
Xi ∼ N(0, 1), ui ∼ Uni(0, 4√12), hi ∼ Uni(0, 1), (13) ただしUni(a, b) は,区間 (a, b) の実数が等確率で出る一様分布。
上のデータ発生プロセスから得た擬似データにOLS と WLS をかけ、推定値を記録。
r = 10, 000 回の反復を行った。
OLS
ols
f(ols)
−1 0 1 2 3
0.00.51.01.52.0
WLS
wls
f(wls)
−1 0 1 2 3
0.00.51.01.52.0
図 1 : モンテカルロ実験:OLS vs. WLS(n = 50)
鹿野繁樹 (大阪府立大学) 計量経済学#21 2017 年 11 月更新 23 / 30
図1のヒストグラム:モンテカルロ実験の結果。
明らかにOLS よりも OLS のほうが安定(標準偏差は OLS が 0.452、WLS が 0.312)。
OLS、WLS の平均値はそれぞれ 1.003、0.999 で、真の値 β = 1.000 とほぼ一致。⇒ 両者が回帰係数の不偏推定量・一致 推定量であることの裏付け。
正規分布でない誤差項uiでも、両者の分布は釣り鐘型。
⇒ n = 50 程度でも、中心極限定理により OLS と WLS がうま く正規近似される。
Example 2
表2:表 1のデータを用い、家計の消費を所得とその他の属性に 回帰。
推定値はOLS と WLS でさほど変わらないが、後者の t 値が大 きい。
鹿野繁樹 (大阪府立大学) 計量経済学#21 2017 年 11 月更新 25 / 30
OLS WLS 係数 t 値 係数 t 値 定数項 -9.33 -3.05 -8.39 -4.18 可処分所得(万円) 0.57 4.27 0.50 5.77 子どもの数 2.22 6.48 2.79 7.42 世帯主年齢 0.67 6.17 0.72 7.86 持家ダミー -0.19 -4.40 -0.22 -6.02 共働きダミー -1.02 -0.86 0.17 0.19 修正済み決定係数 0.92 0.95
グループ数G 32 32
表 2 : グループデータによる消費関数の推定
不均一分散へのアプローチ:まとめと比較
前回・今回の不均一分散の論点をまとめ。
Remark 4
不均一分散へのアプローチ。
1 ホワイトの頑健な分散推定:不均一分散の状況で、いかに正 しくOLS の標準誤差や t 値を評価するか。
2 WLS:比例的な不均一分散の構造を利用して、推定の精度を 改善。
ポイント:誤差項の分散に関する仮定は、OLS の不偏性・一 致性に何ら関与しない。
鹿野繁樹 (大阪府立大学) 計量経済学#21 2017 年 11 月更新 27 / 30
ホワイトの研究が広まる以前は、WLS が主流。
WLS の欠点:誤差項の分散構造に強い仮定。⇒ 頑健性を欠 く。... 一般に分散の構造は分析者にとって未知。
∴ 現在の実証分析では、「OLS + ホワイトの標準誤差」。 理論上・定義上比例的な不均一分散が発生するケース(例: グループ平均による回帰分析)では、WLS を使って推定効率 を改善させるほうがよい。
WLS とホワイトの手法を、併用することも可能。⇒ テキスト p199 参照。
今回の復習問題
次の設問に答えよ。各自用意した紙に解答し、退出時に提出せよ。 講義名、日付、学籍番号、氏名を明記すること。
1 テキスト第11 章復習問 11.3。
2 本来は均一分散である回帰モデルに、ウェイト1/
√hiを使っ
てWLS を適用すると、いかなる問題が生じるか?(テキスト 第11 章復習問 11.3 の類題。)
鹿野繁樹 (大阪府立大学) 計量経済学#21 2017 年 11 月更新 29 / 30
References
鹿野繁樹. 新しい計量経済学. 日本評論社, 2015.