『新しい計量経済学』鹿野研究室 slide21

(1)

計量経済学_#21

標準誤差と検定の頑健化 ₍₂₎

鹿野繁樹

大阪府立大学

2017 年 11 月更新

鹿野繁樹 _{(大阪府立大学)} 計量経済学_#21 2017 年 11 月更新 1 / 30

(2)

Outline

1 比例的不均一分散

2 加重最小_{2 乗法（WLS）}

テキスト：鹿野繁樹 [2015]、第 11.3 章・第 11.4 章。

前回の復習

1 OLS の頑健な標準誤差

2 漸近正規性に基づく仮説検定

(3)

Section 1 比例的不均一分散

(4)

不均一因子による分散の不均一性

前回から、回帰モデル_Y_i _{= α + βX}_i_{+ u}_i について、誤差項_u_iの不均一分散を許容：

Var(ui_|Xi) = E(u²_i_|Xi) = σ_i², i = 1, 2, . . . , n. (1)

... 上式は単に「観測 i によって誤差項の分散が異なってもよい」と言っているだけ。

場合によっては、事前に分散の構造を特定化できることも。

⇒ この情報を、分析に活かすことができるか？

(5)

uiの条件付き分散が比例的不均一分散

E(u²_i_|Xi) = σ_i² = hiσ² (2) で与えられ、また不均一因子_h_i（_h_i > 0）がデータとして観測できる状況を考える。

分散のベースラインは_σ

2

で一定。_{⇒ h}_iの違いで分散の不均一性が発生。

∴_h_iは、分散の違いを説明する「説明変数」のようなもの！簡単化のため、_h_iは非確率的なn 個の定数値であると仮定。

(6)

例：グループ平均による回帰分析

いかなる状況で比例的な不均一分散が起こる？_{⇒ 変数のグループ} 平均による回帰分析が典型的。

政府の調査データ：刊行物（『○ ○ 年鑑』や『× × 白書』）・サイト上で、グループ平均に集計・加工され公開。

ここでグループの数をG，グループ内の観測の数を

ng, g = 1, 2, . . . , G (3) と置く。

例：全国10 万人の消費支出を調査し、47 都道府県・年齢 7 階級に分け、各グループの平均値を公開。⇒ 元々n =10 万あった観測は、G = 47 × 7 = 329 個のグループ平均に圧縮。

(7)

Example 1

表1：総務省統計局『平成 21 年全国消費実態調査』を一部抜粋・整理。

n = 16480 の家計を、世帯主の年齢や配偶者の就業状況で G = 32 のグループに分け。⇒ その平均がレポート。

(8)

g ng ^消費 ^{可処分所得} ^子ども数 ^{世帯主年齢} ^持家 ^共働き

1 166 26.70 39.03 0.00 26.90 19.20 1.00 2 514 28.33 41.79 0.00 34.10 36.60 1.00 3 366 32.09 47.14 0.00 44.70 70.10 1.00

.. .

32 68 45.03 42.96 3.12 52.30 82.50 0.00

表1 : グループデータの例（『平成21年全国消費実態調査』より抜粋）

(9)

一方、集計・平均化される前のデータを個票データ（マイクロデータ）と呼ぶ。

政府実施の調査の個票データは、政府関係者・研究者以外アクセス不可。

一般公開された集計（平均）値を用いて回帰分析を行うには？

(10)

集計前の個票に基づく回帰式を

個票_: _Y_jg _{= α + βX}_jg_{+ u}_jg_, j = 1, 2, . . . , ng, g = 1, 2, . . . , G (4) と置く。（観測j は必ず、g = 1, 2, . . . , G のいずれかに属す。）

各グループ毎に上式両辺の平均をとれば、 1

ng

j

Yjg = α + β ¹ ng

j

Xjg+ ¹ ng

j

ujg

⇒ ^{グループ平均}^: ^Y^¯^g ^{= α + β ¯}^X^g^{+ ¯}^u^g^, g = 1, 2, . . . , G. (5)

∴_{( ¯}_X_g_{, ¯}_Y_g) を「サンプル数 G」の標本とみなし、 ¯Yg^をX^¯g^に

OLS 回帰すれば α、β を推定できる。

(11)

問題は、(5) 式の誤差項の分散。

簡単化のため、個票による(4) 式の分散は均一であると仮定。 E(u²_jg_{| ¯}Xg) = σ². (6) ... しかしグループ平均による (5) 式の分散は、グループ内の観測数_n_gに反比例。

(12)

公式 ₁

Y¯g^をX^¯gに回帰すると、その誤差項_u_¯_gの分散は

E(¯u²_g_{| ¯}Xg) = ¹ ng

σ². (7)

証明：復習問題とする。

(7) 式は、グループ内サンプル数 ngの逆数を不均一因子とする、比例的不均一分散の一種。

ngが多いグループほど分散が縮小する点に注目。_{... ¯}_Y_gは平均値なので、_n_gが多いほど精度が上がる（分散が下がる）ことに由来。

(13)

Section 2 加重最小 ₂ 乗法（ _WLS ）

(14)

ウェイト付き回帰の _WLS 推定

一般論に戻る。比例的不均一分散を持つ回帰モデル

Yi = α + βXi+ ui, E(u²_i_|Xi) = hiσ² (8)

に関し、その両辺を

√hi^で割った

√1 hi

Yi

= ˜_Y_i

= α_√¹ hi

=_I_i

+β_√¹ hi

Xi

= ˜_X_i

+_√¹ hi

ui

= ˜_u_i

⇒ ^Y^˜ⁱ ^{= αI}ⁱ^{+ β ˜}^Xⁱ^{+ ˜}^uⁱ

(9) をウェイト付き回帰と呼ぶ。

(15)

事前に変数変換で_Y^˜_i、_I_i、 ˜_X_iを作れば、(9) 式は OLS 推定可能。注意：定数項がなくなり、_{α は変数 I}_i（

√hi^{の逆数）の係数と}

して現れる。

Y˜i^をIi^とX^˜i^{に回帰して}α と β を OLS 推定することを、^加重最小_{2 乗法}（_{WLS）と呼ぶ。}

(9) 式の WLS 推定は、元々の回帰モデル (8) 式の OLS 推定と何が違う？

(16)

誤差項_u_˜_iの条件付き期待値をとり、 E(˜ui_|Xi) =

1

√hi

ui_|Xi

= _√¹ hi

E(ui_|Xi)

=0

= 0 (10)

より、外生性条件（FA1）は満たされる。

hiは説明変数の一種として観測されるので、_(X_i_{, h}_i_{, Y}_i_{) は異} なる観測で互いに独立（_FA2）。

∴(9) 式に OLS を適用することで得られる WLS は、OLS と同様不偏性・一致性・漸近正規性を持つ。

(17)

(9) 式の誤差項 ˜ui^{の条件付き分散は}

Var( ˜ui_|Xi) = E( ˜ui

2|Xⁱ^{) = E}¹_h

i

ui 2|Xⁱ

= ¹ hi

E(u²_i_|Xi)

=_hiσ²

= ¹ hi

hiσ² = σ². (11)

コレは均一分散！

Remark 1

WLS の効能：誤差項に比例的な不均一分散があるならば、不均一因子を利用した_I_i ₌

1

√hi

で変数_X_i、_Y_iをウェイト付けすることで、均一分散へ補正できる。

WLS は、gretl の加重最小 2 乗法（WLS）コマンドで実行できる。

(18)

OLS vs. WLS ：モンテカルロ実験による検証

（比例的な）不均一分散でも、OLS は回帰係数の一致推定量。

⇒GLS のメリットは？

(9) 式は均一分散。∴WLS は均一分散を前提とした標準誤差・ t 値の計算をそのまま使える。

... ホワイトの頑健な標準誤差で対処できる問題。現在はそれほど積極的な理由ではない。

(19)

WLS の最大の利点は有効性（推定精度の改善）にあり！

ガウス・マルコフの定理（前期の講義ノート）：誤差項分散の均一性は、OLS が最小分散となるための条件の一つ。

∴ 誤差項が不均一分散ならば、均一分散に補正することで、推定効率を改善させる余地がある。

OLS 推定は、モデルの構造を利用し尽くしていない状態。

Remark 2

WLS により、不均一分散を均一分散に補正する意義：有効性（推定精度）の改善。

(20)

注意：WSL の有効性は、小標本理論からの類推。

漸近理論（n → ∞）で議論するには、より細かい条件の精査を要する。

∴ 代わりに、シミュレーションで、WLS の分散が OLS のそれよりも小さくなるかどうか確認。

コンピュータ上で既知の母集団モデルからデータを発生させ、そのデータに特定の推定法（例えばOLS と WLS）を適用することで性能を検証する実験を、モンテカルロ実験と呼ぶ。

(21)

Remark 3

モンテカルロ実験の手順。

1 まずモデルとパラメータの値を設定。（パラメータの真の値をあらかじめ知っている点が、この実験のポイント。）

2 _{次のステップを}r 回繰り返し、r 個の推定値を記録。

1 コンピュータで、モデルからサンプル数_nの擬似データを発生。

2 その擬似データに特定の推定法を適用し、推定値を記録。

3 r 個の推定値を元に、その推定法の性能を検証。

(22)

OLS vs. WLS のモンテカルロ実験：n = 50 とし、回帰係数を α = 1、β = 1 と置いた次の回帰モデルを推定。

Yi = 1 + Xi+hiu˜i

=_u_i

. (12)

ここで_X_iと_u_˜_iおよび_h_iは，次の分布から発生。

Xi ∼ N(0, 1), uⁱ ∼ Uni(0, 4^√^12), ^hⁱ ∼ Uni(0, 1), ⁽¹³⁾ ただしUni(a, b) は，区間 (a, b) の実数が等確率で出る一様分布。

上のデータ発生プロセスから得た擬似データに_{OLS と WLS} をかけ、推定値を記録。

r = 10, 000 回の反復を行った。

(23)

OLS

ols

f(ols)

−1 0 1 2 3

0.00.51.01.52.0

WLS

wls

f(wls)

−1 0 1 2 3

0.00.51.01.52.0

図 1 : モンテカルロ実験：OLS vs. WLS（_{n = 50}）

(24)

図1のヒストグラム：モンテカルロ実験の結果。

明らかにOLS よりも OLS のほうが安定（標準偏差は OLS が 0.452、WLS が 0.312）。

OLS、WLS の平均値はそれぞれ 1.003、0.999 で、真の値 β = 1.000 とほぼ一致。⇒ 両者が回帰係数の不偏推定量・一致推定量であることの裏付け。

正規分布でない誤差項_u_iでも、両者の分布は釣り鐘型。

⇒ n = 50 程度でも、中心極限定理により OLS と WLS がうまく正規近似される。

(25)

Example 2

表2：表 1のデータを用い、家計の消費を所得とその他の属性に回帰。

推定値はOLS と WLS でさほど変わらないが、後者の t 値が大きい。

(26)

OLS WLS 係数 _{t 値} 係数 _{t 値} 定数項 -9.33 -3.05 -8.39 -4.18 可処分所得（万円） _0.57 _4.27 _0.50 _5.77 子どもの数 _2.22 _6.48 _2.79 _7.42 世帯主年齢 _0.67 _6.17 _0.72 _7.86 持家ダミー -0.19 -4.40 -0.22 -6.02 共働きダミー -1.02 -0.86 0.17 0.19 修正済み決定係数 _0.92 _0.95

グループ数_G ₃₂ ₃₂

表 2 : グループデータによる消費関数の推定

(27)

不均一分散へのアプローチ：まとめと比較

前回・今回の不均一分散の論点をまとめ。

Remark 4

不均一分散へのアプローチ。

1 ホワイトの頑健な分散推定：不均一分散の状況で、いかに正しくOLS の標準誤差や t 値を評価するか。

2 WLS：比例的な不均一分散の構造を利用して、推定の精度を改善。

ポイント：誤差項の分散に関する仮定は、_{OLS の不偏性・一} 致性に何ら関与しない。

(28)

ホワイトの研究が広まる以前は、_{WLS が主流。}

WLS の欠点：誤差項の分散構造に強い仮定。⇒ 頑健性を欠く。... 一般に分散の構造は分析者にとって未知。

∴ 現在の実証分析では、「OLS + ホワイトの標準誤差」。理論上・定義上比例的な不均一分散が発生するケース（例：グループ平均による回帰分析）では、WLS を使って推定効率を改善させるほうがよい。

WLS とホワイトの手法を、併用することも可能。⇒ テキスト p199 参照。

(29)

今回の復習問題

次の設問に答えよ。各自用意した紙に解答し、退出時に提出せよ。講義名、日付、学籍番号、氏名を明記すること。

1 _{テキスト第}11 章復習問 11.3。

2 本来は均一分散である回帰モデルに、ウェイト_1/

√hi^を使っ

てWLS を適用すると、いかなる問題が生じるか？（テキスト第11 章復習問 11.3 の類題。）

(30)

References

鹿野繁樹. 新しい計量経済学. 日本評論社, 2015.

『新しい計量経済学』 鹿野研究室 slide21

標準誤差と検定の頑健化 (2)