『新しい計量経済学』鹿野研究室 slide12

(1)

計量経済学_#12

重回帰分析 ₍₂₎

鹿野繁樹

大阪府立大学

2017 年 11 月更新

(2)

Outline

1 偏回帰係数

2 コントロール変数の重要性

テキスト：鹿野繁樹 [2015]、第 6.3 章・第 6.4 章。

前回の復習

1 _{重回帰モデル}

2 _{重回帰分析の注意点}

(3)

Section 1 偏回帰係数

(4)

重回帰モデルの偏回帰係数

古典的仮定を満たす_k = 2 の重回帰モデルを考える。

Yi = α + β1^X1i+ β2^X2i+ ui, E(ui) = 0. (1) X_1i^がYiに与える効果を推定したい。⇒ 重回帰ではなく、Yi

を_X_1iに単回帰すれば十分？

一方、単回帰と重回帰では、同一説明変数の係数推定値が大幅に異なる（講義ノート_#11）。

単回帰と重回帰の回帰係数は、それぞれ何を測っている？

⇒ 鍵は、数学の「微分」と「偏微分」の違いにあり。

(5)

二変数の一次式_y_{= a + b}₁_x₁_{+ b}₂_x₂の偏微分：_x₁の偏導関数は、 x₂^{を適当な定数値}c に固定し、

y = a + b1^x1+ b2^x2

x₂= c に固定

−−−−−−−→

x₁^{だけの関数}

y= a + b1^x1+ b2^c 定数 x₁で微分

−−−−−→ ^∂y

∂x₁ ^{= b}¹^. ⁽²⁾

∴ 係数_b₁は、仮に_x₂が一定のときに、_x₁が_{y に与える影響を} 測る。「他の条件を一定として（ceteris paribus）」。

x₂^{の偏導関数も同様に、}x₁ = c に固定して微分。

∂y

∂x₂ ^{= b}²^. ⁽³⁾

(6)

重回帰モデル(1) に戻り、説明変数 X1i^と^X2i^{が、次の依存関係に}

あると仮定する。

仮定 ₁

解説のための臨時の仮定。今回限り有効。

X_2i= η₀+ η₁X_1i+ vi, E(vi) = 0. (4) η₀^とη₁（エータ）は回帰係数。_η₁ = 0 の場合を除き、X2i^の

変動は_X_1iで予測され得る。 vi^{は、確率的な誤差項。}

(7)

全ての観測個体の_X_2iが同一水準_X_2i = c ならば？⇒ (1) 式は Yi = α + β₁X_1i+ β₂c+ ui. (5) 期待値をとり_X_1iで微分すれば、偏導関数

E(Yi) = α + β1^X1i+ β2^c

X_1iで微分

−−−−−−→

X_2i=c

∂E(Yi)

∂X1i

= β1^. (6)

∴_β₁は、「仮に_X_2iを一定水準に固定したときに、_X_1iが_Y_iの期待値に与える影響」を測る！

重回帰モデルの回帰係数を、特に偏回帰係数と呼ぶ。重回帰の_{OLS ˆ}_β₁で、偏回帰係数_β₁の不偏推定が可能。

E( ˆβ1) = β1. (7)

(8)

以上の結果を一般型でまとめれば_...

公式 _{1 (} 偏回帰係数の意味 ₎

一般的な重回帰モデル

Yi = α + β1X1i+ β2X2i+ · · · + βkXki+ ui (8) の偏回帰係数_β_j（_j = 1, 2, . . . , k）は、「仮に Xji^{以外の変数が観測}

間で同一水準のとき、_X_jiが_Y_iの期待値に与える影響」を測る。 E(Yi) = α + β1X1i+ β2X2i+ · · · βkXki Xji^で微分

−−−−−−−→

X_ji以外一定

∂E(Yi)

∂Xji

= βj. (9)

重回帰_{OLS ˆ}_β_jは、各_β_jの不偏推定量である。_{E( ˆ}_β_j_{) = β。} 証明：前段で証明済み。

(9)

単回帰と重回帰の違い：除外変数バイアス

一方、「_X_2iが一定ではない」状態で、_E(Y_i_{) を X}_1iで微分すると？

⇒ X_2i^は(4) 式に従って変動。

(4) 式を (1) 式の X2i^{に代入・整理すれば}

Yi = α + β1^X1i+ β2(η0+ η1^X1i+ vi) + ui

= (α + β2^η0)

=α^′

+ (β1+ β2^η1)

=β^′

X_1i+ β2^vi+ ui

=u^′_i

= α^′ + β^′X1i+ u^′_i. (10) コレは、_Y_iを_X_1iだけに回帰した単回帰モデル！

(10)

単回帰の_X_1iの係数は dE(Yi)

dX1i

= β^′ = β₁+ β₂η₁. (11) X_2i^{に由来する係数}β₂^とη₁が混在してしまう点に注目。

単回帰の_{OLS を ˆ}_β

′

と置けば、 ˆ_β

′

は_β

′

を不偏推定。しかし

E( ˆβ^′) = β^′ = β1+ β2^η1 = β1 (12)

なので、単回帰で得られた_{OLS ˆ}_β

′

は偏回帰係数_β₁の不偏推定量ではない。

(11)

単回帰と重回帰の違いを整理：(1) 式に登場する三変数 X1i^、^X2i^、

Yi^{は、次の依存関係。}

X_1i −^β→¹ η1 ↓ Yi

X_2i −^β→²

(13)

重回帰：_X_2iが一定値に固定される_⇒ _{OLS により}

「_X_1i

β₁

−→ Yi」がうまく識別される。

単回帰：_X_2iが自由に変動_⇒ _{OLS は、「X}_1i

β₁

−→ Yi^{」だけでな}

く、「_X_1i

η₁

−→ X_2i −^β→ Y² i^{」まで拾ってしまう！}

∴ 単回帰と重回帰のOLS では、異なる分析結果。

(12)

Remark 1

重回帰モデル(1) に関する、単回帰 OLS と重回帰 OLS の違い。 Yi^をX1i^{だけに単回帰}: E( ˆβ^′) = β1

X_i1^→Yi

+ η1 X_i1^→X_2i

× β2 X_i2^→Yi

, (14) _Y_iを_X_1iと_X_2iに重回帰_: _{E( ˆ}_β₁_{) =} _β₁

X_i1^→Yi

. (15)

偏回帰係数_β₁の推定が目的ならば、単回帰_{OLS ˆ}_β

′

は不適切。

(13)

βˆ^′^{の期待値と}β₁^の差

Bias( ˆβ^′) = E( ˆβ^′) − β₁ = η₁β₂ ⇔ E( ˆβ^′) = β₁+ Bias( ˆβ^′) (16) を、除外変数バイアス（omitted variables bias）と呼ぶ。

X2iをモデルから除外したことに起因するバイアス。

βˆ^′^でβ1を推定すると、推定結果としてターゲットの_β₁ から Bias( ˆβ^′) だけ外れた値が実現しやすくなる。

除外変数バイアスを避ける方法：素直に重回帰_{OLS を使えば} 良い。

(14)

Section 2 コントロール変数の重要性

(15)

コントロール変数とは？

分析者は多くの場合、ある一つの説明変数_X_jiが_Y_iに与える影響を知りたい。

Xji^{以外の説明変数は、}「その他変数の影響を一定」というコンディション作りのために使う。これらの変数を、コントロール変数と呼ぶ。

どのような変数をコントロールしたかにより、実証分析の評価・信頼性は大きく変わる。

∴ コントロール変数は「脇役」だが重要。

(16)

コントロール変数の重要性を確認するため、次の分析例を考える。

Example 1

講義ノート#01 のデータを用い、「駅へのアクセスの良さがマンション価値に与える影響」を実証したい。

マンション価格_price_i（万円）を最寄駅までの所要時間_min_i

（分）にOLS 回帰。（カッコ内は有意性の t 値。） price_i = 3092.68

(10.47) ^{+ 74.56}(2.65) ^minⁱ ⁽¹⁷⁾

t 値を見ると、定数項・係数ともに統計的に有意。

駅までの時間が1 分長くなると市場価値が 72 万円増える傾向が検出！

上の分析結果は、「世紀の大発見」？_{⇒ 答えは}_NO！

(17)

表1：マンション価格に関する 3 パターンの OLS 推定の結果。モデル1 は (17) 式の再掲、モデル 2 は重回帰で「築年数」を、モデル3 は「築年数」と「面積」をコントロールした推定値。

「面積」をコントロールすると、「最寄駅所要時間」の係数が負で有意に。

モデル3：築年数・面積が同一のマンションは、最寄駅までの所要時間1 分増につき 33 万円ほど価格が下がる。

(18)

モデル 1 モデル 2 モデル 3

係数 ^t値係数 ^t値係数 ^t値

定数項 3092.68 10.47 4325.66 13.08 1496.51 9.88 最寄駅時間（分） 74.56 2.65 66.25 2.58 -32.68 -3.20

築年数（年） -77.30 -6.40 -58.45 -12.61

面積（m²） 64.18 33.58

修正済みR¯² 0.03 0.20 0.88

サンプル数 n 194 194 194

説明変数の数 k ¹ ² ³

表1 : マンション価格の回帰分析

(19)

なぜ「面積」をコントロールしないと(17) 式のような結果（駅から遠いほど価格が高い）となるのか？

理由は単純：駅から遠い場所ほど広い物件が多いから。面積はマンション価格に対し、非常に強い正の影響。

∴ 単にマンション価格を最寄駅からの距離（_{or 時間）に回帰} すると、部屋の広さによる価格上昇効果をOLS が拾う ⇒ 正の係数が検出！

(20)

コントロール変数アプローチは、非実験データによる回帰分析の問題点を一部解決。

補習参加が成績に与える効果の実証分析（講義ノート_{#01 の} 数値例）を再考。

「補習に参加する子とそうでない子は、補習を抜きにしても、もともと学力に違いがあるのでは？」

プログラム参加前の児童の学力に作用しうる要因（前年度の成績や家庭の教育費支出など）を重回帰でコントロール_{⇒ こ} れらを一定としたもとでの補習の効果を_{OLS 推定できる。}

∴ 直接興味のない変数も、コントロール変数として調査・記録する必要性。

(21)

実証分析の各分野ではコントロール変数の「定石」がある。例：物件価格の分析では、物件面積のコントロールが必須。迷ったら、既存の研究論文などを参考に。

Remark 2

実証分析では、適切なコントロール変数の使用を心がける。単回帰OLS の結果は、さまざまな雑音（バイアス）が入る可能性。

何をコントロールすべきか？⇒ 既存研究を参考にすればよい。

(22)

実験データの回帰分析

もし_{(4) 式で η}₁ _{= 0 ならば？}

つまり説明変数_X_1iと_X_2iが互いに独立なケース。模式図で表現すれば

X1i β₁

−→

×独立 Yi

X2i β₂

−→

(18)

このとき(12) 式ないし (16) 式は

E( ˆβ^′) = β1+ 0 · β2 = β1^. (19)

∴ バイアス項は消え、単回帰_{OLS ˆ}_β^′が偏回帰係数_β₁の不偏推定量に。

(23)

どんなデータ環境で_η₁ _{= 0 となる？}

分析者が_X_1iの値を観測個体（被験者）にランダムに割り当てる。∴ 無作為化実験（講義ノート_#01）。

講義ノート#01 の新薬の投与量と血圧の分析を再考。

分析者が（コンピュータの乱数などで）新薬投与量_X_1iをランダムに与えれば、被験者i が持つあらゆる個人属性と独立に。その他属性をコントロールしてもしなくとも、単回帰の_OLS にバイアスが出ない。

(24)

実験データでは、重回帰（コントロール変数）はそれほど重要でない。

「単回帰OLS で係数が統計的に有意」=「因果関係の実証」。無作為化実験のポイント：説明変数とその他の個人属性に相関・共変動が存在しないこと。

ダメな実験：次のようなルールで投与量を決めると、単回帰 OLS にバイアスが発生。

「年齢が高いほど多く投与」

「被験者の希望に従って投与」

(25)

コントロール変数の意義と限界

非実験データに基づく回帰分析（経済学など）では、コントロール変数による重回帰分析が必須。

マンション価格の例で経験したような、見当違いの結論を回避。

次のような実験は、出来れば素晴らしいが、通常不可能。

「マンションの場所をランダムに決め、建てたのち価格を観測」

「ランダムに駅を作り、周りのマンションの価格を観測」

(26)

コントロール変数の限界：観測できない属性は、コントロールしようがない！

例：喫煙が個人の健康状態に与える影響の実証分析（医療経済学など）。

喫煙者と非喫煙者を比較：喫煙状況だけでなく、年収や学歴など、健康に作用する可能性のある属性に有意差。_{⇒ これら} 属性を重回帰でコントロールすべき。

しかし「リスク回避度」や「健康への選好」など、喫煙習慣と健康状態双方に影響しうる重要な属性は、観測・コントロール不可能！

∴「タバコを吸うと健康が損なわれる」のか、「健康に無関心だからタバコを吸い、健康状態も悪い」のか、重回帰分析では区別ができない。

(27)

統計理論上「喫煙状態を個人にランダムに与える」実験は理想的だが、倫理上実行不可能。

コントロール（重回帰）も無理、実験も無理、どうすればよい？⇒ 計量経済学は、そこで真価を発揮。

古典的回帰モデルの枠組みでは、この問題を議論できない。

⇒ 詳しくはこのコースの後半で。

(28)

今回の復習問題

次の設問に答えよ。各自用意した紙に解答し、退出時に提出せよ。講義名、日付、学籍番号、氏名を明記すること。

1 _Y_i = 個人 i の時間当たり賃金、X_1i= 大卒以上ダミー（学歴）、 X_2i =15 歳時点での家計所得、と置く。仮に X2i^{が同一だとし}

て、_X_1iの違いだけでどれほど_Y_iに差がでるか、実証したい。

1 回帰分析でこの実証分析を行なうには、どうすればよいか？

2 上記以外の方法として、どのようなものが考えられるか？

（テキスト第6 章復習問題 6.2 の類題。）

(29)

References

鹿野繁樹. 新しい計量経済学. 日本評論社, 2015.

『新しい計量経済学』 鹿野研究室 slide12

重回帰分析 (2)