• 検索結果がありません。

重回帰分析 計量経済学 鹿野研究室 note12

N/A
N/A
Protected

Academic year: 2018

シェア "重回帰分析 計量経済学 鹿野研究室 note12"

Copied!
6
0
0

読み込み中.... (全文を見る)

全文

(1)

担当:鹿野(大阪府立大学)

2013 年度後期

はじめに

前回の復習

 重回帰モデルとOLS推定。

 重回帰版OLS推定量の性質(単回帰とほぼ同じ)。

今回学ぶこと

 重回帰分析を行う意義。

 非実験データにおける重回帰分析の役割。

 テキスト該当箇所 :4.24.5章。講義ノート#01の前半も参照。

1 なぜ重回帰分析か?

1.1 単回帰と重回帰:OLS 推定結果の違い

 重回帰OLSの特徴:分析に使う説明変数の組み合わせにより、同一説明変数に関するOLS の推定結果が(大幅に)変わる。

⊲ 簡単化のため、 説明変数がK = 2個の重回帰モデルを考える。

Yi= α + β1X1i+ β2X2i+ ui. (1)

このときXiの係数β1OLSは(講義ノート#11β2は省略)

βˆ1= S22S1Y− S12S2Y S11S22− S12S12

. (2)

一方、Yi に回帰した単回帰OLSβˆと置けば、 βˆ= (X1i− ¯X1)(Yi− ¯Y)

(X1i− ¯X1)2 = S1Y S11

 ˆβ1. (3)

 もし説明変数同士の偏差積和がS12=(X1i− ¯X1)(X2i− ¯X2) = 0ならば、 βˆ1=

S22S1Y− 0 S11S22− 0 =

S1Y S11 = ˆβ

. (4)

1

(2)

一方、X1iX2iの標本共分散の定義より

偏差積和S12= 0 共分散s12= 1

n − 2S12 = 0. (5)

⊲ ∴ s12= 0)ならば、単回帰のOLSと重回帰のOLSは一致。

⇒重回帰をする意味がなくなる。

 Remark: 一般に重回帰βˆ1と単回帰βˆの推定結果は、 異なる。

. (6)

⊲ ∴ OLSの推定結果は、「相方」の変数に依存する。

⊲ X1iX2iが無相関なら、両者は等しい。

S12= s12 = 0 ⇒ . (7)

...この状況は、実証分析ではまずありえない。 偶然・例外的なケース。

単回帰OLSと重回帰OLSは、それぞれ何を推定している ?計量経済学のメイン テーマ、「因果性の統計的推測」 と密接に関係

 例:2010年に東京・世田谷で取引された194件の中古マンションの「価格(万円)」を、3 つの説明変数、(1)「最寄駅からの所要時間」、(2)「築年数」、(3)「フロア面積」に重回帰。

モデル1 モデル2 モデル3 係数 t値 係数 t値 係数 t

定数項 3092.68 10.47 4325.66 13.08 1496.51 9.88

最寄駅時間(分) 74.56 2.65 66.25 2.58 -32.68 -3.20 築年数(年) -77.30 -6.40 -58.45 -12.61

面積(m264.18 33.58

修正済み決定係数R¯2 0.03 0.20 0.88

サンプル数n 194 194 194

変数の数K 1 2 3

⊲ その他の説明変数に何を使ったに応じて、「最寄駅時間」 の係数が変化。「面積」 を説明変数に加えると、 符号が逆転。

⊲ 「面積」を含めないモデル1、モデル2の分析結果に基づくと、「駅から遠ざかるほ ど、マンション価格が (!?)」... 非常にオカシナ予測に。

1.2 偏回帰係数

 偏微分のおさらい:重回帰モデル(1)式の回帰係数β1は、何を測っているのか?⇒(1)式 の期待値をとれば、 古典的仮定のCR1CR2より

E(Yi) = α + β1X1i+ β2X2i. (8)

⊲ Xi2を全員共通の適当な すれば

E(Yi) = α + β1X1i+ β2X2. (9)

(3)

上式は形式上、1変数X1iの関数。X1iで微分すると

∂E(Yi)

∂X1i = β1. (10)

... コレは の操作手順。

 Remark:重回帰モデルの係数は、 、当該

変数のYiへの影響を図る。

βˆj= ∂E(Yi)

∂X1i

,



Xi j以外の変数を定数に固定

j = 1, 2, . . . , K. (11)

⊲ いわゆる偏微分の解釈と同じ。∴重回帰の回帰係数を、 と呼ぶ。

⊲ OLS推定βˆjにより、βjの最小分散の不偏推定量が得られる(重回帰版ガウス・マル

コフの定理、講義ノート#11)。E( ˆβj) = βj

⊲ 説明変数の組み合わせにより、さまざまな偏回帰係数があり得る。(マンション価格 の分析例参照。)

1.3 除外変数バイアス

 それでは、「他の変数が 」とはどういう状況?ここで、この場限りの仮定 X2i= γ0+ γ1X1i+ vi, E(vi) = 0 (12) を置く。∴X2iX1iの依存関係をモデル化した線形回帰。X2iが、X1iviに依存してバ ラつく。

⊲ γ0γ1はある種の回帰係数。viは確率的な誤差項。

注意:viが確率変数上式よりX2iは確率変数。古典的仮定CR1に反する!

 X2iを固定せず、(12)式に従って変動するとするならば、(1)式に代入することにより Yi= α + β1X1i+ β20+ γ1X1i+ vi) + ui

= α + β2γ0



+ (β1+ β2γ1)



X1i+ β2vi+ ui



=ui

= . (13)

コレは、Yi したモデルに他ならない。⇒ βOLSβˆ(3) 式参照。

⊲ ˆββの不偏推定量なので、 期待値を取れば(βの定義に注意)、

E( ˆβ) = β = β1+ β2γ1 . (14)

∴単回帰のβˆは、「偏回帰係数β1ではない別の何か」 を見事に不偏推定している。

 除外変数バイアス :分析者の目的が偏回帰係数β1の推定であるときに、 適切な説明変数 X2iを除いてOLS推定したことで生じるバイアス

Bias = E( ˆβ) − β1 = (15)

を、 と呼ぶ。バイアス(bias)=偏向、偏り。

(4)

⊲ ˆβは、偏回帰係数β1 )に加え間接効果β2γ1 )ま

で拾ってしまう!

⊲ ∴ ˆβは、系統的に偏回帰係数β1を過大評価・過小評価。ターゲットβ1からズレた推

定値をはじき出しやすい。素直に重回帰OLSをすべき。

 Remark:「除外変数バイアスの回避」 こそが、わざわざ重回帰分析をすることの目的。

バイアスの方向性は、β2 )とγ1 )の符号で決まる。ま

とめると

β2< 0 β2 > 0 γ1< 0 Bias> 0 Bias< 0 γ1> 0 Bias< 0 Bias> 0

2 非実験データにおける重回帰分析の役割

2.1 実験データによる回帰分析

 Remark:重回帰モデル(1)式の推定に当たり、 次の状況下では、YiX1iだけに単回帰 してもバイアスは発生しない。

ケース1 。そもそもX2iYiに影響しない。このとき

E( ˆβ) = β1+ 0 · γ1= . (16)

ケース2 X2iが、X1iとは独立に決まっている。 このとき

E( ˆβ) = β1+ β2· 0 = . (17)

どんなとき、ケース2γ1= 0となる?分析者が、X1iX2iが独立になるように

X1iを与えればよい。

 無作為化実験 :分析者が、γ1 = 0となるようにX1iの値をランダムに観測個体 (被験者) に割り振る実験を、 と呼ぶ。

⊲ コンピュータの乱数などでランダムに X1iの値(例えば薬品の投与量) を決める。

⇒ X1iX2i(例えば年齢)が独立。γ1= 0。このX1iは、個体iが持つあらゆる属性 と独立。

⊲ ∴無作為化実験が可能なら、単回帰でいつでも「X1i → Yi」の純粋な が 推定できる。あとは有意性の検定をするだけ。

講義ノート#01で「実験データなら、 分析が比較的簡単」 と述べた理由が、 コレ。

2.2 非実験データ:コントロール変数の重要性

 非実験データ:経済学などの実験が難しい分野(社会科学)では、 を使 わざるを得ない。

⊲ 例:社会調査(アンケート)や店舗の売上データ、財務データ、市場取引データなど。

(5)

観測対象の自由な の結果や、市場の を記録した数字。 分 析者の介入がない、 ありのままの記録。

⊲ 非実験データでは、分析者がX1iの値をランダムに決められない。∴一般に説明変数

(個人属性)同士が相関。⇒ γ10

⊲ ∴重回帰OLSで、「他の条件を一定とした」 偏回帰係数を推定すべき。

 コントロール変数 :重回帰モデル

Yi = α + β1X1i+ β2X2i+ · · · + βKXKi+ ui (18)

で、分析者はX1iの偏回帰係数β1X1i → Yi)に興味があるとする。∴ X1iはこの回帰分 析の「 」。

⊲ β1は「X2i, . . . , XKiを一定としたとき、X1iの変化が平均的なYiに与える影響」

ここでX2i, . . . , XKiを、 と呼ぶ。

コントロール変数X2i, . . . , XKiは分析の上で「 」だが、β1に「他の条件を一

」という意味を持たせる上で非常に重要。

 Remark:非実験データの分析で、「X1iだけにしか興味が無いから、他の変数は使わず単

回帰分析する」 という考えは、 。

⊲ むしろ、重回帰分析で他の変数の影響をコントロールするべき。

⊲ 係数の統計的有意性も大切だが、「どのような変数をコントロールしたか」 も重要。 分析の評価を左右する。

 例:マンション価格の分析例で、「面積」をコントロールしないと、「最寄駅からの時間」 の係数が正で有意に。

⊲ 分析の素人は、次のような(一見もっともらしい) 結論を下しかねない。「世田谷な どの高級住宅街のマンションの購買層は、より閑静な場所を居住地に求める。従っ て駅から遠いほど価格にプレミアがつく。」

⊲ 正解:駅から近いほどマンションの面積が なる傾向がある。一方、狭いほ どマンション価格は落ちる。∴「最寄駅からの時間」の係数は、「マンションの広さ」 が「価格」に与える影響を拾っているだけ。実際、「マンションの広さ(面積)」 をコントロールすると、「最寄駅からの時間」 の係数が負で有意になる。

2.3 重回帰分析の限界

 重回帰分析(コントロール変数アプローチ)の限界:データとして 変数 しか、重回帰でコントロールできない。

一方、データとして 変数も全てコントロールしないと、 実験デー タと同じ意味での 「因果関係」は立証(推定有意性検定)できない。

 例:妊婦の喫煙X1iが、生まれる子どもの体重Yi(低体重児)に与える影響の推定。

⊲ 実証上の問題 :タバコという側面を 「抜き」 にしても、喫煙者と非喫煙者はあらゆ る面で異なる。

(6)

∗ 妊婦の学歴や年齢、所得水準などは 重回帰でコントロール可能。

∗ 「子どもの健康への選好」、「リスク全般に対する態度」、「子を想う母性・愛情」 などは コントロール不可能。

本当にタバコのせい?「母親がタバコを吸と低体重児が生まれるんじゃなくて、単に 子どもの健康に無頓着だからタバコも吸うし、 そんな親から生まれる子どもだから 低体重児なんじゃないの ?」...重回帰分析では反論できない。

実験で喫煙量X1iを妊婦にランダムに与えてみる ?もってのほか。

 非実験データによる変数間の (causal inference)をめぐる議論は、 計量経済 学の近年の潮流を理解する上で重要。

⊲ 未解決の問題の多い、 先端的なトピックの一つ。 しかし同時に、 経済学実証の古典 的問題(需要曲線・供給曲線の推定)とも密接に関係。

⊲ 回帰分析の考え方自体を、再構築する必要。古典的回帰モデルからの脱却。この 講義の終盤で、 再考する。

まとめと復習問題

今回のまとめ

 重回帰モデルの回帰係数の意味 (偏回帰係数)と、除外変数バイアス。

 非実験データにおける重回帰分析 :コントロール変数の重要性。

復習問題

出席確認用紙に解答し (用紙裏面を用いても良い)、 退出時に提出せよ。

1. 重回帰モデルYi = α + β1X1i+ β2X2i+ ui, E(ui) = 0の回帰係数β1は、どんな意味がある

か?(何を測っているか ?)簡潔に述べよ。

2. 上のモデルからからX2iを除いてOLS推定すると、β1の推定に関してどんな問題が生じ るか?簡潔に述べよ。

参照

関連したドキュメント

1880 年代から 1970 年代にかけて、アメリカの

1880 年代から 1970 年代にかけて、アメリカの

中国の農地賃貸市場の形成とその課題 (特集 中国 の都市と産業集積 ‑‑ 長江デルタで何が起きている か).

 ティモール戦士協会‑ティモール人民党 Kota/PPT 1974 保守・伝統主義  2  ティモール抵抗民主民族統一党 Undertim 2005 中道右派  2.

⑧ Ministry of Statistics and Programme Implementation National Sample Survey Office Government of India, Report No.554 Employment and Unemployment Situation in India NSS 68th ROUND,

Ⅲ期はいずれも従来の政治体制や経済政策を大きく転

2016.④ Daily News &amp; Analysis &#34;#dnaEdit: Tamil Nadu students' suicide exposes rot in higher

告した統計をもとに編集されている 1 。国際連合統 計委員会(United Nations Statistical Commission、以 下 UNSC