担当:鹿野(大阪府立大学)
2013 年度後期
はじめに
前回の復習
重回帰モデルとOLS推定。
重回帰版OLS推定量の性質(単回帰とほぼ同じ)。
今回学ぶこと
重回帰分析を行う意義。
非実験データにおける重回帰分析の役割。
テキスト該当箇所 :4.2、4.5章。講義ノート#01の前半も参照。
1 なぜ重回帰分析か?
1.1 単回帰と重回帰:OLS 推定結果の違い
重回帰OLSの特徴:分析に使う説明変数の組み合わせにより、同一説明変数に関するOLS の推定結果が(大幅に)変わる。
⊲ 簡単化のため、 説明変数がK = 2個の重回帰モデルを考える。
Yi= α + β1X1i+ β2X2i+ ui. (1)
⊲ このときXiの係数β1のOLSは(講義ノート#11、β2は省略)、
βˆ1= S22S1Y− S12S2Y S11S22− S12S12
. (2)
⊲ 一方、Yiを に回帰した単回帰OLSをβˆ′と置けば、 βˆ′= (X1i− ¯X1)(Yi− ¯Y)
(X1i− ¯X1)2 = S1Y S11
ˆβ1. (3)
もし説明変数同士の偏差積和がS12=(X1i− ¯X1)(X2i− ¯X2) = 0ならば、 βˆ1=
S22S1Y− 0 S11S22− 0 =
S1Y S11 = ˆβ
′. (4)
1
⊲ 一方、X1iとX2iの標本共分散の定義より
偏差積和S12= 0 ⇔ 共分散s12= 1
n − 2S12 = 0. (5)
⊲ ∴ (s12= 0)ならば、単回帰のOLSと重回帰のOLSは一致。
⇒重回帰をする意味がなくなる。
Remark: 一般に重回帰βˆ1と単回帰βˆ′の推定結果は、 異なる。
. (6)
⊲ ∴ OLSの推定結果は、「相方」の変数に依存する。
⊲ X1iとX2iが無相関なら、両者は等しい。
S12= s12 = 0 ⇒ . (7)
...この状況は、実証分析ではまずありえない。 偶然・例外的なケース。
⊲ 単回帰OLSと重回帰OLSは、それぞれ何を推定している ?⇒計量経済学のメイン テーマ、「因果性の統計的推測」 と密接に関係
例:2010年に東京・世田谷で取引された194件の中古マンションの「価格(万円)」を、3 つの説明変数、(1)「最寄駅からの所要時間」、(2)「築年数」、(3)「フロア面積」に重回帰。
モデル1 モデル2 モデル3 係数 t値 係数 t値 係数 t値
定数項 3092.68 10.47 4325.66 13.08 1496.51 9.88
最寄駅時間(分) 74.56 2.65 66.25 2.58 -32.68 -3.20 築年数(年) -77.30 -6.40 -58.45 -12.61
面積(m2) 64.18 33.58
修正済み決定係数R¯2 0.03 0.20 0.88
サンプル数n 194 194 194
変数の数K 1 2 3
⊲ その他の説明変数に何を使ったに応じて、「最寄駅時間」 の係数が変化。⇒「面積」 を説明変数に加えると、 符号が逆転。
⊲ 「面積」を含めないモデル1、モデル2の分析結果に基づくと、「駅から遠ざかるほ ど、マンション価格が (!?)」... 非常にオカシナ予測に。
1.2 偏回帰係数
偏微分のおさらい:重回帰モデル(1)式の回帰係数β1は、何を測っているのか?⇒(1)式 の期待値をとれば、 古典的仮定のCR1、CR2より
E(Yi) = α + β1X1i+ β2X2i. (8)
⊲ Xi2を全員共通の適当な すれば
E(Yi) = α + β1X1i+ β2X2∗. (9)
⊲ 上式は形式上、1変数X1iの関数。X1iで微分すると
∂E(Yi)∗
∂X1i = β1. (10)
... コレは の操作手順。
Remark:重回帰モデルの係数は、 、当該
変数のYiへの影響を図る。
βˆj= ∂E(Yi)
∗
∂X1i
,
Xi j以外の変数を定数に固定
j = 1, 2, . . . , K. (11)
⊲ いわゆる偏微分の解釈と同じ。∴重回帰の回帰係数を、 と呼ぶ。
⊲ OLS推定βˆjにより、βjの最小分散の不偏推定量が得られる(重回帰版ガウス・マル
コフの定理、講義ノート#11)。E( ˆβj) = βj。
⊲ 説明変数の組み合わせにより、さまざまな偏回帰係数があり得る。(マンション価格 の分析例参照。)
1.3 除外変数バイアス
それでは、「他の変数が 」とはどういう状況?⇒ここで、この場限りの仮定 X2i= γ0+ γ1X1i+ vi, E(vi) = 0 (12) を置く。∴X2iとX1iの依存関係をモデル化した線形回帰。X2iが、X1iとviに依存してバ ラつく。
⊲ γ0、γ1はある種の回帰係数。viは確率的な誤差項。
⊲ 注意:viが確率変数→上式よりX2iは確率変数。⇒古典的仮定CR1に反する!
X2iを固定せず、(12)式に従って変動するとするならば、(1)式に代入することにより Yi= α + β1X1i+ β2(γ0+ γ1X1i+ vi) + ui
= α + β2γ0
=α′
+ (β1+ β2γ1)
=β′
X1i+ β2vi+ ui
=u′i
= . (13)
⊲ コレは、Yiを したモデルに他ならない。⇒ β′のOLS、βˆ′は(3) 式参照。
⊲ ˆβ′はβ′の不偏推定量なので、 期待値を取れば(β′の定義に注意)、
E( ˆβ′) = β′ = β1+ β2γ1 . (14)
∴単回帰のβˆ′は、「偏回帰係数β1ではない別の何か」 を見事に不偏推定している。
除外変数バイアス :分析者の目的が偏回帰係数β1の推定であるときに、 適切な説明変数 X2iを除いてOLS推定したことで生じるバイアス
Bias = E( ˆβ′) − β1 = (15)
を、 と呼ぶ。バイアス(bias)=偏向、偏り。
⊲ ˆβ′は、偏回帰係数β1( )に加え間接効果β2γ1( )ま
で拾ってしまう!
⊲ ∴ ˆβ′は、系統的に偏回帰係数β1を過大評価・過小評価。ターゲットβ1からズレた推
定値をはじき出しやすい。⇒素直に重回帰OLSをすべき。
Remark:「除外変数バイアスの回避」 こそが、わざわざ重回帰分析をすることの目的。
⊲ バイアスの方向性は、β2( )とγ1( )の符号で決まる。ま
とめると
β2< 0 β2 > 0 γ1< 0 Bias> 0 Bias< 0 γ1> 0 Bias< 0 Bias> 0
2 非実験データにおける重回帰分析の役割
2.1 実験データによる回帰分析
Remark:重回帰モデル(1)式の推定に当たり、 次の状況下では、YiをX1iだけに単回帰 してもバイアスは発生しない。
⊲ ケース1: 。そもそもX2iがYiに影響しない。このとき
E( ˆβ′) = β1+ 0 · γ1= . (16)
⊲ ケース2: 。X2iが、X1iとは独立に決まっている。 このとき
E( ˆβ′) = β1+ β2· 0 = . (17)
⊲ どんなとき、ケース2のγ1= 0となる?⇒分析者が、X1iとX2iが独立になるように
X1iを与えればよい。
無作為化実験 :分析者が、γ1 = 0となるようにX1iの値をランダムに観測個体 (被験者) に割り振る実験を、 と呼ぶ。
⊲ コンピュータの乱数などでランダムに X1iの値(例えば薬品の投与量) を決める。
⇒ X1iとX2i(例えば年齢)が独立。γ1= 0。このX1iは、個体iが持つあらゆる属性 と独立。
⊲ ∴無作為化実験が可能なら、単回帰でいつでも「X1i → Yi」の純粋な が 推定できる。→あとは有意性の検定をするだけ。
⊲ 講義ノート#01で「実験データなら、 分析が比較的簡単」 と述べた理由が、 コレ。
2.2 非実験データ:コントロール変数の重要性
非実験データ:経済学などの実験が難しい分野(社会科学)では、 を使 わざるを得ない。
⊲ 例:社会調査(アンケート)や店舗の売上データ、財務データ、市場取引データなど。
⊲ 観測対象の自由な の結果や、市場の を記録した数字。 分 析者の介入がない、 ありのままの記録。
⊲ 非実験データでは、分析者がX1iの値をランダムに決められない。∴一般に説明変数
(個人属性)同士が相関。⇒ γ10。
⊲ ∴重回帰OLSで、「他の条件を一定とした」 偏回帰係数を推定すべき。
コントロール変数 :重回帰モデル
Yi = α + β1X1i+ β2X2i+ · · · + βKXKi+ ui (18)
で、分析者はX1iの偏回帰係数β1(X1i → Yi)に興味があるとする。∴ X1iはこの回帰分 析の「 」。
⊲ β1は「X2i, . . . , XKiを一定としたとき、X1iの変化が平均的なYiに与える影響」。
⊲ ここでX2i, . . . , XKiを、 と呼ぶ。
⊲ コントロール変数X2i, . . . , XKiは分析の上で「 」だが、β1に「他の条件を一
定∼」という意味を持たせる上で非常に重要。
Remark:非実験データの分析で、「X1iだけにしか興味が無いから、他の変数は使わず単
回帰分析する」 という考えは、 。
⊲ むしろ、重回帰分析で他の変数の影響をコントロールするべき。
⊲ 係数の統計的有意性も大切だが、「どのような変数をコントロールしたか」 も重要。 分析の評価を左右する。
例:マンション価格の分析例で、「面積」をコントロールしないと、「最寄駅からの時間」 の係数が正で有意に。
⊲ 分析の素人は、次のような(一見もっともらしい) 結論を下しかねない。「世田谷な どの高級住宅街のマンションの購買層は、より閑静な場所を居住地に求める。従っ て駅から遠いほど価格にプレミアがつく。」
⊲ 正解:駅から近いほどマンションの面積が なる傾向がある。一方、狭いほ どマンション価格は落ちる。∴「最寄駅からの時間」の係数は、「マンションの広さ」 が「価格」に与える影響を拾っているだけ。⇒実際、「マンションの広さ(面積)」 をコントロールすると、「最寄駅からの時間」 の係数が負で有意になる。
2.3 重回帰分析の限界
重回帰分析(コントロール変数アプローチ)の限界:データとして 変数 しか、重回帰でコントロールできない。
⊲ 一方、データとして 変数も全てコントロールしないと、 実験デー タと同じ意味での 「因果関係」は立証(推定→有意性検定)できない。
例:妊婦の喫煙X1iが、生まれる子どもの体重Yi(低体重児)に与える影響の推定。
⊲ 実証上の問題 :タバコという側面を 「抜き」 にしても、喫煙者と非喫煙者はあらゆ る面で異なる。
∗ 妊婦の学歴や年齢、所得水準などは ⇒重回帰でコントロール可能。
∗ 「子どもの健康への選好」、「リスク全般に対する態度」、「子を想う母性・愛情」 などは ⇒コントロール不可能。
⊲ 本当にタバコのせい?「母親がタバコを吸と低体重児が生まれるんじゃなくて、単に 子どもの健康に無頓着だからタバコも吸うし、 そんな親から生まれる子どもだから 低体重児なんじゃないの ?」...重回帰分析では反論できない。
⊲ 実験で喫煙量X1iを妊婦にランダムに与えてみる ?⇒もってのほか。
非実験データによる変数間の (causal inference)をめぐる議論は、 計量経済 学の近年の潮流を理解する上で重要。
⊲ 未解決の問題の多い、 先端的なトピックの一つ。 しかし同時に、 経済学実証の古典 的問題(需要曲線・供給曲線の推定)とも密接に関係。
⊲ 回帰分析の考え方自体を、再構築する必要。⇒古典的回帰モデルからの脱却。この 講義の終盤で、 再考する。
まとめと復習問題
今回のまとめ
重回帰モデルの回帰係数の意味 (偏回帰係数)と、除外変数バイアス。
非実験データにおける重回帰分析 :コントロール変数の重要性。
復習問題
出席確認用紙に解答し (用紙裏面を用いても良い)、 退出時に提出せよ。
1. 重回帰モデルYi = α + β1X1i+ β2X2i+ ui, E(ui) = 0の回帰係数β1は、どんな意味がある
か?(何を測っているか ?)簡潔に述べよ。
2. 上のモデルからからX2iを除いてOLS推定すると、β1の推定に関してどんな問題が生じ るか?簡潔に述べよ。