担当:鹿野(大阪府立大学)
2013 年度後期
はじめに
前回の復習
識別条件:過小識別(識別不可能)、丁度識別(→IV推定)、過剰識別(→2SLS推定)。
需要曲線・供給曲線のIV・2SLS推定。
今回学ぶこと
因果関係にこだわった実証分析。
自然実験。
テキスト該当箇所:特になし。
1 因果関係にこだわった実証分析
1.1
内生性バイアス:因果性実証の障害
次の回帰モデルに基づき、飲酒drinkiが健康状態healthiに与える影響を推定したい。 healthi = α + β1drinki+ β2otheri+ ui. (1)
⊲ otheriは年齢や性別、所得など、データとして観測される個人属性。⇒コントロー
ル変数として、説明変数のリストに入れる。
⊲ OLSによる推定結果は
βˆ1>0 (2)
で、かつ統計的に有意。∴飲酒から健康状態への正の (飲酒は健康増進 に役立つ)...と判断して良いか?
1
観測できない個人属性:othersiをコントロールしても、なお観測不可能な属性aiが存在。
⇒ ˆβ1に (講義ノート#22)。 othersi
(コントロール可能)
ւ ց
drinki −−−−−−−−−−−−−−→OLS 推定値 ˆβ1>0
=飲酒の効果(?) healthi
տ ր
ai
(コントロール不可能)
(3)
⊲ ai =生来の体の強さや、健康への選好。⇒OLS推定は「ai → healthi」の影響まで 拾ってしまう可能性。
⊲ ∴このOLS推定値は、必ずしも「drinki →healthi」の因果関係の証拠とならない。
同時方程式:drinkiがhealthiに影響すると同時に、healthiがdrinkiの量を決定している可 能性、フィードバック。⇒ ˆβ1に (講義ノート#22、24)。
OLS 推定値 ˆβ1>0
−−−−−−−−−−−−−−→
=健康増進(?)
drinki healthi
フィードバック
←−−−−−−−−−−−−−−−−−−−−
健康だからお酒が飲める!
տ ր
othersi
(4)
⊲ drinkiとhealthiの水準が同時決定。
⊲ ∴このOLS推定値は、必ずしも「drinki →healthi」の因果関係の証拠とならない。
実験データ: により、drinkiの値がランダムに個人(被験者)に与えら れれば?
⊲ drinkiは定義上、観測できない個人属性aiを含む、あらゆる変数と独立⇒除外変数
バイアスが発生しない。
⊲ healthi →drinkiのフィードバックがない⇒同時方程式バイアスが発生しない。
⊲ ∴ここで得られる統計的に有意なOLSは、「drinki →healthi」の因果関係の証拠。
⊲ ... 社会科学の分野では、倫理的・金銭的に実験が難しい。
Remark:説明変数Xi、被説明変数Yi の水準が個人の意思で決定される場合、OLSに
が発生。
⊲ ∴アンケート調査など、非実験データを用いた実証分析では、OLSで変数間の因果 関係を立証するのは困難。
⊲ 「因果性」は、「統計的有意性」とは別次元の問題。有意な推定結果が得られても、 必ずしも因果性を意味しない。
⊲ OLSに頼った回帰分析では、得られた結果が因果性を測っているかどうか、注意が 必要。
⊲ (3)式、(4)式のような見取り図を描き、因果の方向性を検討。適切なコントロール 変数の利用も。
⊲ 実験データ(仮に実験を行うことができたら)をベンチマークにすると、自分の回 帰分析がどれだけ「因果性」から外れているか、理解しやすい。
1.2
より身近な因果関係の識別問題
Remark:回帰分析の因果性も重要だが、日常における因果性の識別も重要。
⊲ 注意深く考えると、本当に因果関係と言えるかどうか怪しい「統計的事実」が多い。
⊲ 「観測不可能な属性(除外変数バイアス)」、「同時方程式(同時方程式バイアス)」 の視点から整理すると、なぜ怪しいのか理解しやすい。
学位のプレミアム:アメリカのwebサイト「PayScale」の「Majors That Pay You Back」に よると、経済学の学位を持つ人は、経営学や社会学、心理学士より年収が高い。(2013年 調査、学部卒。)
ランク 学位 初任給 15年目
15 Economics 50,100 96,700
60 Business Administration 43,500 71,000
95 Sociology 37,400 58,800
85 Psychology 36,300 60,700
⊲ 従って経済学を先行すれば、その他競合分野より年収が高くなる?
⊲ 観測できない属性:欧米では経済学の学位取得は超難関。⇒もともと優秀な人物が、 経済学を選択しているだけ。 の問題。
経済学
−−−−−−? → 年収
+ տ ր+
能力
(5)
医療技術の評価:病院の死亡率を調査したところ、先端的な医療技術を導入している大学 病院ほど死亡率が高く、町の診療所は死亡率が低い。この差は、統計的に有意である。
⊲ 従って高度医療の導入は、患者の死亡リスクを高める?
⊲ 同時方程式:もともと生存の可能性が低い、難病・重篤患者が高度医療を提供する 病院に集まるだけ。逆の因果。 の問題。
−−−−−−? →
高度医療 死亡リスク
←−−−−−+ −
(6)
2 自然実験
2.1
自然実験とは?
社会科学の実証分析で、実験と同様の実証結果を示すには?⇒社会実験と自然実験。
社会実験:国によっては、個人の意思決定に介入する実験、 (social experiment) が行われている。個人に対し、特定の行動を起こすインセンティブや機会を、
がランダムに与える。
⊲ 例(Dobbie and Fryer, 2011):抽選で選ばれた子どもだけに特別な教育を与え、受け なかったグループとテストスコアを比較。
⊲ ∴被験者に薬品がランダムに投与される臨床試験と同じ。⇒因果性の実証が容易。
⊲ 欠点:莫大な資金が必要、倫理上の問題。
⊲ ... 分析者が実験を執り行わなくとも、実験が「転がっている」可能性。⇒自然実験。
自然実験:歴史上の偶然・事故や、大きな社会制度の改革、人間の生物学上の制約が、無作 為化実験に限りなく近い条件のデータをもたらすことがある。これを (natural experiment)と呼ぶ。
⊲ 自然(nature)が与えた、分析者の意図せざる実験、という意味。擬似実験(quasi
experiment)とも呼ばれる。
⊲ 簡単に言えば、「偶然が引き金となって人間の行動が変わる状況」を観測したデータ。
Remark:自然実験は定義上、個々人の意思決定問題の外からやって来る 。
⊲ ∴自然実験を説明変数or操作変数に使えば、簡単なOLS・IV推定で因果性の実証分 析が可能。
⊲ 自然実験に出会うには、分析者の社会・人間に対する深い洞察力と、インセンティ ブを読む力が必要。
2.2
例:ルームメイトのピア効果
ピア効果:ピア(級友や同僚、同格の存在)が本人に与える影響を、 と呼ぶ。
⊲ 例:友人の成績(同僚の売り上げ)が、本人の成績(売り上げ)に影響。
⊲ 最適なクラス編成やチーム編成を考える際、重要な概念。
⊲ 本人とそのピアたちのパフォーマンスの「相関関係」は、OLS推定などによる統計 的な裏付けあり。
「因果関係」としてピア効果を実証するのは困難。
⊲ :ピアは、共通の環境(同じクラス・教師、同じ職場)を共有。⇒見 せかけの依存関係。...ただし説明変数でコントロール可能(担任ダミーなど)。
⊲ :勉強のできる子同士・できない子同士が友達になりがち。⇒「賢い子 とつきあうと賢くなる」のではなく、「賢いから賢いグループに入れる」。
Sacerdote(2001)の研究:ダートマスカレッジ(米国の超名門大学)の新入生制度に注目。
⊲ ほぼすべての新入生が、ランダムに割り当てられた二人一部屋の学生寮に住む。
⊲ ∴ルームメイト(RM)がランダムに与えられた状況。自己選択の問題を回避できる。
推定結果:すべてOLS推定。s.e.=標準誤差(係数をs.e.で割ればt値)。
1年次GPA 1年次GPA 4年次GPA
係数 s.e. 係数 s.e. 係数 s.e. RMのGPA 0.120 0.039 0.068 0.029 0.008 0.026 本人高校成績 0.014 0.0008 0.015 0.0007 0.013 0.0009 RMの高校成績 -0.001 0.001 -0.0003 0.0009 0.0009 0.001
その他変数 Yes Yes Yes
寮ダミー No Yes No
R2 0.24 0.38 0.18
n 1589 1589 1441
⊲ 寮ダミーをコントロールしても、ルームメイトのGPAが本人の1年次GPAに統計 的に有意な影響。∴たまたま勉強のできる(できない)同級生とルームメイトにな ると、本人の成績が上がる(下がる)!
⊲ ... 4年次の本人GPAには有意な影響がない。RMのピア効果は限定的。
2.3
例:出生と女性の労働供給
労働経済学の、古典的な問題:年少の子どもを持つ母親ほど、労働時間が短い。負の相関
関係、 。
⊲ 子どもを持つから、働きづらくなる?
⊲ 働くから、子どもを持ちづらくなる?
家庭内の子どもが 増えると、女性の働き方はどう変化するか?
⊲ 少子化問題や、ライフワークバランスを考える上で非常に重要。
⊲ ... 無作為実験(ランダムに赤ちゃんを与える)による分析は、倫理上不可能。
Angrist & Evans(1998)の研究:すでに子どもが二人いる夫婦に関し、「第3子以上の子 どもの数」が女性の労働供給に与える影響を推定。...少々特殊な母集団。なぜ?
⊲ 親は子どもの性別を選択できない、ランダム。
⊲ 親というものは、異なる性別の子どもの混合(男女、女男)を好む。⇒第2子まで が同一性別(男男、女女)だと、異なる性別の子を求めて第3子を求める確率が大 きく上がる。
⊲ ∴「第2子までが男男、女女」ダミーを、「第3子以上の子どもの数」の に使える!
⊲ 子ども自体はランダムでないが、子どもを持つインセンティブがランダム(外生的) に与えられている。
推定結果:年齢や初産年齢、人種などをコントロール。(結果は省略。)
OLS IV 2SLS
操作変数 なし 同性 男男、女女
Yi =労働参加
子どもダミーの係数 -0.155 -0.092 -0.092
標準誤差 0.002 0.024 0.024
Yi =週労働時間
子どもダミーの係数 -6.80 -4.08 -4.10 標準誤差 0.07 0.98 0.98
n 380,007
⊲ The US. 1990 Census(米国の国勢調査)の5%サンプル。∴サンプル数が30万以上!
⊲ 操作変数:「第2にまでが同性」ダミーでIV、または「第2子までが男子」ダミーと
「第2子までが女子」ダミーで2SLS。
⊲ OLSは、子供が生まれることによる女性への負担を 。
まとめと復習問題
今回のまとめ
因果関係の観点から、実証分析で注意すべき点。
自然実験とその意義。
参考文献
1. Dobbie & Fryer (2011), “Are High-Quality Schools Enough to Increase Achievement Among the Poor?: Evidence from the Harlem Children’s Zone”, American Economic Journal: Applied Economics, vol. 3, pp. 158-187.
2. Angrist & Evans (1998), “Children and Their Parents’ Labor Supply: Evidence from Exogenous Variation in Family Size”, American Economic Review, vol. 88(3), pp. 450-477.
3. Sacerdote (2001), “Peer Effects With Random Assignment: Results For Dartmouth Room- mates”, Quarterly Journal of Economics, vol. 116(2), pp. 681-704.
復習問題
出席確認用紙に解答し(用紙裏面を用いても良い)、退出時に提出せよ。 1. (1)式で、drinkiの係数をIV推定するための操作変数を挙げよ。
2. 「高校生の身長を調査したところ、バスケ部・バレー部の生徒はそれ以外の生徒より平均 身長が有意に高い。ゆえにバスケやバレーには、身長を伸ばす効果がある。」この分析を、 因果関係の観点から批評せよ。