パネルデータ解析セミナー
第3日講義資料
2013年3月6日
演習のねらい
• 分析結果のとりまとめ
論文等で利用可能な形で結果を出力させる
• パネルデータの分析例
分析の意義
固定効果・変量効果モデル
差分の差分推定量 (DID)
分析結果のとりまとめ (1)
• エクセルを使った方法
Resultウインドウ 右クリックから “Copy Table”
分析結果のとりまとめ (2)
• エクセルを使った方法(続き)
各項目が別個のセルに入力される
分析結果のとりまとめ (3)
• estout コマンドを使った方法
追加インストールで提供
ssc install estoutで追加
付随してインストールされるesttabコマンド
使い方
estimates storeコマンドで推計結果を保存
esttabコマンドでレイアウトを指定して表示
resultウインドウに表示させるほか、csv形式等での
分析結果のとりまとめ (4)
分析結果のとりまとめ (5)
• 以下のコマンドで CSV ファイルに結果を保存
esttab all male female using result.csv, b(%9.4f) se(%9.4f) mtitles(all male female) nogaps
• その他の使い方は help esttab 参照
rtf形式、tex形式 etc.
• 他にも類似のコマンドが利用可能
outregなど
目的と好みに応じて選択
第6章:
パネルデータ分析(1)
第6章: パネルデータ分析 (1)
統計データの類型 (1)
• 時系列・横断面集計データ マクロデータ
• 横断面個票データ(家計・企業等を対象としたミクロデータ) クロスセクションデータ
パネルデータ
情 報 量
第6章: パネルデータ分析 (1)
統計データの類型 (2)
クロスセクション
データ パネルデータ
マクロ集計データ 時系列データ
時系列情報
個票情報
あり なし
なし あり
パネル調査の利用状況
(Anglist and Krueger, 1999)
• 実証分析に占める、個票データによる分析の割合は 約12%から40%に
• その中で、パネルデータによる分析は約半数 個票/パネルデータの利用の進展
第6章: パネルデータ分析 (1)
諸外国の主要なパネル調査
• 諸外国のパネル調査
Panel Study of Income Dynamics (PSID, 1968~)
National Longitudinal Survey (NLS, 1979~)
Survey of Income and Program Participation (SIPP, 1984~, rotating panel)
Health and Retirement Study (HRS, 1992~, 50+)
European Community Household Panel (ECHP, 1994~, cross-country)
その他にも、BHPS, GSOEP, HILDAなど多数
第6章: パネルデータ分析 (1)
日本のパネル調査
• 日本のパネル調査
消費生活に関するパネル調査(家計経済研究所, JPSC, 1994~)
働き方とライフスタイルの変化に関する全国調査(東 大社研, JLPS, 2007~)
暮らしと健康の調査(RIETI, JSTAR, 2007~)
21世紀出生児/成年者縦断調査(厚労省, 2001~)
暮らしの好みと満足度調査(阪大GCOE, 2003~)
慶應義塾家計パネル調査(GCOE, KHPS, 2004~)
日本家計パネル調査(PDRC, JHPS, 2009~)
第6章: パネルデータ分析 (1)
典型的なデータの構造
同一個人 複数時点
第6章: パネルデータ分析 (1)
パネルデータ分析の利点
• 動学的な分析
貧困動態の分析
• 観察できない異質性
勤続年数と賃金
• 因果関係の識別
DID法による政策評価
第6章: パネルデータ分析 (1)
動学的な分析
• 貧困動態の分析
同一の主体がどのように変化したか?
表6–2: 所得階層の移動
I II III IV V Total
I 66.5% 24.4% 5.2% 2.0% 2.0% 100.0%
II 26.7% 47.2% 19.1% 6.0% 1.0% 100.0%
III 10.4% 23.3% 42.3% 17.9% 6.0% 100.0%
IV 4.6% 6.6% 23.1% 47.8% 18.0% 100.0%
V 2.1% 2.6% 4.9% 20.7% 69.7% 100.0%
20.0% 20.2% 19.8% 19.7% 20.3% 100.0%
所得五分位 (2004年)
所 得 五 分 位
(2005年 )
Total N = 2,693
第6章: パネルデータ分析 (1)
分析の準備 (1)
• データ構造の指定
個体と時点を識別する変数をそれぞれ指定
パネルデータ特有のコマンドやsyntaxを利用できる ようになる
xtset panelvar timevar [, tsoptions]
例題6.1
• データの概要を確認
xtdes コマンド
第6章: パネルデータ分析 (1)
分析の準備 (2)
• 時系列オペレータの利用
特定の変数の前年の値、翌年の値、差分 etc. を 参照できる
データ構造の指定 (xtset) を実行している必要
• 記述統計
パネルデータでの記述統計
xtsumコマンド
演習6.5
第7章:パネルデータ分析(2)
固定効果モデル・変量効果モデル
第7章: パネルデータ分析 (2)
固定効果モデル
• 勤続年数と賃金
ln ��� = ������ + �� + ���
• 観察できない個体間の異質性 �
� 時間を通じて変化しない個人特有の属性
いろいろな呼び方:
「固定効果」、「個人効果」、「fixed effect」、
「unobserved heterogeneity」
たとえば?
仕事に対する「やる気」、潜在的な能力 etc.
第7章: パネルデータ分析 (2)
固定効果モデル
• 何が問題か?
OJTへの参加と関連するケース
ln(wit)
対 象 1
δ2
δ1
対 象 2
1 1
1t = βOJT t +δ y
2 2
2t = βOJT t +δ y
第7章: パネルデータ分析 (2)
固定効果モデル
• 同一個人の複数時点の観測値
��� = ������ + �� + ���
��,�−1 = �����,�−1 + �� + ��,�−1
• 両者の差を取ると …
��� − ��,�−1 = � ����� − ����,�−1 + ��� − ��,�−1
�� は時間を通じて変化しない
差分を取ることで固定効果を除去
Fixed Effects (FE) model
第7章: パネルデータ分析 (2)
固定効果モデル
• 固定効果モデル:いくつかの方法
一階差分モデル (FD)
グループ内変動モデル (within model)
Least-Squares Dummy Variable (LSDV)
• 注意点
時間を通じて変化しない属性の影響は、固定効 果との識別ができない
例:最終学歴・性別 etc.
第7章: パネルデータ分析 (2)
変量効果モデル
• 変量効果モデル
Random-effects model, error component model
��� = ���� + �� + ���
Var ��� = ��2 / Cov ���, ��� = 0
��� ≡ �� + ��� とする
Var ��� = ��2 + ��2 / Cov ���, ��� = ��2
Ω =
��2 + ��2 ��2 ⋯ ��2
��2 ��2 + ��2 ��2
⋮ ⋱ ⋮
��2 ��2 ⋯ ��2 + ��2
第7章: パネルデータ分析 (2)
変量効果モデル
• 変量効果モデル
仮定: 個体間の異質性は説明変数と無相関
誤差項 ��� の系列相関を考慮
OLSよりも「よい」推定値(効率性)
相関していればOLSと同様にバイアス
�� と ��� が 相関しない
�� と ��� が 相関する
Pooled OLS ○ ×
変量効果 (RE) ○ ×
第7章: パネルデータ分析 (2)
演習の題材
• 勤続年数と賃金水準
賃金・勤続年数プロファイル 1. 人的資本仮説
2. マッチング仮説
• 観察できない異質性
企業と労働者の「相性」
もしマッチングのみが問題なのなら、固定効果モ デルによって、勤続年数と賃金の正の関係は消失 するはず
第7章: パネルデータ分析 (2)
演習の題材
賃金
勤続年数
マッチングがよいグループ
→ 勤続年数が長く、賃金も高い マッチングが悪いグループ
→ 勤続年数が短く、賃金は低い
第7章: パネルデータ分析 (2)
賃金関数の推計
• 目的
異なる3つの推計手法を実行し、違いを確認
Pooled OLS
変量効果モデル
固定効果モデル
演習7.3, 7.4, 7.5でそれぞれ実行してみる
説明変数は同じなので、reviewウインドウの内容を うまく使ってタイポ防止
第7章: パネルデータ分析 (2)
賃金関数の推計
• 演習 7.3: OLS による推定
結果は次ページ
reg logwage tenure age female high-other nonreg fmsz2-fmsz6 rg2-rg8 bigcity city year2005-year2009 if emp==1, robust
勤続年数 (tenure) の効果は有意に正
被説明変数は対数値なので、1年間で約1.5%賃 金が上昇することを示す
第7章: パネルデータ分析 (2)
賃金関数の推計
• 演習 7.4: 変量効果モデルによる推定
xtregコマンドを利用
オプションの「re」は、変量効果モデル (random effects) の指定
赤字部分はOLSと同じ!
xtreg logwage tenure age female high- other nonreg fmsz2-fmsz6 rg2-rg8 bigcity city year2005-year2009 if emp==1, robust
結果はOLSとほとんど同じ
勤続年数 (tenure) の効果は有意に正
第7章: パネルデータ分析 (2)
賃金関数の推計
• 演習 7.5: 固定効果モデルによる推定
最終学歴・女性ダミーの各変数は説明変数から 除外(赤字部分、理由は前述)
年齢も除外:理由について考えてみてください(定 xtreg logwage tenure nonreg fmsz2-fmsz6 rg2-rg8 bigcity city year2005-year2009 if emp==1, fe
勤続年数 (tenure) の効果は依然として正
ただし、OLSおよびREの結果 (0.015) と比べて、値 は小さくなっている点に注意
第7章: パネルデータ分析 (2)
Hausman 検定
• モデルの仮定
OLS, RE: 固定効果と説明変数は無相関
FE: 相関があってもよい
• 相関があれば、 OLS, RE の結果は誤ったものに
なる
δi と OJT が 相関しない
δi と OJT が 相関する
Pooled OLS ○ ×
変量効果 (RE) ○ ×
第7章: パネルデータ分析 (2)
Hausman 検定
• Hausman 検定
FEかREか?
直観:
FEとREの結果がほとんど同じなら、仮定1はOK
検定統計量=FEとREの係数の差の2乗(のようなもの)
↑が非常に大きければ、FEとREは異なる FEを支持
詳細はテキスト
演習7.6で実行してみる
第7章: パネルデータ分析 (2)
Hausman 検定
• 演習 7.6: Hausman 検定の実施
演習7.4の推計を行い、以下を入力
estimates store re
演習7.5の推計を行い、以下を入力
estimates store fe
Hausman検定を実施
hausman fe re
検定結果はFEを支持
第7章: パネルデータ分析 (2)
演習7.7 就業形態別の推計
• 演習 7.7: 就業形態別の推計
演習7.3から7.5について、サンプルを正規雇用者 と非正規雇用者に分けて実施し、結果がどのよう に変わるかを確認してください
第8章:パネルデータ分析(3)
DID 法による政策評価
第8章: パネルデータ分析 (3)
因果関係の識別
• DID 法による政策評価
政策評価: さまざまな分析手法
社会科学において用いられる観察データ
(observational data) は、実験室で観察されたよう な「きれいな」データではない
タイムトレンド
自己選択問題 (self-selection)
因果関係 (internal validity)
知見の一般化 (external validity)
第8章: パネルデータ分析 (3)
DID 法による政策評価
• 具体例:
放課後教育プログラムの実施と教育達成度 �
トリートメント・グループ(処置群):
政策の対象となる集団
グループの平均的達成度を見る
興味の中心は、� の大きさの正確な推計
�1� = �� + �1 (プログラム実施前)
(6.1)
�2� = �� + �2 + � (プログラム実施後)
第8章: パネルデータ分析 (3)
DID 法による政策評価
• Before–After Comparison
グループ特有の効果は除去
平均的な「デキ」の良さ
時点固有の効果 � と、政策の効果 � を区別 できない
たまたま事後的な教育達成度の測定に使われた試験 が易しかったら…
Δ�� = �2� − �1� = � + �2 − �1 (6.2)
第8章: パネルデータ分析 (3)
DID 法による政策評価
• どうやって解決するか?
コントロール・グループ(対照群):
TGの比較対象となる、政策の影響を受けない集団
(1) �� ≠ ��, (2) � = 0
BA comparison
�1� = �� + �1 (プログラム実施前)
(6.3)
�2� = �� + �2 (プログラム実施後)
Δ�� = �2� − �1� = �2 − �1 (6.4)
第8章: パネルデータ分析 (3)
DID 法による政策評価
• Difference-in-Differences ( 差分の差分 )
(6.2)と(6.4)の差分
政策の効果
政策実施前 政策実施後 トリートメント 影響なし 影響あり
コントロール 影響なし 影響なし Δ�� − Δ�� = � + �2 − �1
Δ�� (TGの差分)
− �2 − �1
Δ�� (CGの差分)
(6.5)
第8章: パネルデータ分析 (3)
DID 法による政策評価
• 個人レベルの属性を取り入れる
家庭環境・学級規模・先生や学校の属性etc.
回帰分析バージョン
係数 �: トリートメントグループ �� = 1 かつ政策 実施後 �2 = 1 にのみ現れる影響
政策効果
��� = ���� + �1��� + �2�2 + ���� × �2 + ��� (6.6)
第8章: パネルデータ分析 (3)
配偶者特別控除の効果
• 配偶者特別控除(上乗せ部分)
2004年の所得税分から廃止
0 10 20 30 40 50 60 70 80
納税者の控除総額
(a) 配 偶 者 特別控除(上乗せ分)
(b) 配 偶 者 控除(基礎部分)
(c) 配偶者 特別控除
第8章: パネルデータ分析 (3)
配偶者特別控除の効果
• 分析の仮説
配偶者特別控除の存在は、有配偶女性の労働 供給を阻害していたか?
• 分析対象
週当たり平均労働時間
就業決定(働くか働かないか)への影響については坂 田・McKenzie (2006)参照
• 分析期間
単純化のために、2004年と2005年の2年間のみ
第8章: パネルデータ分析 (3)
DID 法の適用
• 有配偶者をトリートメント・グループ
2004年調査の労働時間
2003年1年間(廃止前)を回答していると仮定
無配偶者は控除対象外
制度変更の影響はないはず
2004年 2005年
トリートメント・グループ: 有配偶者
影響あり 影響なし コントロール・グループ:
影響なし 影響なし
第8章: パネルデータ分析 (3)
DID 法の適用
• 週労働時間
��� = � + �0��� + �1��04 + �2��� × ��04 + ���� + ���
興味のある係数は �2
もし配偶者特別控除が労働供給を阻害していたな ら �2 < 0
P.69
04 2004
その他の説明変数 年ダミー
ー トリートメント・ダミ
(時間) 週当たり平均労働時間
it t
T i
it
x d d H
第8章: パネルデータ分析 (3)
DID 法の適用
• 演習 8.6: 説明変数を考慮しない分析
tab treat1 year if female==1&work04==1, sum(wkhr)
無配偶者の差分(2004年 – 2005年) –2.14時間(= 37.00 – 39.14)
有配偶者の差分:
–1.35時間(= 29.69 – 31.04) 差分の差分:
0.79時間(= –1.35 – (–2.14))
第8章: パネルデータ分析 (3)
DID 法の適用
• 演習 8.7: treat1 を使った分析
reg wkhr treat1 treat1_04 year2004 age marr high-other emp nonreg hhnum sincome noku3 noku6 bigcity city if female==1&work04==1, robust
分析結果は次ページ
トリートメント・ダミー×2004年ダミーの係数は有意
第8章: パネルデータ分析 (3)
代替的なトリートメントの定義
• 問題点
有配偶者と無配偶者の本質的な違い
制度の影響以外の要因については、すべての点で比較 が可能であると想定
実際には、労働時間の決定要因は異なる?
データ上の問題
2004年調査の労働時間 回答が1月中のものだと×
第8章: パネルデータ分析 (3)
代替的なトリートメントの定義
• 税制変更の認知
2004年調査の項目
「知らなかった」場合、仮に2004年の労働時間を 回答していたとしても配偶者特別控除の影響あり
2004年 2005年
トリートメント・グループ:
有配偶者(税制変更知らなかった)
影響あり 影響なし コントロール・グループ:
有配偶者(知っていた)+無配偶者
影響なし 影響なし
第8章: パネルデータ分析 (3)
代替的なトリートメントの定義
• 演習 8.8: treat2 を使った分析
treat2を使って、演習8.6と8.7の分析を行う
• 演習 8.9: 有配偶サンプルのみでの分析
有配偶に限定して演習8.8を行う