DATA: FILE IS data1.dat;
VARIABLE: NAMES ARE x1 x2 x3 y z u m o;
USEVARIABLES ARE x1-x3 y;
MODEL: x3 ON x1 x2;
y ON x2 x3;
MODEL INDIRECT:
y IND x3 x1;
y IND x3 x2;
OUTPUT: SAMPSTAT STDXY MODINDICES(ALL);
【 ex5_2 】
34
因子分析
DATA: FILE IS data2.dat;
VARIABLE: NAMES ARE x1 x2 x3 y z u m o a b c d;
USEVARIABLES ARE a b c d;
MODEL: f BY a b c d;
OUTPUT: SAMPSTAT STDXY MODINDICES(ALL);
a b c
e1 e2 e3
d
e4
f
a:
自分の考えを人に説明するb:
よく知らない人と自然に会話するc:
まわりの人をまとめてひっぱっていくd:
面白いことを言って人を楽しませるf:
コミュニケーション能力?【 ex6 】
35
適合度の指標
• χ2
統計量サンプルサイズに依存
• CFI
(Comparative Fit Index
)0.90~0.95 < CIF
• TLI
(Tucker-Lewis Index
)0.90 < TLI
• RMSEA
(Root Mean Square Error Approximation
)RMSEA < 0.05
• RMR
(Root Mean Square Residual
)RMR < 1.0
• SRMR
(Standardized Root Mean Square Residual
)SRMR < 0.08
• WRMR
(Weight Root Mean Square Residual
)WRMR < 1.0
• AIC, BIC, ABIC
値が小さいほど倹約的なモデル
36
適合度をみる
十分にあてはまりはよい
37
Mplus の Output と Diagram
38
因子分析と重回帰分析 (MIMIC Model)
DATA: FILE IS data2.dat;
VARIABLE: NAMES ARE x1 x2 x3 y z u m o a b c d;
USEVARIABLES ARE x1-x3 a b c d;
MODEL: f BY a b c d;
f ON x1-x3
OUTPUT: SAMPSTAT STDXY MODINDICES(ALL);
x2 x1
x3
b
a c
e1 e2 e3
d
e4
f
x1:
女性ダミーx2:
年齢x3:
教育年数【 ex7 】
39
適合度をみる
十分にあてはまりはよい(
RMSEA
は改善できそうだが・・・)40
Mplus の Output と Diagram
x1:
女性ダミーx2:
年齢x3:
教育年数41
因子分析と 重回帰分析
DATA: FILE IS data2.dat;
VARIABLE: NAMES ARE x1 x2 x3 y z u m o a b c d;
USEVARIABLES ARE x1-x6;
MODEL: f BY a b c d ; f ON x1-x3;
y ON f x3;
OUTPUT: SAMPSTAT STDXY MODINDICES(ALL);
x2 x3 y x1
b
a c
e1 e2 e3
d
e3
f
x1:
女性ダミーx2:
年齢x3:
教育年数f:
コミュ力y:
年収(対数)【 ex8_1 】
42
適合度をみる
•
かなり悪い43
修正指標 ( Modification Indices, MI )をみる
y ON x1 y ON x2
があったほうがよさそう
44
因子分析と
重回帰分析(修正)
DATA: FILE IS data2.dat;
VARIABLE: NAMES ARE x1 x2 x3 y z u m o a b c d;
USEVARIABLES ARE x1-x6;
MODEL: f BY a b c d ; f ON x1-x3;
y ON f x1-x3;
OUTPUT: SAMPSTAT STDXY MODINDICES(ALL);
x2 x3 y x1
a b c
e1 e2 e3
d
e4
f
【 ex8_2 】
45
再び、適合度をみる
46
修正指標 ( Modification Indices, MI )をみる
47
Mplus の Output
•
男性の方がコミュニケーション 能力が高い•
年齢が高いほうがコミュニケー ション能力が高い•
学歴が高いほうがコミュニケー ション能力が高い•
男性の方が年収が高い•
年齢が高いほうが年収が高い•
学歴が高いほうが年収が高い•
コミュニケーション能力は個人 年収に影響48
SEM によるパネルデータ分析 1
固定効果とランダム効果
49
SEM による固定効果モデルとランダム効果 モデル
•
固定効果モデル(Fixed Effects Model
)とランダム効果モデル(
Random Effects Model
)•
経済学や社会学で最もよく用いられるパネルデータ分析モデル• Halaby (2004: 520)
の指摘“Many studies…ignore the issue of unobserved unit effects
altogether, or they recognize such effects but fail to assess and take steps to deal with their correlation with measured covariates.”
• Bollen and Brand (2010: 23)
の指摘“Too often researchers apply FEM and REM without careful consideration as to why they should prefer one model over another.”
•
モデルがフィットしているのかどうか• FEM
やREM
ではモデル自体の適合度については触れられない•
先行研究においていったいどれほどの論文のFEM
やREM
が良い適合度な のでしょう?(Bollen and Brand 2011
)50
ランダム効果モデルの復習
y it = α t + β x it + γz i + u i + ε it
• α
t:時点、xitは時間とともに変化する変数、z
iは時点とともに変化しない 変数、u
iは観察されない異質性、ε
itは誤差•
観察されない異質性u i
は平均0
で一定の分散を持ち、他の変数全ての 変数と独立•
特に、異質性u i
とx it
との相関が無いという仮定があるため、個人の異質性をコント ロールしたうえでのx it
の効果が得られない可能性が大きい•
時間不変の変数の効果をよほどみたいのでない限り、使用する必要はないか もしれない•
他の要因をコントロールした上での、個人の異質性を取り出す上では有効(社 会科学の関心ではない?)51
SEM によるランダム効果モデル
x2 x1
x3
y2 y1
y3
u e1
e2
e3
Cov (ui, x it ) = 0
[5]
誤差は 全て等しい[1]u
からのパスは すべて1
に固定[3] Xt
からのパスは全て等しい
z [2] Z
からのパスは全て等しい
[4]u
と他の変数 との相関は0 [5]
平均と分散は全て等しい
Cov (ui, z i ) = 0
52
DATA:
FILE IS data3;
LISTWISE = ON;
VARIABLE:
NAMES ARE women eduy k1-k7 m1-m7 inc1-inc7;
USEVARIABLES ARE women eduy k1-k7 m1-m7 inc1-inc7;
MISSING IS ALL (999);
ANALYSIS: ESTIMATOR = ML;
MODEL:
u BY k1-k7@1;
k1 ON women(1) eduy(2) m1(3) inc1(4);
k2 ON women(1) eduy(2) m2(3) inc2(4);
k3 ON women(1) eduy(2) m3(3) inc3(4);
k4 ON women(1) eduy(2) m4(3) inc4(4);
k5 ON women(1) eduy(2) m5(3) inc5(4);
k6 ON women(1) eduy(2) m6(3) inc6(4);
k7 ON women(1) eduy(2) m7(3) inc7(4);
u with women@0 eduy@0;
u with m1-m7@0 inc1-inc7@0 k1-k7@0; !コメントアウトすればFixed Effect、コメントアウトしなければRandom Effect k1-k7(5); m1-m7(6); inc1-inc7(7) ; [m1-m7](8); [inc1-inc7](9)
OUTPUT: SAMPSTAT STDYX;
[1] U
からのパスは全て1
に固定[3] Xt
からのパスは全て等しい[2] Z
からのパスは全て等しい[4]u
と他の変数との相関は0
[5]
従属変数の誤差分散、時点とと もに変化する変数の分散と平均は それぞれ時点間で等しい【 ex9 】
53
適合度を みる( REM )
悪い
54Mplus の Output
②
③
④
①
①
55
Stata の Output
Likelihood-ratio test of sigma_u=0: chibar2(01)= 2109.07 Prob>=chibar2 = 0.000 rho .478703 .0149898 .4494078 .5081137 /sigma_e .9703458 .0091815 .9525162 .9885092 /sigma_u .9298588 .0257781 .8806827 .9817808 _cons -1.250455 .3404657 -3.67 0.000 -1.917755 -.583154 lhinc .4448161 .0362619 12.27 0.000 .3737441 .515888 satis .2619765 .0204502 12.81 0.000 .2218949 .3020582 eduy .1918945 .0183065 10.48 0.000 .1560145 .2277745 women -.0043399 .0662209 -0.07 0.948 -.1341304 .1254506
2013 -.0872664 .0447157 -1.95 0.051 -.1749076 .0003747 2012 -.0196511 .0447502 -0.44 0.661 -.10736 .0680577 2011 -.083846 .0447648 -1.87 0.061 -.1715833 .0038914 2010 -.0725175 .0447353 -1.62 0.105 -.1601972 .0151621 2009 -.0139601 .0447728 -0.31 0.755 -.1017132 .073793 2008 -.2600632 .044712 -5.82 0.000 -.3476972 -.1724292 survey
kk Coef. Std. Err. z P>|z| [95% Conf. Interval]
Log likelihood = -10113.186 Prob > chi2 = 0.0000 LR chi2(10) = 502.66 max = 7 avg = 7.0 Random effects u_i ~ Gaussian Obs per group: min = 7 Group vari able: PanelID Number of groups = 943 Random-effects ML regression Number of obs = 6601
①
②
③
= 0.930^2
④
= 0.970^2
②
56
補足
•
時点との交互作用のモデリングは等値制約を外すだけでOK
.(1), (2)
などを消す•
時点の主効果はIntercepts
をみればよい([k1-k7]
につい てはフリーにする)•
潜在変数のモデリングが可能•
測定誤差を考慮したモデルとなるため、変数間の相関が高くなる•
バランスデータである必要はない• FIML
で欠損のあるケースも含めて分析可能57
固定効果モデルの復習
y it = α t + β x it + γz i + u i + ε it
• α t
:時点ダミー、x it
は時間とともに変化する変数、z i
は時点とと もに変化しない変数、u i
は観察されない異質性、ε it
は誤差•
ランダム効果モデルとは異なり、観察されない異質性u i
は時間とともに変化する変数と相関を持つ
•
通常、時点とともに変化しない変数については推定されな い• xの変化が y
の変化に与える影響を推定58
x2 x1
x3
y2 y1
y3
e1
e2
e3
Cov (ui, x it ) ≠ 0
59[5]
誤差は 全て等しい[2] Z
からのパス は全て等しい[3] Xt
からのパスは全て等しい
SEM による固定効果 の推定
u
※ u
と時間とともに変化しない変数z
の相関は仮定しない[5]
平均と分散 は全て等しいz
[1]u
からのパスは すべて1
に固定Cov (ui, z i ) = 0
59
DATA:
FILE IS data3;
LISTWISE = ON;
VARIABLE:
NAMES ARE women eduy k1-k7 m1-m7 inc1-inc7;
USEVARIABLES ARE women eduy k1-k7 m1-m7 inc1-inc7;
MISSING IS ALL (999);
ANALYSIS: ESTIMATOR = ML;
MODEL:
u BY k1-k7@1;
k1 ON women(1) eduy(2) m1(3) inc1(4);
k2 ON women(1) eduy(2) m2(3) inc2(4);
k3 ON women(1) eduy(2) m3(3) inc3(4);
k4 ON women(1) eduy(2) m4(3) inc4(4);
k5 ON women(1) eduy(2) m5(3) inc5(4);
k6 ON women(1) eduy(2) m6(3) inc6(4);
k7 ON women(1) eduy(2) m7(3) inc7(4);
u with women@0 eduy@0;
!u with m1-m7@0 inc1-inc7@0 k1-k7@0; !コメントアウトすればFixed Effect、コメントアウトしなければRandom Effect k1-k7(5); m1-m7(6); inc1-inc7(7) ; [m1-m7](8); [inc1-inc7](9)
OUTPUT: SAMPSTAT STDYX;
[1] U
からのパスは全て1
に固定[3] Xt
からのパスは全て等しい[2] Z
からのパスは全て等しい[4]u
と時間とともに変化する変数Xt
との相関を認める[5]
従属変数の誤差分散、時点とと もに変化する変数の分散と平均は それぞれ時点間で等しい【 ex10 】
60
適合度を みる( FEM )
悪い
61Mplus の Output
②
①
①
•
特殊なハイブリッドモデル?• Within
効果の推定値については通常の固定効果モデルのものと一致
•
推定値の解釈については調査中62
Stata の Output
F test that all u_i=0: F(942, 5650) = 7.58 Prob > F = 0.0000 rho .57223426 (fraction of variance due to u_i)
sigma_e .96717864 sigma_u 1.1186407
_cons 3.110639 .2680078 11.61 0.000 2.58524 3.636037 lhinc .2461867 .0407609 6.04 0.000 .1662796 .3260938 satis .1690972 .021899 7.72 0.000 .1261666 .2120277 eduy 0 (omitted)
women 0 (omitted)
2013 -.0842115 .0445767 -1.89 0.059 -.1715988 .0031759 2012 -.0047578 .0446208 -0.11 0.915 -.0922317 .0827161 2011 -.0644991 .0446353 -1.45 0.149 -.1520014 .0230032 2010 -.0581284 .0446012 -1.30 0.193 -.1455639 .0293071 2009 .0049863 .0446412 0.11 0.911 -.0825276 .0925002 2008 -.2635482 .0445705 -5.91 0.000 -.3509235 -.1761729 survey
kk Coef. Std. Err. t P>|t| [95% Conf. Interval]
corr(u_i, Xb) = 0.3969 Prob > F = 0.0000 F(8,5650) = 21.07 overall = 0.2016 max = 7 between = 0.3895 avg = 7.0 R-sq: within = 0.0290 Obs per group: min = 7 Group variable: PanelID Number of groups = 943 Fixed-effects (within) regression Number of obs = 6601
63
応用編:一般パネルモデル( General Panel Model )への拡張
• Bollen and Brand (2010)
y it = B t x it + B t z i + λ t η i + ε it
x it
:時間とともに変化する変数z i
:時間とともに変化しない変数η i
:観察されない異質性(時間とともに変化しない)観察されない異質性の効果が時点とともに変化する
x
とz
の効果については時点との交互作用を考えればいいのかもし れない64
一般パネルモデルからみた REM と FEM
•
ランダム効果モデルy it = B y x x it + B y z z i + η i + ε it
z i
とη i
の両方がモデルに含まれる場合は相関は0
とする(ランダム効果、Cov
(z i, η i
)= 0
)•
固定効果モデルy it = B y x x it + η i + ε it
z i
がモデルに含まれないか、あるはB y z
が0
のときに固定効果モデルEjrnaes and Holm (2006)
は固定効果モデルとSEM
による推定量が一致し ないことを示したが、Allison (2009)
はそんなことはなく、両方法は常に同 一の結果を示すと主張する。65
補足
• REM
とFEM
の違いはCov (ui, xit) = 0
とするかしないかの違 い。つまり2
つのモデルは入れ子の関係。• Hausman
(1978
)はこのような相関の有無を、β fe – βre
を利 用して検定している(Halaby 2004: 527
)。• SEM
では、この仮定が正しいのかどうかをモデルの適合度 によって判断可能(結果はHausman
検定に近似)• u
とX
で相関がない所があれば、相関がないとした倹約的な モデルを作り再度推定し、適合度を改善する66
おすすめの方法
• SEM
による変数の指定はややこしい•
ミスが生じる可能性もある1. Stata
などでFEM
による推定2. Mplus
でもFEM
による推定を行い同一の結果を得る3.
理論的あるいはMI
を参考にして探索的に仮定を緩める67
なぜ SEM でわざわざ推定するのか?
•
潜在変数を用いることが出来る•
測定の誤差による変化と真の変化を分離可能e9
対応する変数の パスは等値
b1
a1 c1
e1 e2 e3
d1
e4
f1
a7 b7 c7
e5 E6 e7
d7
e8
f7
68