ANALYSIS: BOOTSTRAP = 10000

DATA: FILE IS data1.dat;

VARIABLE: NAMES ARE x1 x2 x3 y z u m o;

USEVARIABLES ARE x1-x3 y;

MODEL: x3 ON x1 x2;

y ON x2 x3;

MODEL INDIRECT:

y IND x3 x1;

y IND x3 x2;

OUTPUT: SAMPSTAT STDXY MODINDICES(ALL);

【 ex5_2 】

因子分析

DATA: FILE IS data2.dat;

VARIABLE: NAMES ARE x1 x2 x3 y z u m o a b c d;

USEVARIABLES ARE a b c d;

MODEL: f BY a b c d;

OUTPUT: SAMPSTAT STDXY MODINDICES(ALL);

a b c

e1 e2 e3

d

e4

f

a:

自分の考えを人に説明する

b:

よく知らない人と自然に会話する

c:

まわりの人をまとめてひっぱっていく

d:

面白いことを言って人を楽しませる

f:

コミュニケーション能力？

【 ex6 】

適合度の指標

• χ2

統計量

サンプルサイズに依存

• CFI

（

Comparative Fit Index

）

0.90~0.95 < CIF

• TLI

（

Tucker-Lewis Index

）

0.90 < TLI

• RMSEA

（

Root Mean Square Error Approximation

）

RMSEA < 0.05

• RMR

（

Root Mean Square Residual

）

RMR < 1.0

• SRMR

（

Standardized Root Mean Square Residual

）

SRMR < 0.08

• WRMR

（

Weight Root Mean Square Residual

）

WRMR < 1.0

• AIC, BIC, ABIC

値が小さいほど倹約的なモデル

適合度をみる

十分にあてはまりはよい

Mplus の Output と Diagram

因子分析と重回帰分析 (MIMIC Model)

DATA: FILE IS data2.dat;

VARIABLE: NAMES ARE x1 x2 x3 y z u m o a b c d;

USEVARIABLES ARE x1-x3 a b c d;

MODEL: f BY a b c d;

f ON x1-x3

OUTPUT: SAMPSTAT STDXY MODINDICES(ALL);

x2 x1

x3

b

a c

e1 e2 e3

d

e4

f

x1:

女性ダミー

x2:

年齢

x3:

教育年数

【 ex7 】

適合度をみる

十分にあてはまりはよい（

RMSEA

は改善できそうだが・・・）

Mplus の Output と Diagram

x1:

女性ダミー

x2:

年齢

x3:

教育年数

因子分析と重回帰分析

DATA: FILE IS data2.dat;

VARIABLE: NAMES ARE x1 x2 x3 y z u m o a b c d;

USEVARIABLES ARE x1-x6;

MODEL: f BY a b c d ; f ON x1-x3;

y ON f x3;

OUTPUT: SAMPSTAT STDXY MODINDICES(ALL);

x2 x3 y x1

b

a c

e1 e2 e3

d

e3

f

x1:

女性ダミー

x2:

年齢

x3:

教育年数

f:

コミュ力

y:

年収（対数）

【 ex8_1 】

適合度をみる

•

かなり悪い

修正指標（ Modification Indices, MI ）をみる

y ON x1 y ON x2

があったほうがよさそう

因子分析と

重回帰分析（修正）

DATA: FILE IS data2.dat;

VARIABLE: NAMES ARE x1 x2 x3 y z u m o a b c d;

USEVARIABLES ARE x1-x6;

MODEL: f BY a b c d ; f ON x1-x3;

y ON f x1-x3;

OUTPUT: SAMPSTAT STDXY MODINDICES(ALL);

x2 x3 y x1

a b c

e1 e2 e3

d

e4

f

【 ex8_2 】

再び、適合度をみる

修正指標（ Modification Indices, MI ）をみる

Mplus の Output

•

男性の方がコミュニケーション能力が高い

•

年齢が高いほうがコミュニケーション能力が高い

•

学歴が高いほうがコミュニケーション能力が高い

•

男性の方が年収が高い

•

年齢が高いほうが年収が高い

•

学歴が高いほうが年収が高い

•

コミュニケーション能力は個人年収に影響

SEM によるパネルデータ分析 1

固定効果とランダム効果

SEM による固定効果モデルとランダム効果モデル

•

固定効果モデル（

Fixed Effects Model

）とランダム効果モデル

（

Random Effects Model

）

•

経済学や社会学で最もよく用いられるパネルデータ分析モデル

• Halaby (2004: 520)

の指摘

“Many studies…ignore the issue of unobserved unit effects

altogether, or they recognize such effects but fail to assess and take steps to deal with their correlation with measured covariates.”

• Bollen and Brand (2010: 23)

の指摘

“Too often researchers apply FEM and REM without careful consideration as to why they should prefer one model over another.”

•

モデルがフィットしているのかどうか

• FEM

や

REM

ではモデル自体の適合度については触れられない

•

先行研究においていったいどれほどの論文の

FEM

や

REM

が良い適合度なのでしょう？（

Bollen and Brand 2011

）

ランダム効果モデルの復習

y ^it = α ^t + β x _it + γz ⁱ + u ⁱ + ε ^it

• α

^t：時点、x_itは時間とともに変化する変数、

z

ⁱは時点とともに変化しない変数、

u

ⁱは観察されない異質性、

ε

^itは誤差

•

観察されない異質性

u ⁱ

^は平均

⁰

で一定の分散を持ち、他の変数全ての変数と独立

•

特に、異質性

u ⁱ

^と

x _it

との相関が無いという仮定があるため、個人の異質性をコントロールしたうえでの

x _it

の効果が得られない可能性が大きい

•

時間不変の変数の効果をよほどみたいのでない限り、使用する必要はないかもしれない

•

他の要因をコントロールした上での、個人の異質性を取り出す上では有効（社会科学の関心ではない？）

SEM によるランダム効果モデル

x2 x1

x3

y2 y1

y3

u e1

e2

e3

Cov (ui, x ^it ) = 0

[5]

誤差は全て等しい

[1]u

からのパスはすべて

1

に固定

[3] Xt

からのパス

は全て等しい

z ^{[2] Z}

^{からのパス}

は全て等しい

[4]u

と他の変数との相関は

0 [5]

平均と分散

は全て等しい

Cov (ui, z ⁱ ) = 0

DATA:

FILE IS data3;

LISTWISE = ON;

VARIABLE:

NAMES ARE women eduy k1-k7 m1-m7 inc1-inc7;

USEVARIABLES ARE women eduy k1-k7 m1-m7 inc1-inc7;

MISSING IS ALL (999);

ANALYSIS: ESTIMATOR = ML;

MODEL:

u BY k1-k7@1;

k1 ON women(1) eduy(2) m1(3) inc1(4);

k2 ON women(1) eduy(2) m2(3) inc2(4);

k3 ON women(1) eduy(2) m3(3) inc3(4);

k4 ON women(1) eduy(2) m4(3) inc4(4);

k5 ON women(1) eduy(2) m5(3) inc5(4);

k6 ON women(1) eduy(2) m6(3) inc6(4);

k7 ON women(1) eduy(2) m7(3) inc7(4);

u with women@0 eduy@0;

u with m1-m7@0 inc1-inc7@0 k1-k7@0; !コメントアウトすればFixed Effect、コメントアウトしなければRandom Effect k1-k7(5); m1-m7(6); inc1-inc7(7) ; [m1-m7](8); [inc1-inc7](9)

OUTPUT: SAMPSTAT STDYX;

[1] U

からのパスは全て

1

に固定

[3] Xt

からのパスは全て等しい

[2] Z

からのパスは全て等しい

[4]u

と他の変数との相関は

0 [5]

従属変数の誤差分散、時点とともに変化する変数の分散と平均はそれぞれ時点間で等しい

【 ex9 】

適合度をみる（ REM ）

悪い

₅₄

Mplus の Output

②

③

④

①

Stata の Output

Likelihood-ratio test of sigma_u=0: chibar2(01)= 2109.07 Prob>=chibar2 = 0.000 rho .478703 .0149898 .4494078 .5081137 /sigma_e .9703458 .0091815 .9525162 .9885092 /sigma_u .9298588 .0257781 .8806827 .9817808 _cons -1.250455 .3404657 -3.67 0.000 -1.917755 -.583154 lhinc .4448161 .0362619 12.27 0.000 .3737441 .515888 satis .2619765 .0204502 12.81 0.000 .2218949 .3020582 eduy .1918945 .0183065 10.48 0.000 .1560145 .2277745 women -.0043399 .0662209 -0.07 0.948 -.1341304 .1254506

2013 -.0872664 .0447157 -1.95 0.051 -.1749076 .0003747 2012 -.0196511 .0447502 -0.44 0.661 -.10736 .0680577 2011 -.083846 .0447648 -1.87 0.061 -.1715833 .0038914 2010 -.0725175 .0447353 -1.62 0.105 -.1601972 .0151621 2009 -.0139601 .0447728 -0.31 0.755 -.1017132 .073793 2008 -.2600632 .044712 -5.82 0.000 -.3476972 -.1724292 survey

kk Coef. Std. Err. z P>|z| [95% Conf. Interval]

Log likelihood = -10113.186 Prob > chi2 = 0.0000 LR chi2(10) = 502.66 max = 7 avg = 7.0 Random effects u_i ~ Gaussian Obs per group: min = 7 Group vari able: PanelID Number of groups = 943 Random-effects ML regression Number of obs = 6601

①

②

③

= 0.930^2

④

= 0.970^2

②

補足

•

時点との交互作用のモデリングは等値制約を外すだけで

OK

．

(1), (2)

などを消す

•

時点の主効果は

Intercepts

をみればよい（

[k1-k7]

についてはフリーにする）

•

潜在変数のモデリングが可能

•

測定誤差を考慮したモデルとなるため、変数間の相関が高くなる

•

バランスデータである必要はない

• FIML

で欠損のあるケースも含めて分析可能

固定効果モデルの復習

y ^it = α ^t + β x _it + γz ⁱ + u ⁱ + ε ^it

• α ^t

^{：時点ダミー、}

x _it

は時間とともに変化する変数、

z ⁱ

は時点とともに変化しない変数、

u ⁱ

は観察されない異質性、

ε ^it

は誤差

•

ランダム効果モデルとは異なり、観察されない異質性

u ⁱ

^は

時間とともに変化する変数と相関を持つ

•

通常、時点とともに変化しない変数については推定されない

• xの変化が y

の変化に与える影響を推定

x2 x1

x3

y2 y1

y3

e1

e2

e3

Cov (ui, x ^it ) ≠ 0

⁵⁹

[5]

誤差は全て等しい

[2] Z

からのパスは全て等しい

[3] Xt

からのパス

は全て等しい

SEM による固定効果の推定

u

※ u

と時間とともに変化しない変数

z

の相関は仮定しない

[5]

平均と分散は全て等しい

z

[1]u

からのパスはすべて

1

に固定

Cov (ui, z ⁱ ) = 0

DATA:

FILE IS data3;

LISTWISE = ON;

VARIABLE:

NAMES ARE women eduy k1-k7 m1-m7 inc1-inc7;

USEVARIABLES ARE women eduy k1-k7 m1-m7 inc1-inc7;

MISSING IS ALL (999);

ANALYSIS: ESTIMATOR = ML;

MODEL:

u BY k1-k7@1;

k1 ON women(1) eduy(2) m1(3) inc1(4);

k2 ON women(1) eduy(2) m2(3) inc2(4);

k3 ON women(1) eduy(2) m3(3) inc3(4);

k4 ON women(1) eduy(2) m4(3) inc4(4);

k5 ON women(1) eduy(2) m5(3) inc5(4);

k6 ON women(1) eduy(2) m6(3) inc6(4);

k7 ON women(1) eduy(2) m7(3) inc7(4);

u with women@0 eduy@0;

!u with m1-m7@0 inc1-inc7@0 k1-k7@0; !コメントアウトすればFixed Effect、コメントアウトしなければRandom Effect k1-k7(5); m1-m7(6); inc1-inc7(7) ; [m1-m7](8); [inc1-inc7](9)

OUTPUT: SAMPSTAT STDYX;

[1] U

からのパスは全て

1

に固定

[3] Xt

からのパスは全て等しい

[2] Z

からのパスは全て等しい

[4]u

と時間とともに変化する変数

Xt

との相関を認める

[5]

従属変数の誤差分散、時点とともに変化する変数の分散と平均はそれぞれ時点間で等しい

【 ex10 】

適合度をみる（ FEM ）

悪い

₆₁

Mplus の Output

②

①

•

特殊なハイブリッドモデル？

• Within

効果の推定値については通常

の固定効果モデルのものと一致

•

推定値の解釈については調査中

Stata の Output

F test that all u_i=0: F(942, 5650) = 7.58 Prob > F = 0.0000 rho .57223426 (fraction of variance due to u_i)

sigma_e .96717864 sigma_u 1.1186407

_cons 3.110639 .2680078 11.61 0.000 2.58524 3.636037 lhinc .2461867 .0407609 6.04 0.000 .1662796 .3260938 satis .1690972 .021899 7.72 0.000 .1261666 .2120277 eduy 0 (omitted)

women 0 (omitted)

2013 -.0842115 .0445767 -1.89 0.059 -.1715988 .0031759 2012 -.0047578 .0446208 -0.11 0.915 -.0922317 .0827161 2011 -.0644991 .0446353 -1.45 0.149 -.1520014 .0230032 2010 -.0581284 .0446012 -1.30 0.193 -.1455639 .0293071 2009 .0049863 .0446412 0.11 0.911 -.0825276 .0925002 2008 -.2635482 .0445705 -5.91 0.000 -.3509235 -.1761729 survey

kk Coef. Std. Err. t P>|t| [95% Conf. Interval]

corr(u_i, Xb) = 0.3969 Prob > F = 0.0000 F(8,5650) = 21.07 overall = 0.2016 max = 7 between = 0.3895 avg = 7.0 R-sq: within = 0.0290 Obs per group: min = 7 Group variable: PanelID Number of groups = 943 Fixed-effects (within) regression Number of obs = 6601

応用編：一般パネルモデル（ General Panel Model ）への拡張

• Bollen and Brand (2010)

y ^it = B _t x _it + B _t z ⁱ + λ ^t η ⁱ + ε ^it

x _it

：時間とともに変化する変数

z ⁱ

^：時間とともに変化しない変数

η ⁱ

^：観察されない異質性（時間とともに変化しない）

観察されない異質性の効果が時点とともに変化する

x

と

z

の効果については時点との交互作用を考えればいいのかもしれない

一般パネルモデルからみた REM と FEM

•

ランダム効果モデル

y ^it = B _y x x _it + B _y _z z ⁱ + η ⁱ + ε ^it

z ⁱ

^と

η ⁱ

の両方がモデルに含まれる場合は相関は

0

とする（ランダム効果、

Cov

（

z ^i, η ⁱ

^）

^{= 0}

^）

•

固定効果モデル

y ^it = B _y x x _it + η ⁱ + ε ^it

z ⁱ

がモデルに含まれないか、あるは

B _y _z

が

0

のときに固定効果モデル

Ejrnaes and Holm (2006)

は固定効果モデルと

SEM

による推定量が一致しないことを示したが、

Allison (2009)

はそんなことはなく、両方法は常に同一の結果を示すと主張する。

補足

• REM

と

FEM

の違いは

Cov (ui, xit) = 0

とするかしないかの違い。つまり

2

つのモデルは入れ子の関係。

• Hausman

（

1978

）はこのような相関の有無を、

β fe – βre

を利用して検定している（

Halaby 2004: 527

）。

• SEM

では、この仮定が正しいのかどうかをモデルの適合度によって判断可能（結果は

Hausman

検定に近似）

• u

と

X

で相関がない所があれば、相関がないとした倹約的なモデルを作り再度推定し、適合度を改善する

DATA: FILE IS data1.dat;

VARIABLE: NAMES ARE x1 x2 x3 y z u m o;

USEVARIABLES ARE x1-x3 y;

MODEL: x3 ON x1 x2;

y ON x2 x3;

MODEL INDIRECT:

y IND x3 x1;

y IND x3 x2;

OUTPUT: SAMPSTAT STDXY MODINDICES(ALL);

【 ex5_2 】

因子分析

DATA: FILE IS data2.dat;

VARIABLE: NAMES ARE x1 x2 x3 y z u m o a b c d;

USEVARIABLES ARE a b c d;

MODEL: f BY a b c d;

OUTPUT: SAMPSTAT STDXY MODINDICES(ALL);

a b c

e1 e2 e3

d

e4

f

a:

b:

c:

d:

f:

【 ex6 】

適合度の指標

• χ2

• CFI

Comparative Fit Index

0.90~0.95 < CIF

• TLI

Tucker-Lewis Index

0.90 < TLI

• RMSEA

Root Mean Square Error Approximation

RMSEA < 0.05

• RMR

Root Mean Square Residual

RMR < 1.0

• SRMR

Standardized Root Mean Square Residual

SRMR < 0.08

• WRMR

Weight Root Mean Square Residual

WRMR < 1.0

• AIC, BIC, ABIC

適合度をみる

Mplus の Output と Diagram

因子分析と重回帰分析 (MIMIC Model)

DATA: FILE IS data2.dat;

VARIABLE: NAMES ARE x1 x2 x3 y z u m o a b c d;

USEVARIABLES ARE x1-x3 a b c d;

MODEL: f BY a b c d;

f ON x1-x3

OUTPUT: SAMPSTAT STDXY MODINDICES(ALL);

x2 x1

x3

b

a c

e1 e2 e3

d

e4

f

x1:

x2:

x3:

【 ex7 】

適合度をみる

RMSEA

Mplus の Output と Diagram

x1:

x2:

x3:

因子分析と 重回帰分析

DATA: FILE IS data2.dat;

VARIABLE: NAMES ARE x1 x2 x3 y z u m o a b c d;

USEVARIABLES ARE x1-x6;

因子分析と重回帰分析

修正指標（ Modification Indices, MI ）をみる

修正指標（ Modification Indices, MI ）をみる

SEM による固定効果モデルとランダム効果モデル

y ^it = α ^t + β x _it + γz ⁱ + u ⁱ + ε ^it