• 検索結果がありません。

ANALYSIS: BOOTSTRAP = 10000

ドキュメント内 Mplus SHO FUJIHARA'S PAGE (ページ 34-69)

DATA: FILE IS data1.dat;

VARIABLE: NAMES ARE x1 x2 x3 y z u m o;

USEVARIABLES ARE x1-x3 y;

MODEL: x3 ON x1 x2;

y ON x2 x3;

MODEL INDIRECT:

y IND x3 x1;

y IND x3 x2;

OUTPUT: SAMPSTAT STDXY MODINDICES(ALL);

【 ex5_2 】

34

因子分析

DATA: FILE IS data2.dat;

VARIABLE: NAMES ARE x1 x2 x3 y z u m o a b c d;

USEVARIABLES ARE a b c d;

MODEL: f BY a b c d;

OUTPUT: SAMPSTAT STDXY MODINDICES(ALL);

a b c

e1 e2 e3

d

e4

f

a:

自分の考えを人に説明する

b:

よく知らない人と自然に会話する

c:

まわりの人をまとめてひっぱっていく

d:

面白いことを言って人を楽しませる

f:

コミュニケーション能力?

【 ex6 】

35

適合度の指標

• χ2

統計量

サンプルサイズに依存

• CFI

Comparative Fit Index

0.90~0.95 < CIF

• TLI

Tucker-Lewis Index

0.90 < TLI

• RMSEA

Root Mean Square Error Approximation

RMSEA < 0.05

• RMR

Root Mean Square Residual

RMR < 1.0

• SRMR

Standardized Root Mean Square Residual

SRMR < 0.08

• WRMR

Weight Root Mean Square Residual

WRMR < 1.0

• AIC, BIC, ABIC

値が小さいほど倹約的なモデル

36

適合度をみる

十分にあてはまりはよい

37

Mplus の Output と Diagram

38

因子分析と重回帰分析 (MIMIC Model)

DATA: FILE IS data2.dat;

VARIABLE: NAMES ARE x1 x2 x3 y z u m o a b c d;

USEVARIABLES ARE x1-x3 a b c d;

MODEL: f BY a b c d;

f ON x1-x3

OUTPUT: SAMPSTAT STDXY MODINDICES(ALL);

x2 x1

x3

b

a c

e1 e2 e3

d

e4

f

x1:

女性ダミー

x2:

年齢

x3:

教育年数

【 ex7 】

39

適合度をみる

十分にあてはまりはよい(

RMSEA

は改善できそうだが・・・)

40

Mplus の Output と Diagram

x1:

女性ダミー

x2:

年齢

x3:

教育年数

41

因子分析と 重回帰分析

DATA: FILE IS data2.dat;

VARIABLE: NAMES ARE x1 x2 x3 y z u m o a b c d;

USEVARIABLES ARE x1-x6;

MODEL: f BY a b c d ; f ON x1-x3;

y ON f x3;

OUTPUT: SAMPSTAT STDXY MODINDICES(ALL);

x2 x3 y x1

b

a c

e1 e2 e3

d

e3

f

x1:

女性ダミー

x2:

年齢

x3:

教育年数

f:

コミュ力

y:

年収(対数)

【 ex8_1 】

42

適合度をみる

かなり悪い

43

修正指標 ( Modification Indices, MI )をみる

y ON x1 y ON x2

があったほうがよさそう

44

因子分析と

重回帰分析(修正)

DATA: FILE IS data2.dat;

VARIABLE: NAMES ARE x1 x2 x3 y z u m o a b c d;

USEVARIABLES ARE x1-x6;

MODEL: f BY a b c d ; f ON x1-x3;

y ON f x1-x3;

OUTPUT: SAMPSTAT STDXY MODINDICES(ALL);

x2 x3 y x1

a b c

e1 e2 e3

d

e4

f

【 ex8_2 】

45

再び、適合度をみる

46

修正指標 ( Modification Indices, MI )をみる

47

Mplus の Output

男性の方がコミュニケーション 能力が高い

年齢が高いほうがコミュニケー ション能力が高い

学歴が高いほうがコミュニケー ション能力が高い

男性の方が年収が高い

年齢が高いほうが年収が高い

学歴が高いほうが年収が高い

コミュニケーション能力は個人 年収に影響

48

SEM によるパネルデータ分析 1

固定効果とランダム効果

49

SEM による固定効果モデルとランダム効果 モデル

固定効果モデル(

Fixed Effects Model

)とランダム効果モデル

Random Effects Model

経済学や社会学で最もよく用いられるパネルデータ分析モデル

• Halaby (2004: 520)

の指摘

“Many studies…ignore the issue of unobserved unit effects

altogether, or they recognize such effects but fail to assess and take steps to deal with their correlation with measured covariates.”

• Bollen and Brand (2010: 23)

の指摘

“Too often researchers apply FEM and REM without careful consideration as to why they should prefer one model over another.”

モデルがフィットしているのかどうか

• FEM

REM

ではモデル自体の適合度については触れられない

先行研究においていったいどれほどの論文の

FEM

REM

が良い適合度な のでしょう?(

Bollen and Brand 2011

50

ランダム効果モデルの復習

y it = α t + β x it + γz i + u i + ε it

• α

t:時点、xitは時間とともに変化する変数、

z

iは時点とともに変化しない 変数、

u

iは観察されない異質性、

ε

itは誤差

観察されない異質性

u i

は平均

0

で一定の分散を持ち、他の変数全ての 変数と独立

特に、異質性

u i

x it

との相関が無いという仮定があるため、個人の異質性をコント ロールしたうえでの

x it

の効果が得られない可能性が大きい

時間不変の変数の効果をよほどみたいのでない限り、使用する必要はないか もしれない

他の要因をコントロールした上での、個人の異質性を取り出す上では有効(社 会科学の関心ではない?)

51

SEM によるランダム効果モデル

x2 x1

x3

y2 y1

y3

u e1

e2

e3

Cov (ui, x it ) = 0

[5]

誤差は 全て等しい

[1]u

からのパスは すべて

1

に固定

[3] Xt

からのパス

は全て等しい

z [2] Z

からのパス

は全て等しい

[4]u

と他の変数 との相関は

0 [5]

平均と分散

は全て等しい

Cov (ui, z i ) = 0

52

DATA:

FILE IS data3;

LISTWISE = ON;

VARIABLE:

NAMES ARE women eduy k1-k7 m1-m7 inc1-inc7;

USEVARIABLES ARE women eduy k1-k7 m1-m7 inc1-inc7;

MISSING IS ALL (999);

ANALYSIS: ESTIMATOR = ML;

MODEL:

u BY k1-k7@1;

k1 ON women(1) eduy(2) m1(3) inc1(4);

k2 ON women(1) eduy(2) m2(3) inc2(4);

k3 ON women(1) eduy(2) m3(3) inc3(4);

k4 ON women(1) eduy(2) m4(3) inc4(4);

k5 ON women(1) eduy(2) m5(3) inc5(4);

k6 ON women(1) eduy(2) m6(3) inc6(4);

k7 ON women(1) eduy(2) m7(3) inc7(4);

u with women@0 eduy@0;

u with m1-m7@0 inc1-inc7@0 k1-k7@0; !コメントアウトすればFixed Effect、コメントアウトしなければRandom Effect k1-k7(5); m1-m7(6); inc1-inc7(7) ; [m1-m7](8); [inc1-inc7](9)

OUTPUT: SAMPSTAT STDYX;

[1] U

からのパスは全て

1

に固定

[3] Xt

からのパスは全て等しい

[2] Z

からのパスは全て等しい

[4]u

と他の変数との相関は

0

[5]

従属変数の誤差分散、時点とと もに変化する変数の分散と平均は それぞれ時点間で等しい

【 ex9 】

53

適合度を みる( REM )

悪い

54

Mplus の Output

55

Stata の Output

Likelihood-ratio test of sigma_u=0: chibar2(01)= 2109.07 Prob>=chibar2 = 0.000 rho .478703 .0149898 .4494078 .5081137 /sigma_e .9703458 .0091815 .9525162 .9885092 /sigma_u .9298588 .0257781 .8806827 .9817808 _cons -1.250455 .3404657 -3.67 0.000 -1.917755 -.583154 lhinc .4448161 .0362619 12.27 0.000 .3737441 .515888 satis .2619765 .0204502 12.81 0.000 .2218949 .3020582 eduy .1918945 .0183065 10.48 0.000 .1560145 .2277745 women -.0043399 .0662209 -0.07 0.948 -.1341304 .1254506

2013 -.0872664 .0447157 -1.95 0.051 -.1749076 .0003747 2012 -.0196511 .0447502 -0.44 0.661 -.10736 .0680577 2011 -.083846 .0447648 -1.87 0.061 -.1715833 .0038914 2010 -.0725175 .0447353 -1.62 0.105 -.1601972 .0151621 2009 -.0139601 .0447728 -0.31 0.755 -.1017132 .073793 2008 -.2600632 .044712 -5.82 0.000 -.3476972 -.1724292 survey

kk Coef. Std. Err. z P>|z| [95% Conf. Interval]

Log likelihood = -10113.186 Prob > chi2 = 0.0000 LR chi2(10) = 502.66 max = 7 avg = 7.0 Random effects u_i ~ Gaussian Obs per group: min = 7 Group vari able: PanelID Number of groups = 943 Random-effects ML regression Number of obs = 6601

= 0.930^2

= 0.970^2

56

補足

時点との交互作用のモデリングは等値制約を外すだけで

OK

(1), (2)

などを消す

時点の主効果は

Intercepts

をみればよい(

[k1-k7]

につい てはフリーにする)

潜在変数のモデリングが可能

測定誤差を考慮したモデルとなるため、変数間の相関が高くなる

バランスデータである必要はない

• FIML

で欠損のあるケースも含めて分析可能

57

固定効果モデルの復習

y it = α t + β x it + γz i + u i + ε it

• α t

:時点ダミー、

x it

は時間とともに変化する変数、

z i

は時点とと もに変化しない変数、

u i

は観察されない異質性、

ε it

は誤差

ランダム効果モデルとは異なり、観察されない異質性

u i

時間とともに変化する変数と相関を持つ

通常、時点とともに変化しない変数については推定されな い

xの変化が y

の変化に与える影響を推定

58

x2 x1

x3

y2 y1

y3

e1

e2

e3

Cov (ui, x it ) ≠ 0

59

[5]

誤差は 全て等しい

[2] Z

からのパス は全て等しい

[3] Xt

からのパス

は全て等しい

SEM による固定効果 の推定

u

※ u

と時間とともに変化しない変数

z

の相関は仮定しない

[5]

平均と分散 は全て等しい

z

[1]u

からのパスは すべて

1

に固定

Cov (ui, z i ) = 0

59

DATA:

FILE IS data3;

LISTWISE = ON;

VARIABLE:

NAMES ARE women eduy k1-k7 m1-m7 inc1-inc7;

USEVARIABLES ARE women eduy k1-k7 m1-m7 inc1-inc7;

MISSING IS ALL (999);

ANALYSIS: ESTIMATOR = ML;

MODEL:

u BY k1-k7@1;

k1 ON women(1) eduy(2) m1(3) inc1(4);

k2 ON women(1) eduy(2) m2(3) inc2(4);

k3 ON women(1) eduy(2) m3(3) inc3(4);

k4 ON women(1) eduy(2) m4(3) inc4(4);

k5 ON women(1) eduy(2) m5(3) inc5(4);

k6 ON women(1) eduy(2) m6(3) inc6(4);

k7 ON women(1) eduy(2) m7(3) inc7(4);

u with women@0 eduy@0;

!u with m1-m7@0 inc1-inc7@0 k1-k7@0; !コメントアウトすればFixed Effect、コメントアウトしなければRandom Effect k1-k7(5); m1-m7(6); inc1-inc7(7) ; [m1-m7](8); [inc1-inc7](9)

OUTPUT: SAMPSTAT STDYX;

[1] U

からのパスは全て

1

に固定

[3] Xt

からのパスは全て等しい

[2] Z

からのパスは全て等しい

[4]u

と時間とともに変化する変数

Xt

との相関を認める

[5]

従属変数の誤差分散、時点とと もに変化する変数の分散と平均は それぞれ時点間で等しい

【 ex10 】

60

適合度を みる( FEM )

悪い

61

Mplus の Output

特殊なハイブリッドモデル?

• Within

効果の推定値については通常

の固定効果モデルのものと一致

推定値の解釈については調査中

62

Stata の Output

F test that all u_i=0: F(942, 5650) = 7.58 Prob > F = 0.0000 rho .57223426 (fraction of variance due to u_i)

sigma_e .96717864 sigma_u 1.1186407

_cons 3.110639 .2680078 11.61 0.000 2.58524 3.636037 lhinc .2461867 .0407609 6.04 0.000 .1662796 .3260938 satis .1690972 .021899 7.72 0.000 .1261666 .2120277 eduy 0 (omitted)

women 0 (omitted)

2013 -.0842115 .0445767 -1.89 0.059 -.1715988 .0031759 2012 -.0047578 .0446208 -0.11 0.915 -.0922317 .0827161 2011 -.0644991 .0446353 -1.45 0.149 -.1520014 .0230032 2010 -.0581284 .0446012 -1.30 0.193 -.1455639 .0293071 2009 .0049863 .0446412 0.11 0.911 -.0825276 .0925002 2008 -.2635482 .0445705 -5.91 0.000 -.3509235 -.1761729 survey

kk Coef. Std. Err. t P>|t| [95% Conf. Interval]

corr(u_i, Xb) = 0.3969 Prob > F = 0.0000 F(8,5650) = 21.07 overall = 0.2016 max = 7 between = 0.3895 avg = 7.0 R-sq: within = 0.0290 Obs per group: min = 7 Group variable: PanelID Number of groups = 943 Fixed-effects (within) regression Number of obs = 6601

63

応用編:一般パネルモデル( General Panel Model )への拡張

• Bollen and Brand (2010)

y it = B t x it + B t z i + λ t η i + ε it

x it

時間とともに変化する変数

z i

時間とともに変化しない変数

η i

観察されない異質性(時間とともに変化しない)

観察されない異質性の効果が時点とともに変化する

x

z

の効果については時点との交互作用を考えればいいのかもし れない

64

一般パネルモデルからみた REM と FEM

ランダム効果モデル

y it = B y x x it + B y z z i + η i + ε it

z i

η i

の両方がモデルに含まれる場合は相関は

0

とする(ランダム効果、

Cov

z i, η i

= 0

固定効果モデル

y it = B y x x it + η i + ε it

z i

がモデルに含まれないか、あるは

B y z

0

のときに固定効果モデル

Ejrnaes and Holm (2006)

は固定効果モデルと

SEM

による推定量が一致し ないことを示したが、

Allison (2009)

はそんなことはなく、両方法は常に同 一の結果を示すと主張する。

65

補足

• REM

FEM

の違いは

Cov (ui, xit) = 0

とするかしないかの違 い。つまり

2

つのモデルは入れ子の関係。

• Hausman

1978

)はこのような相関の有無を、

β fe – βre

を利 用して検定している(

Halaby 2004: 527

)。

• SEM

では、この仮定が正しいのかどうかをモデルの適合度 によって判断可能(結果は

Hausman

検定に近似)

• u

X

で相関がない所があれば、相関がないとした倹約的な モデルを作り再度推定し、適合度を改善する

66

おすすめの方法

• SEM

による変数の指定はややこしい

ミスが生じる可能性もある

1. Stata

などで

FEM

による推定

2. Mplus

でも

FEM

による推定を行い同一の結果を得る

3.

理論的あるいは

MI

を参考にして探索的に仮定を緩める

67

なぜ SEM でわざわざ推定するのか?

潜在変数を用いることが出来る

測定の誤差による変化と真の変化を分離可能

e9

対応する変数の パスは等値

b1

a1 c1

e1 e2 e3

d1

e4

f1

a7 b7 c7

e5 E6 e7

d7

e8

f7

68

弱測定不変モデル( 2 時点)

DATA: FILE IS data4.dat;

VARIABLE: NAMES ARE a1 b1 c1 d1 a7 b7 c7 d7;

USEVARIABLES ARE a1 b1 c1 d1 a7 b7 c7 d7;

ドキュメント内 Mplus SHO FUJIHARA'S PAGE (ページ 34-69)

関連したドキュメント