• 検索結果がありません。

  :  ~il[:l{l1{_lJ

N/A
N/A
Protected

Academic year: 2021

シェア "  :  ~il[:l{l1{_lJ "

Copied!
42
0
0

読み込み中.... (全文を見る)

全文

(1)

JoreskogとSorbomによるコンピュータ・プログラム と構造方程式モデル

その他のタイトル Computer Programs Developed by Joreskog and Sorbom, and Structural Equation Models

著者 清水 和秋

雑誌名 関西大学社会学部紀要

25

3

ページ 1‑41

発行年 1994‑03‑31

URL http://hdl.handle.net/10112/13345

(2)

関西大学「社会学部紀要」第25巻第3 1994, pp.  141  ISSN 02876817 

Joreskog Sorbomによるコンピュータ・

プログラムと構造方程式モデル

Computer Programs Developed by Joreskog and Sorbom,  and Structural Equation Models 

Kazuaki SHIMIZU 

Abstract 

Karl  G.  Joreskog and  Dag  Sorbom have developed  the  following  three  theoretical  features and  computer programs  for  structural  equation  models:  factor analysis  models  (COFAMM),  covariance  structure analysis  models  (ACOVS),  and  causal  analysis models  (LISREU.  Until  COFAMM had  been  integrated  into  the  fourth  version  of  LISREL at  1978,  these  three  kinds  of  computer programs  had been used  independently  in  the  research  fields  of psycho logy and  socio logy.  In  1989 the  seventh version of LIS REL  was  extended  for use  in  generalized  structural  equation・models, especially  for multi‑sample problems.  The newest version of LISREL presents  a useful  man‑machine  interface using  the  Windows  format  of  personal  computer  software.  RAM by Jack  McArdle  is  also mentioned as  a generalized  notation  method  for  structural  equation models  in  the  relations  of  LISREL. 

Key words: structural equation model, LISREL, computer program,  factorial  invariance,  structured means analysis, multiple  sample  analysis,  goodness  of  fit  index,  asymptotically distributionfree 

抄 録

Karl G. JoreskogDagSorbomは,構造方程式モデルに関する3つの側面の次のような理論 とコンピュータ・プログラムを開発してきた。それらは,因子分析モデル (COFAMM),共分散構造分 (ACOVS)そして因果分析モデル(LISREL)である。これら3種類のプログラムは, COFAMM LISRELに統合される1978年まで,心理学と社会学の研究分野において,独立して使用されてき LISRELの第7 (1989)は,一般的な構造方程式モデル(特に多標本問題)へと拡張された。

LISRELの最新版は, パソコンの Windowsのもとで,有用なマン・マシーン・インタフェースを 提供している。 JackMcArdleによる RAM LISRELとの関係のなかで,一般的な構造方程式 モデルの記述方法としても言及した。

キーワード:構造方程式モデル, LISREL,コンピュータ・プログラム, 因子的不変性,構造平均分 析,多標本分析,適合性指標,漸近分布自由

‑ 1 ‑

(3)

関西大学「社会学部紀要」第25巻第3

は じ め に

構造方程式モデル (structuralequation  models), デーク解析の新しい方法論としての 地位を確立してきた (Bentler,1980,  1986; Mulaik, 1986)。たとえば, Fornell(1982) 潜在変数 (latentvariables)と構造方程式とからなるモデルとプログラムとを, 第2世代の多 変量解析と呼んで,この分野での先駆的な諸論文を集録している。 Jackson& Borgatta (1981)  は,因子分析モデルを測定方程式として取り扱う諸論文を編集している。 Nesselroade& Cattell  (1988)による "Handbookof Multivariate Experimental Psychology"の第2版は,初版 (1966)以後において展開されてきた構造方程式モデルの理論的研究と実証的応用研究とに多く の章を割り当てている。このような動向は,生涯発達研究の分野においても顕著である (Alwin, 1988 ; Hertzog, 1990 ; Meredith, 1991 ; など)。 Collins& Horn (1991)vonEye (1990)  の多くの掲載論文に見られるように,構造方程式モデルは,発達心理学のデーク解析手法として の地位を確立してきている。

この構造方程式モデルを適用することのできるデークの種類は多様である。 1つの標本だけか らなるデークは当然として,横断的データ,縦断的デーク,不完全データなど,この方法論の適用 範囲は広い(たとえば, Allison,1987 ; Magnusson, Bergman, Rudinger & Torestad, 1991 ;  Rovine & von Eye, 1991)。 この方法の魅力を簡潔に要約すると次のようになろう。 1)構成概 念間の関係を,デーク解析者が自己の仮説的モデルとして記述することができる。 2)伝統的な多 変量分析にはなかった仮説的モデルの統計的検定が可能である。 3)構成概念間の因果的関係を検 証することができる。 4)測定の等価性を検証することができる(複数の標本における因子的不変 性の検証を含む)。そして, 5)非連続的な変数においても, 1)から4)をおこなうことができる,

などである。

課題・問題点は,次のようになろう。 1)行列代数の初歩的な知識が必要である。 2)少なくとも 100, 望ましくは200を越える標本が必要である(非連続的変数ではもっと多くの標本が必要とな 3)標本数が多くなると,仮説的モデルは棄却されやすい。(デークの分布状態と適合度判定 に関しては,多数の指標が提案されている)。そして, 4)最適な結論を下すまでのモデル修正の 作業に時間を費やさなければならない,ことなどである。

本稿では,まず,共分散構造とその解析の特徴を簡単に紹介する。そして,構造方程式モデル とそのコンビュータ・プログラムの発展の歴史を, JoreskogSorbomの仕事を中心として 検討する。最後に,構造方程式モデル解析のためのコンビュータ・ソフトの条件を考察する。

(4)

JoreskogSorbomによるコンピューク・プログラムと構造方程式モデル(清水)

1.  共分散構造とその解析

ここでは,構造方程式モデル解析の基礎を理解するために必要となるいくつかのポイントを整 理する。ここでの展開で参考にしたテキストを整理すると,まず,最も詳細にこの方法を展開し ているのがBollen(1989a)である。 Hayduk(1987) LISRELの第VI版を中心とした詳細な 解説をしている。入門者用のテキストとしては, Everitt(1984)が簡潔である。 Loehlin(1987) 

は,探索的な分析手法にも言及している。 LISRELの解説書には,理論とプログラム例に加え 733篇の文献がリストされている (Joreskog& Sorbom, 1989a)。日本語の文献としては,豊 田 (1992) が最も詳細で,例題も豊富である。柳井・繁桝•前川・市川 (1990) は,因子分析を 中心としながらも,共分散構造分析を解説する章ももうけている。芝・渡部・石塚 (1984)には 関連する用語の適切な説明がある。そして, 白倉 (1991) SPSSX LISRELVI版の解 説書であるが,詳細に数理的展開もおこなっている。

1. 1.  共分散構造の表現としてのモデル

共分散構造 (covariancestructure)とは,共分散(あるいは相関)行列の要素が,あるモデ ルによる母数 (parameters)の関数として表現される場合に,使用される統計学の用語である。

まず,観測した変数の母集団共分散行列が存在すると仮定し, この母集団共分散行列を 2と表 す。そして,これは,母数 0からなるある関数によって,

:E=:E(fJ)  (1) 

と表現することができる,と仮定する。ここで,このZ(fJ) {J'=(81, .. ,8,)によって構成され る。なお,母集団相関行列を Pと母集団標準偏差からなる対角行列を D,,.とすると,

Z=D,,.P(fJ)D,,. 

とも表すことができる (Joreskog,1978)

1. 2.  母数行列と識別

この母数の内容を検討するために,因子分析モデルを説明に使用する。なお,ここでは,この 因子分析モデルが,変量モデル (randommodel)であることを強調するために,以下の表記法 を採用する (Lord& Novick, 1968)

まず,観測変数を確率ベクトル x'=(x1,Xq),  とすると,因子分析モデルは,次のように表 すことができる。

エ=ち+A.,,e+a c2) 

こ こ で , ら は q個の観測変数の平均(あるいは期待値)からなるベクトルであり, A.,,は (q

‑ 3 ‑

(5)

関西大学『社会学部紀要』第25巻第3

Xn)次の因子パクーン行列であり, 8は因子得点ベクトル (n次)であり, そして, 0 は独自 因子得点ベクトル (q次)である。次に,一般的な仮定として,

ECe) =0,  E(lJ) =0, 

Cov(e, lJ) =0,  E(峠')=0, E(lJlJ') =9a  を導入すると,この場合の共分散行列は

~=E[(エーち)(xi.,)'] 

=A..,<.DA..,'+9a  (3)  と表すことができる。なお, 0は,因子得点の分散・共分散からなる対称行列である。そして,

8aは,独自因子分散を対角項にもつ対角行列である。

次に, この展開をよりわかりやすくするために,行列の要素でこれらの関係を示すことにす る。ただし,簡潔に展開するために,変数の数を4,因子の数を2とした単純構造の因子パクー ン行列を想定する。すると, (2)式は,

8 1

8 2

8 3

8 4

 

f+ 

̀

も~ら'

̲ 9

0 0 0 0 '

+ 

 

m

︱ ︱ 

 

X s

I ,  

(2') 

と表すこともできる。これより (3)式による観測変数の共分散行列は,

881  0  0  0 

1

);'':, :

:J+f 。~

0 ·~.. ~. 0  0 834 

~l

1¢ /̲し︑

̀ J  

z s  

0 0 A A   0 0

f .

︱ ︱ 

.

+ 

︐ ^ 2  

 

8 4   a u z  

, ^  

+¢ 3 3   2 N N  

i

,^ 

3 4  

^O   O N N

, ^ ︐ ^  

 

2 N N  

入 ぅ ^ ︐

2 3 4   N N S  

, ^

︐ ^ ︐ ^  

 

+ 

1 1 1   2 N Z z  

A

A

, .

︱ ︱  

 

(4) 

と表すことができる。この (4)式は,共通因子分析の基本モデル式による共分散構造の定義であ る。すなわち,共分散行列の各要素は, 9個の母数からなる10個の方程式で表すことができたわ けである。

標本共分散行列から, この母数すなわち, fJ'=0,,1,伍,伍, J.,,4,, 081,  082,  083,  084)を推定 することが,次の問題となるわけである。しかし,もし,母数の数が,共分散行列の要素の方程 式の個数よりも,多い場合には,このような方程式を解くことはできない。すなわち,識別でき ないことになる。 この例では, あきらかに(母数の数)く(個々の要素の方程式の数)であるか ら,識別可能 (identifiable)といえる。なお, 因子パターン行列のすべての要素を推定する伝 統的な探索的因子分析の場合には,ある種の制約条件を置くことによって,この識別を可能とし

‑ 4 ‑

(6)

JoreskogSorbomによるコンピュータ・プログラムと構造方程式モデル(清水)

ている(丘本, 1986;柳井他, 1990)

ここでの識別では, (3)式の場合, A.,,,0, そして8aを母数行列として, (tXl)次のベクトル fJ=vec(A.,,, 0, 88)の次数が問題となる。この場合の識別を可能とするための必要条件は, 母数 の数 tと観測変数の数 qとの間に

t~ q(q+l) 

という関係が成り立つことである(たとえば, Ji:ireskog& Si:irbom,  1989a)

(5) 

この識別問題は, もっと複雑なモデルになると事態は混沌としてくる。 Ji:ireskogたちが勧め る方法は,利用者が仮説的モデルにおいて特定した母数が識別可能かどうかを,実際にプログラ ムにかけてチェックするというものである。なお,この問題の理論的な展開は, Bollen(1989a) 

や豊田 (1992)が詳しい。

この母数行列の基本的構成は, (2)式の方程式によって,そしてこの方程式における潜在変数 に与えた条件によって,決まる。この(2)式のモデルを利用しようとするものは,この母数行列 の各要素において,各自の仮説的なモデルを記述することになる。たとえば(2')式も 1つの仮説 の表現である。さらに, たとえば, 伍と伍との値を等しいとの仮説を設定することもでき る。このように,共分散構造は,母数行列の各要素を,ゼロあるいは1のような特定の値を割り 当てる固定パラメータ (fixedparameters), 値としては推定をおこなうが,複数の要素間に等

しいなどの条件を挿入することのできる拘束バラメーク (constrainedparameters), そして未 知として,拘束をおこなわないで推定する自由バラメーク (freeparameters)とすることによ って,そして識別可能の条件のもとで,記述することができるわけである(たとえば, Ji:ireskog, 1969,  1970a,  1971b,  1973aなど)。

この共分散構造の表現に関しては, (2)式を構成している項を変更することによって, 母数行 列の内容とその数とを拡張することができる。たとえば, Ji:ireskog(1970a)の共分散構造分析 モデルでは,この(2)式に2次因子分析モデルを挿入することによって,解析可能な方法の範囲 を拡大している。因果分析モデルでは,伝統的に,この (2)式を測定方程式と呼び, 2つの測定 方程式と,この2つの方程式で定義される潜在変数の因果関係を構造方程式において表現する方 法を採用している (Ji:ireskog,1973a)。 このような, この 2の各要素を表現するための基本的 な方程式に共通する特徴は,たとえば(2)式のように,観測変数が,潜在変数と誤差変数との線 形結合によって表現されることにある。この潜在変数(latentvariables)の存在を強調すること から,これらのモデル群は潜在変数モデルと呼ばれることもある(たとえば, Loehlin,1987) なお,どのように拡張されたモデルにおいても利用者は,識別可能な条件のもとで,固定・拘束

・自由の各パラメークを利用して,各自の仮説的モデルを自由に記述することができるわけであ

‑ 5 ‑

(7)

関西大学『社会学部紀要』第25巻第3

1. 3.  適合度関数

識別可能な仮説的モデルがあり,標本から算出された共分散行列が存在するとすると,次のス テップは母数の推定である。ここでは,十分に大きな標本数 (N)から計算された標本共分散行 列を Sとして,母数の推定方法を簡単に整理してみることにする。

まず最尤 (MaximumLikelihood)法では,次の関数を最小化することによって,母数を推 定することができる。

FML=loglZ(fJ) +tr(SZ(fJ)1)‑logJSl‑n

一般化最小2 (GeneralizedLeast Squares)法の最小化の関数は,

FcLs=2tr [  (JS1Z(fJ))2] 

(6) 

(7) 

である Qoreskog & Goldberger,  1972)。ここで, これらの最小化あるいは適合度関数 (fit function)Fとして表すと,なんらかの対角行列 Dに対して, (6)(7)式の関数は尺度不 (scaleinvariance)である (Browne,1982)。すなわち,

F(DSD, DZD) =F(S, Z) 

と表すことができる。この尺度不変の性質を満たす FML FGLSにおいては,標本相関行列か ら母数の推定をおこなうこともできる(丘本, 1986)。なお,これらの方法は, 標本分布が多変 量正規分布であることを仮定している。

Browne (1984) この正規分布という制約からは自由である新しい方法を提案している

(狩野, 1990)。彼による漸近分布自由 (AsymptoticallyDistributionFree:  ADF)法を,

Bollen (1989a), 重みつき最小2 (WeightedLeast  Squares)法と呼び, その適合関 数を任意分布関数 (ArbitraryDistribution  Function : ADF) と呼んでいる。 Joreskog

Sorbom(1989a)は,一般的重みつき最小2 (generally Weighted Least  Squares: WLS)  法と呼んでいる。ここでは,これを W区;と表すことにすると,この最小化関数は

FWLs= (8‑a)'w‑1cs‑a)  (9)  と表すことができる。ここで, 8は,標本共分散行列の対角項を含む下三角の要素からなるベク

トルであり,そして, C :E(fJ)の対応する要素からなるベクトルである。また w‑1は重み 行列 [1/2n(か卜1)Xl/2n(n+l)]次である。なお,この FwLsも尺度不変である。

ここでは,これらの関数を最小化するアルゴリズムは省略する(Bentler,1992 ; Bollen, 1989a ;  Joreskog & Sorbom ; 1989a ; 丘本, 1986;豊田, 1992;など参照)。

1. 4.  適合度統計量

FML, FaLsそしてFwLsを使用すると,尤度比の論理から帰無仮説Ho:X=X(fl)を検定する ことができる。ここで,これらの関数を,標本共分散行列に関して最小化することによって得ら

(8)

JoreskogSorbomによるコンピュータ・プログラムと構造方程式モデル(清水)

れた推定値を Fと表すと,

c=(N‑l)F  (10) 

この Cは,十分に大きな標本数 Nであったとすると,漸近的にが分布に従う。なお,自由度 d=q(q+l)/2‑tである。すなわち,このが推定量である Cの値が,自由度 dの が 分 布 (1‑a)パーセンタイルを越えれば,帰無仮説は棄却されることになる。

ところで,この検定の設定では,帰無仮説が「モデルがデータに適合する」であり,対立仮説 は「データはモデルに適合しない」である。豊田 (1992)が明快に説明しているように, これ は,通常の統計的検定の論理とは, 逆の設定となっている。たとえば, 推測統計での有意性の 検定から, 「無相関」を帰無仮説とする検定を,例としてみると,標本数が十分に大きい場合に は,かなり低い値の相関であっても, 帰無仮説を棄却することになる。すなわち「相関がない とはいえない」との結論となる。同じ値の相関であっても,標本数がかなり小さければ,この帰 無仮説を棄却できないことになる。

このような推定より得られるが推定量は, (10)式において明らかなように,最小化された適 合関数に(標本数ー1)をかけることによって計算される。このことは,炉が,標本数の影響を 受けることを意味している。このため,帰無仮説を棄却するための検定力は,標本数が大きいと 高くなる。帰無仮説を採択しようとして,逆に,標本数を小さくすると,これらの推定方法が仮 定していた十分に大きな標本との条件に反することになる。このため, FML, FGLSそして FwLs を母数推定に使用とするものは,このような doublebindの状況に,陥ることになる (Tanaka, 1987)

1.  5.  適合度指標と分布

この状況において提起された疑問を整理すると, 1)最尤推定をおこなうために必要な標本数の 下限はいくらか,標本の数から影響を受けない適合度指標(goodnessof fit  index)を得ること ができるのか, 2)多変量正規分布からの乖離に最尤法は頑健であるのか,そして3)WLS (ある いは ADF)は,最終的なこの疑問を解決する方法であるのか,などとなろう。この問題に関す る研究の現状を,ここでは,簡単に整理してみることにする。

数理統計学者は,十分に大きな多変量正規分布を,最尤法の条件としている。具体的な仮説を 実証するために収集した現実のデータが,この理論的な条件を満たすものであるかどうかという 疑問に,実証的な研究者は,悩むことになる。最初にこの問題を検討したのが, Boomsma(1982)  である。彼は, 因子分析モデルを使用して, 最尤法の頑健性 (robustness)を,分布と標本数 とに関するシミュレーション (MonteCarlo)によって研究した。 この研究結果において, は,最尤法がかなり頑健な性質を有していることを明らかにするなかで, 標本数の下限を100 し,そして200以上であることが望ましいとの結論を下した。なお,彼は別な研究でも,同じよ うな結果を報告している (Boomsma,1987)。 また, AndersonGerbing (1984) 標本

‑ 7 ‑

(9)

関西大学『社会学部紀要』第25巻第3

数の下限として, 150かそれ以上を推奨している。 Hayduk(1987)が述べているように, 100 り少ない標本数の場合には,特別に注意を払う必要があろう。しかしながら,このようなシミュ レーション研究は,限定されたモデルでおこなわれたものであって,一般的な利用場面に彼らの 結論をそのまま適用することはできない (Tanaka,1987)。ここであきらかになってきたこと は,ある程度正規性から乖離したデータに対しても最尤法は頑健性 (robustness)があるとい うことである。ただし, 乖離が大きいと, すなわち極端な歪度や尖度のデークでは,炉の値や 母数の推定値においていくつの問題が指摘されている (Bollen,1989a)

これの標本数の問題と関連しながら急速に展開してきた研究分野は,適合性指標に関するもの である。 1つの仮説的モデルを推定して得られた解の適合性に関しては, z2と自由度との比が 2.0以下がよいとする意見 (Carmines& Mciver,  1981) 標本数に影響されない指標とし , 推定解から計算される残差に注目した指標 (GFI (Goodnessoffit),  AGFI (Adjusted  GFI),  RMR (Root Mean square Residual); Joreskog & Sorbom, 1981,  1982)が提案され た。これらの指標に関して,たとえば, Tanaka(1987) GFI0.9以上ならデークがモデ ルをよく説明しているとしている。そして, LaDu & Tanaka (1989)は,モデル推定の異な った方法の間でGFIはよく似た値を示すことを明らかにしている。また, Cuttance(1987) AGFI>0.8をモデル採択の基準として提案している。しかしながら, GFIAGFI Maiti

Mukherjee (1990)が証明しているように, 標本数の影響を受けるものと考えなければなら ない。

この標本数からの影響を受けないとする適合度指標が, Bentler& Bonett (1980)によって 提案された。彼らは,複数のモデルを同ーデークから推定することによって,このデークで最も 適切なモデルを探求する方法として, Tucker & Lewis (1973)の研究を発展させた。 この方 法は,変量数の因子からなる帰無モデルから推定される z21つのベースラインとして,目的 のモデルの適合性と入れ子(nested)となっているいくつかのモデルとを比較するというもので ある。 しかし, 彼らが提案したこの増分変化量適合指標 (incrementalfit  indices)もまた,

標本数の影響を受けることが, Bollen (1986)33個もの指標を検討した Marsh, Balla,  & 

McDonald (1988)によって,指摘された。なお,この研究分野において,標本数からの影響が 少ないものとして注目されているのは, Bentler(1990)McDonald& Marsh (1990)によ

る提案である (Goffin,1993)

このような研究とは,別な発想から, Mulaik,James, Van Alstine, Bennett, Lind & Stil well (1989) モデルの自由度を考慮に入れる簡約性 (parsimony)という概念と指標とを 提案している。また, Browne& Cudeck (1989) 1つの標本に交差妥当化を適用する方法 を提案している。このような適合性指標に関する理論展開の状況のなかで, Raykov,Tomer & 

Nesselroade (1991) 1つの指標のみから結論を引き出すことの危険性を,いくつかの実証 研究やシミュレーション研究を引用しながら論じている。彼らが出したガイドラインは,複数の

参照

関連したドキュメント

アクセサリ・その他L. ACCESSORIES