: ~il[:l{l1{_lJ

(1)

JoreskogとSorbomによるコンピュータ・プログラム と構造方程式モデル

その他のタイトル Computer Programs Developed by Joreskog and Sorbom, and Structural Equation Models

著者清水和秋

雑誌名関西大学社会学部紀要

巻 25

号 3

ページ 1‑41

発行年 1994‑03‑31

URL http://hdl.handle.net/10112/13345

(2)

関西大学「社会学部紀要」第25巻第3号， 1994, pp. 1‑41 ISSN 0287‑6817

Joreskogと Sorbomによるコンピュータ・

プログラムと構造方程式モデル

清水

和秋

Computer Programs Developed by Joreskog and Sorbom, and Structural Equation Models

Kazuaki SHIMIZU

Abstract

Karl G. Joreskog and Dag Sorbom have developed the following three theoretical features and computer programs for structural equation models: factor analysis models (COFAMM), covariance structure analysis models (ACOVS), and causal analysis models (LISREU. Until COFAMM had been integrated into the fourth version of LISREL at 1978, these three kinds of computer programs had been used independently in the research fields of psycho logy and socio logy. In 1989 the seventh version of LIS REL was extended for use in generalized structural equation・models, especially for multi‑sample problems. The newest version of LISREL presents a useful man‑machine interface using the Windows format of personal computer software. RAM by Jack McArdle is also mentioned as a generalized notation method for structural equation models in the relations of LISREL.

Key words: structural equation model, LISREL, computer program, factorial invariance, structured means analysis, multiple sample analysis, goodness of fit index, asymptotically distribution‑free

抄録

Karl G. JoreskogとDagSorbomは，構造方程式モデルに関する3つの側面の次のような理論とコンピュータ・プログラムを開発してきた。それらは，因子分析モデル (COFAMM),共分散構造分析(ACOVS)そして因果分析モデル(LISREL)である。これら3種類のプログラムは， COFAMM がLISRELに統合される1978年まで，心理学と社会学の研究分野において，独立して使用されてきた。 LISRELの第7版 (1989)は，一般的な構造方程式モデル（特に多標本問題）へと拡張された。

LISRELの最新版は，パソコンの Windowsのもとで，有用なマン・マシーン・インタフェースを提供している。 JackMcArdleによる RAMを， LISRELとの関係のなかで，一般的な構造方程式モデルの記述方法としても言及した。

キーワード：構造方程式モデル， LISREL,コンピュータ・プログラム，因子的不変性，構造平均分析，多標本分析，適合性指標，漸近分布自由

‑ 1 ‑

(3)

関西大学「社会学部紀要」第25巻第3号

はじめに

構造方程式モデル (structuralequation models)は，デーク解析の新しい方法論としての地位を確立してきた (Bentler,1980, 1986; Mulaik, 1986)。たとえば， Fornell(1982)は，潜在変数 (latentvariables)と構造方程式とからなるモデルとプログラムとを，第2世代の多変量解析と呼んで，この分野での先駆的な諸論文を集録している。 Jackson& Borgatta (1981) は，因子分析モデルを測定方程式として取り扱う諸論文を編集している。 Nesselroade& Cattell (1988)による "Handbookof Multivariate Experimental Psychology"の第2版は，初版 (1966)以後において展開されてきた構造方程式モデルの理論的研究と実証的応用研究とに多くの章を割り当てている。このような動向は，生涯発達研究の分野においても顕著である (Alwin, 1988 ; Hertzog, 1990 ; Meredith, 1991 ; など）。 Collins& Horn (1991)やvonEye (1990) の多くの掲載論文に見られるように，構造方程式モデルは，発達心理学のデーク解析手法としての地位を確立してきている。

この構造方程式モデルを適用することのできるデークの種類は多様である。 1つの標本だけからなるデークは当然として，横断的データ，縦断的デーク，不完全データなど，この方法論の適用範囲は広い（たとえば， Allison,1987 ; Magnusson, Bergman, Rudinger & Torestad, 1991 ; Rovine & von Eye, 1991)。この方法の魅力を簡潔に要約すると次のようになろう。 1)構成概念間の関係を，デーク解析者が自己の仮説的モデルとして記述することができる。 2)伝統的な多変量分析にはなかった仮説的モデルの統計的検定が可能である。 3)構成概念間の因果的関係を検証することができる。 4)測定の等価性を検証することができる（複数の標本における因子的不変性の検証を含む）。そして， 5)非連続的な変数においても， 1)から4)をおこなうことができる，

などである。

課題・問題点は，次のようになろう。 1)行列代数の初歩的な知識が必要である。 2)少なくとも 100, 望ましくは200を越える標本が必要である（非連続的変数ではもっと多くの標本が必要となる）。 3)標本数が多くなると，仮説的モデルは棄却されやすい。（デークの分布状態と適合度判定に関しては，多数の指標が提案されている）。そして， 4)最適な結論を下すまでのモデル修正の作業に時間を費やさなければならない，ことなどである。

本稿では，まず，共分散構造とその解析の特徴を簡単に紹介する。そして，構造方程式モデルとそのコンビュータ・プログラムの発展の歴史を， JoreskogとSorbomの仕事を中心として検討する。最後に，構造方程式モデル解析のためのコンビュータ・ソフトの条件を考察する。

(4)

JoreskogとSorbomによるコンピューク・プログラムと構造方程式モデル（清水）

1. 共分散構造とその解析

ここでは，構造方程式モデル解析の基礎を理解するために必要となるいくつかのポイントを整理する。ここでの展開で参考にしたテキストを整理すると，まず，最も詳細にこの方法を展開しているのがBollen(1989a)である。 Hayduk(1987)も， LISRELの第VI版を中心とした詳細な解説をしている。入門者用のテキストとしては， Everitt(1984)が簡潔である。 Loehlin(1987)

は，探索的な分析手法にも言及している。 LISRELの解説書には，理論とプログラム例に加えて733篇の文献がリストされている (Joreskog& Sorbom, 1989a)。日本語の文献としては，豊田 (1992) が最も詳細で，例題も豊富である。柳井・繁桝•前川・市川 (1990) は，因子分析を中心としながらも，共分散構造分析を解説する章ももうけている。芝・渡部・石塚 (1984)には関連する用語の適切な説明がある。そして，白倉 (1991)は， SPSSXの LISREL第VI版の解説書であるが，詳細に数理的展開もおこなっている。

1. 1. 共分散構造の表現としてのモデル

共分散構造 (covariancestructure)とは，共分散（あるいは相関）行列の要素が，あるモデルによる母数 (parameters)の関数として表現される場合に，使用される統計学の用語である。

まず，観測した変数の母集団共分散行列が存在すると仮定し，この母集団共分散行列を 2と表す。そして，これは，母数 0からなるある関数によって，

:E=:E(fJ) (1)

と表現することができる，と仮定する。ここで，このZ(fJ)は， {J'=(81, .. ,8,)によって構成される。なお，母集団相関行列を Pと母集団標準偏差からなる対角行列を D,,.とすると，

Z=D,,.P(fJ)D,,.

とも表すことができる (Joreskog,1978)。

1. 2. 母数行列と識別

この母数の内容を検討するために，因子分析モデルを説明に使用する。なお，ここでは，この因子分析モデルが，変量モデル (randommodel)であることを強調するために，以下の表記法を採用する (Lord& Novick, 1968)。

まず，観測変数を確率ベクトル x'=(x1,…，Xq), とすると，因子分析モデルは，次のように表すことができる。

エ＝ち+A.,,e+a c2)

ここで，らは q個の観測変数の平均（あるいは期待値）からなるベクトルであり， A.,,は (q

‑ 3 ‑

(5)

関西大学『社会学部紀要』第25巻第3号

Xn)次の因子パクーン行列であり， 8は因子得点ベクトル (n次）であり，そして， 0 は独自因子得点ベクトル (q次）である。次に，一般的な仮定として，

ECe) =0, E(lJ) =0,

Cov(e, lJ) =0, E(峠')=0, E(lJlJ') =9a を導入すると，この場合の共分散行列は

~=E[(エーち）(x‑i‑.,)']

=A..,<.DA..,'+9a (3) と表すことができる。なお， 0は，因子得点の分散・共分散からなる対称行列である。そして，

8aは，独自因子分散を対角項にもつ対角行列である。

次に，この展開をよりわかりやすくするために，行列の要素でこれらの関係を示すことにする。ただし，簡潔に展開するために，変数の数を4,因子の数を2とした単純構造の因子パクーン行列を想定する。すると， (2)式は，

｀ノ

8 1

8 2

8 3

8 4

f︑＋

̀

︑

．も~ら'

︑

︑̲ 9

0 0 伍伍柘伍 0 0 '

︑

＋

｀

︐

m

立

てててて

︑

︱︱

｀

／

ふわ

X s

I ,

(2')

と表すこともできる。これより (3)式による観測変数の共分散行列は，

881 0 0 0

1

)『;'':, :

:J+f 。~

_、0 ^{·~.. ~.}0 0 834

~l

1￠／̲し︑

̀ J

z s

0 0 A A 知伍 0 0

f .

︑

︱︱

z

.

︑

4 8 ゜＋ 4

︐ ＾ 2

3 8 4 a u z

, ^

+￠ 3 3 2 N N

i

2 ,＾

3 4

^O O N N

, ^ ︐ ＾

け沖沖

2 N N

入ぅ＾ ︐

＾

ー8

2 3 4 N N S

゜, ^

︐ ＾ ︐ ＾

￠

＋

1 1 1 ー2 N Z z

︑A

入入

︑

A

, .

︱︱

(4)

と表すことができる。この (4)式は，共通因子分析の基本モデル式による共分散構造の定義である。すなわち，共分散行列の各要素は， 9個の母数からなる10個の方程式で表すことができたわけである。

標本共分散行列から，この母数すなわち， fJ'=0,,1,伍，伍， J.,,4,￠, 081, 082, 083, 084)を推定することが，次の問題となるわけである。しかし，もし，母数の数が，共分散行列の要素の方程式の個数よりも，多い場合には，このような方程式を解くことはできない。すなわち，識別できないことになる。この例では，あきらかに（母数の数）く（個々の要素の方程式の数）であるから，識別可能 (identifiable)といえる。なお，因子パターン行列のすべての要素を推定する伝統的な探索的因子分析の場合には，ある種の制約条件を置くことによって，この識別を可能とし

‑ 4 ‑

(6)

JoreskogとSorbomによるコンピュータ・プログラムと構造方程式モデル（清水）

ている（丘本， 1986;柳井他， 1990)。

ここでの識別では， (3)式の場合， A.,,,0, そして8aを母数行列として， (tXl)次のベクトル fJ=vec(A.,,, 0, 88)の次数が問題となる。この場合の識別を可能とするための必要条件は，母数の数 tと観測変数の数 qとの間に

t~ ―₂^q(q+l)

という関係が成り立つことである（たとえば， Ji:ireskog& Si:irbom, 1989a)。

(5)

この識別問題は，もっと複雑なモデルになると事態は混沌としてくる。 Ji:ireskogたちが勧める方法は，利用者が仮説的モデルにおいて特定した母数が識別可能かどうかを，実際にプログラムにかけてチェックするというものである。なお，この問題の理論的な展開は， Bollen(1989a)

や豊田 (1992)が詳しい。

この母数行列の基本的構成は， (2)式の方程式によって，そしてこの方程式における潜在変数に与えた条件によって，決まる。この(2)式のモデルを利用しようとするものは，この母数行列の各要素において，各自の仮説的なモデルを記述することになる。たとえば(2')式も 1つの仮説の表現である。さらに，たとえば，伍と伍との値を等しいとの仮説を設定することもできる。このように，共分散構造は，母数行列の各要素を，ゼロあるいは1のような特定の値を割り当てる固定パラメータ (fixedparameters), 値としては推定をおこなうが，複数の要素間に等

しいなどの条件を挿入することのできる拘束バラメーク (constrainedparameters), そして未知として，拘束をおこなわないで推定する自由バラメーク (freeparameters)とすることによって，そして識別可能の条件のもとで，記述することができるわけである（たとえば， Ji:ireskog, 1969, 1970a, 1971b, 1973aなど）。

この共分散構造の表現に関しては， (2)式を構成している項を変更することによって，母数行列の内容とその数とを拡張することができる。たとえば， Ji:ireskog(1970a)の共分散構造分析モデルでは，この(2)式に2次因子分析モデルを挿入することによって，解析可能な方法の範囲を拡大している。因果分析モデルでは，伝統的に，この (2)式を測定方程式と呼び， 2つの測定方程式と，この2つの方程式で定義される潜在変数の因果関係を構造方程式において表現する方法を採用している (Ji:ireskog,1973a)。このような，この 2の各要素を表現するための基本的な方程式に共通する特徴は，たとえば(2)式のように，観測変数が，潜在変数と誤差変数との線形結合によって表現されることにある。この潜在変数(latentvariables)の存在を強調することから，これらのモデル群は潜在変数モデルと呼ばれることもある（たとえば， Loehlin,1987)。なお，どのように拡張されたモデルにおいても利用者は，識別可能な条件のもとで，固定・拘束

・自由の各パラメークを利用して，各自の仮説的モデルを自由に記述することができるわけである。

‑ 5 ‑

(7)

1. 3. 適合度関数

識別可能な仮説的モデルがあり，標本から算出された共分散行列が存在するとすると，次のステップは母数の推定である。ここでは，十分に大きな標本数 (N)から計算された標本共分散行列を Sとして，母数の推定方法を簡単に整理してみることにする。

まず最尤 (MaximumLikelihood)法では，次の関数を最小化することによって，母数を推定することができる。

FML=loglZ(fJ) I +tr(SZ(fJ)一1)‑logJSl‑n

一般化最小2乗 (GeneralizedLeast Squares)法の最小化の関数は，

FcLs=2tr [ 1 (J‑S‑1Z(fJ))2]

(6)

(7)

である Qoreskog & Goldberger, 1972)。ここで，これらの最小化あるいは適合度関数 (fit function)をFとして表すと，なんらかの対角行列 Dに対して， (6)と(7)式の関数は尺度不変 (scaleinvariance)である (Browne,1982)。すなわち，

F(DSD, DZD) =F(S, Z)

と表すことができる。この尺度不変の性質を満たす FMLや FGLSにおいては，標本相関行列から母数の推定をおこなうこともできる（丘本， 1986)。なお，これらの方法は，標本分布が多変量正規分布であることを仮定している。

Browne (1984)は，この正規分布という制約からは自由である新しい方法を提案している

（狩野， 1990)。彼による漸近分布自由 (AsymptoticallyDistribution‑Free: ADF)法を，

Bollen (1989a)は，重みつき最小2乗 (WeightedLeast Squares)法と呼び，その適合関数を任意分布関数 (ArbitraryDistribution Function : ADF) と呼んでいる。 Joreskog&

Sorbom(1989a)は，一般的重みつき最小2乗 (generally Weighted Least Squares: WLS) 法と呼んでいる。ここでは，これを W区；と表すことにすると，この最小化関数は

FWLs= (8‑a)'w‑1cs‑a) (9) と表すことができる。ここで， 8は，標本共分散行列の対角項を含む下三角の要素からなるベク

トルであり，そして， C は， :E(fJ)の対応する要素からなるベクトルである。また w‑1は重み行列 [1/2n(か卜1)Xl/2n(n+l)]次である。なお，この FwLsも尺度不変である。

ここでは，これらの関数を最小化するアルゴリズムは省略する(Bentler,1992 ; Bollen, 1989a ; Joreskog & Sorbom ; 1989a ; 丘本， 1986;豊田， 1992;など参照）。

1. 4. 適合度統計量

FML, FaLsそしてFwLsを使用すると，尤度比の論理から帰無仮説Ho:X=X(fl)を検定することができる。ここで，これらの関数を，標本共分散行列に関して最小化することによって得ら

(8)

JoreskogとSorbomによるコンピュータ・プログラムと構造方程式モデル（清水）

れた推定値を Fと表すと，

c=(N‑l)F (10)

この Cは，十分に大きな標本数 Nであったとすると，漸近的にが分布に従う。なお，自由度はd=q(q+l)/2‑tである。すなわち，このが推定量である Cの値が，自由度 dのが分布の (1‑a)パーセンタイルを越えれば，帰無仮説は棄却されることになる。

ところで，この検定の設定では，帰無仮説が「モデルがデータに適合する」であり，対立仮説は「データはモデルに適合しない」である。豊田 (1992)が明快に説明しているように，これは，通常の統計的検定の論理とは，逆の設定となっている。たとえば，推測統計での有意性の検定から，「無相関」を帰無仮説とする検定を，例としてみると，標本数が十分に大きい場合には，かなり低い値の相関であっても，帰無仮説を棄却することになる。すなわち「相関がないとはいえない」との結論となる。同じ値の相関であっても，標本数がかなり小さければ，この帰無仮説を棄却できないことになる。

このような推定より得られるが推定量は， (10)式において明らかなように，最小化された適合関数に（標本数ー1)をかけることによって計算される。このことは，炉が，標本数の影響を受けることを意味している。このため，帰無仮説を棄却するための検定力は，標本数が大きいと高くなる。帰無仮説を採択しようとして，逆に，標本数を小さくすると，これらの推定方法が仮定していた十分に大きな標本との条件に反することになる。このため， FML, FGLSそして FwLs を母数推定に使用とするものは，このような doublebindの状況に，陥ることになる (Tanaka, 1987)。

1. 5. 適合度指標と分布

この状況において提起された疑問を整理すると， 1)最尤推定をおこなうために必要な標本数の下限はいくらか，標本の数から影響を受けない適合度指標(goodnessof fit index)を得ることができるのか， 2)多変量正規分布からの乖離に最尤法は頑健であるのか，そして3)WLS (あるいは ADF)は，最終的なこの疑問を解決する方法であるのか，などとなろう。この問題に関する研究の現状を，ここでは，簡単に整理してみることにする。

数理統計学者は，十分に大きな多変量正規分布を，最尤法の条件としている。具体的な仮説を実証するために収集した現実のデータが，この理論的な条件を満たすものであるかどうかという疑問に，実証的な研究者は，悩むことになる。最初にこの問題を検討したのが， Boomsma(1982) である。彼は，因子分析モデルを使用して，最尤法の頑健性 (robustness)を，分布と標本数とに関するシミュレーション (MonteCarlo)によって研究した。この研究結果において，彼は，最尤法がかなり頑健な性質を有していることを明らかにするなかで，標本数の下限を100とし，そして200以上であることが望ましいとの結論を下した。なお，彼は別な研究でも，同じような結果を報告している (Boomsma,1987)。また， Anderson& Gerbing (1984)は，標本

‑ 7 ‑

(9)

数の下限として， 150かそれ以上を推奨している。 Hayduk(1987)が述べているように， 100より少ない標本数の場合には，特別に注意を払う必要があろう。しかしながら，このようなシミュレーション研究は，限定されたモデルでおこなわれたものであって，一般的な利用場面に彼らの結論をそのまま適用することはできない (Tanaka,1987)。ここであきらかになってきたことは，ある程度正規性から乖離したデータに対しても最尤法は頑健性 (robustness)があるということである。ただし，乖離が大きいと，すなわち極端な歪度や尖度のデークでは，炉の値や母数の推定値においていくつの問題が指摘されている (Bollen,1989a)。

これの標本数の問題と関連しながら急速に展開してきた研究分野は，適合性指標に関するものである。 1つの仮説的モデルを推定して得られた解の適合性に関しては， z2と自由度との比が 2.0以下がよいとする意見 (Carmines& Mciver, 1981)や，標本数に影響されない指標として，推定解から計算される残差に注目した指標 (GFI (Goodness‑of‑fit), AGFI (Adjusted GFI), RMR (Root Mean square Residual); Joreskog & Sorbom, 1981, 1982)が提案された。これらの指標に関して，たとえば， Tanaka(1987)は， GFIが0.9以上ならデークがモデルをよく説明しているとしている。そして， LaDu & Tanaka (1989)は，モデル推定の異なった方法の間でGFIはよく似た値を示すことを明らかにしている。また， Cuttance(1987)は AGFI>0.8をモデル採択の基準として提案している。しかしながら， GFIゃAGFIも， Maiti

& Mukherjee (1990)が証明しているように，標本数の影響を受けるものと考えなければならない。

この標本数からの影響を受けないとする適合度指標が， Bentler& Bonett (1980)によって提案された。彼らは，複数のモデルを同ーデークから推定することによって，このデークで最も適切なモデルを探求する方法として， Tucker & Lewis (1973)の研究を発展させた。この方法は，変量数の因子からなる帰無モデルから推定される z2を1つのベースラインとして，目的のモデルの適合性と入れ子(nested)となっているいくつかのモデルとを比較するというものである。しかし，彼らが提案したこの増分変化量適合指標 (incrementalfit indices)もまた，

標本数の影響を受けることが， Bollen (1986)や33個もの指標を検討した Marsh, Balla, &

McDonald (1988)によって，指摘された。なお，この研究分野において，標本数からの影響が少ないものとして注目されているのは， Bentler(1990)とMcDonald& Marsh (1990)によ

る提案である (Goffin,1993)。

このような研究とは，別な発想から， Mulaik,James, Van Alstine, Bennett, Lind & Stil‑ well (1989)は，モデルの自由度を考慮に入れる簡約性 (parsimony)という概念と指標とを提案している。また， Browne& Cudeck (1989)は， 1つの標本に交差妥当化を適用する方法を提案している。このような適合性指標に関する理論展開の状況のなかで， Raykov,Tomer &

Nesselroade (1991)は， 1つの指標のみから結論を引き出すことの危険性を，いくつかの実証研究やシミュレーション研究を引用しながら論じている。彼らが出したガイドラインは，複数の