1.はじめに
児童向けのWechsler式知能検査であるWechsler Intelligence Scale for Children(以下,WISC)は,
学校での心理臨床において最も広く使われている検査の一つである(Benson et al., 2019)。日本では
2019年現在WISC-IVが用いられており,改定版であるWISC-Vの日本版作成作業も進行中である。
WISC-IVから得られた得点の解釈は,検査が想定する因子構造に基づいて行われる。すなわち,観
測されたデータ(各下位検査の得点)を,実際には観測されない潜在変数(因子)を用いて説明する モデルを仮定することによって,得点が持つ意味の読み取りが行われる。WISCが想定する因子構造 はWISCの改訂とともに変遷してきており,それに合わせ解釈の仕方も変わってきている(Wechsler, 2003;日本版WISC-IV刊行委員会,2010)。WISC-IVの因子構造の研究では,構造方程式モデリング の一種である確認的因子分析(Confirmatory Factor Analysis以下CFA)がよく用いられる。CFAでは,
複数の異なるモデルの観測データへの当てはまりを比較することで,どのモデルがデータを最もうま く説明できるかの評価を行う(Brown, 2006)。
日本版WISC-IV刊行委員会(2010)の『WISC-IV理論・解釈マニュアル』(以下『理論・解釈マニュ
アル』)においては,言語理解(VC),知覚推理(PR),ワーキングメモリー(WM),処理速度(PS)
の4つの因子から観測データを説明する1次因子モデル(first-order model)を採択している。しか し,知能の階層構造を仮定するCattell-Horn-Carroll理論(以下,CHC理論)の知能研究における隆 盛を受けて,近年では階層構造を含めたモデルの検討がなされるようになってきている。具体的には,
1次因子間の相関関係を2次因子で説明する高次因子(higher-order)モデル(図1)や,全ての観測 変数に影響を及ぼす一般知能因子gと特定の観測変数のクラスターのみに影響を及ぼすグループ因子 からの直接的な関係を想定する双因子(bifactor)モデル(図2)の2つが近年よく用いられるように なっている。とくに双因子モデルは近年,Reise(2012)が「再発見(rediscovery)」と評するように,
知能研究やパーソナリティ研究においてその有用性が再評価されており,後に検討するようにWISC- IVの研究においても適用例が多い。
本稿の目的は双因子モデルを用いてWISC-IVを検討している研究のレビューを行い,モデルの妥 当性を検討することである。そのために,まず次節で双因子モデルについて概観した後,双因子モデ ルを用いてWISC-IVの因子構造を検討した研究をまとめる。最後に,日本版WISC-IVの『理論・解
双因子モデルを用いた WISC-IV の因子構造の研究
―
海外における研究動向と日本版の予備的分析
―小野島 昂 洋
釈マニュアル』記載のデータを用いて,海外での研究と同様の結果が得られるのかの検討を行う。
2.双因子モデルの概要
本節では,双因子モデルについて概観する(モデルの詳細については,Reise 2012; Brunner et al., 2012; 清水・青木,2015などを参照)。
双因子モデルは階層的因子分析の特別な場合であり,観測変数が(1)全ての観測変数へと影響を 与える一般因子(general factor)と,(2)一部の観測変数のみに影響を与える複数のグループ因子
(group factor)の2層によって説明される(図2)。ここで,全ての因子は直交していると仮定される。
このモデルでは,測定対象の広範で全体的な構成概念が一般因子として,その下位領域の狭い構成概 念がグループ因子として同時に測定されることとなる。知能検査の文脈だと,CHC理論における全 体的な知的能力gが一般因子として,言語理解や知覚推理といった,領域特有の狭い能力がグループ 因子によって測定されることとなる。
双因子モデルが最初に紹介されはじめにその名称で用いられたのは知能研究の文脈であり,
図 1 高次因子モデル(観測変数の誤差省略)
図 2 双因子モデル(観測変数の誤差省略)
Holzinger & Swineford(1937)がSpearmanによる知能の二因子説を拡張する形でモデルを提唱した ことが嚆矢である。それから20年おくれてSchmid & Leiman(1957)が高次因子モデルから階層因 子モデルを導く変換手法(Schmid-Leiman変換; 以下SL変換)を提案したが,Thurstone流の斜交 モデルの影に隠れこのモデルが長らく検討されることはなかった(Resie, 2012)。しかし,近年のソ フトウェアの進展,解説的な論文の増加,パーソナリティ研究での有用性の再評価に伴って「再発見」
(Reise, 2012)され,利用例が増えてきている。
双因子モデルを利用する利点の一つに因子の解釈が容易なことがあげられる。高次因子モデルにお いては,観測変数の変動は1次因子の変動により説明されるが,1次因子の変動は2つの潜在変数の 変動により説明される。すなわち,2次因子の変動(図1のg)と1次の独自因子の変動(図1のdi) である。例えばWISC-IVの高次因子モデルでは,「類似」の下位検査得点は言語理解の1次因子によっ て説明されるが,言語理解の因子の変動は一般知能因子gと1次の独自因子d1の2つの変動によっ て説明される。このため類似の得点が高い(低い)ことが,一般知能の高さ(低さ)によるものか,
領域固有の言語に関する能力の高さ(低さ)によるものなのかの判別が難しくなる(Brunner et al.,
2012)。こうした問題から,因子の解釈を容易にするため,高次因子モデルにSL変換を適用し,一
般因子の影響と領域固有の能力の影響に分離することが推奨されている(Brunner et al., 2012)。
しかし,SL変換によって得られた母数間には比率の制約があることが知られており(Yung et al.
1999),双因子モデルを用いる別の利点として,母数間の比率に制約を課さずに母数の推定が可能 な点が挙げられる(Brunner et al., 2012; Reise, 2012)。SL変換では高次因子モデルで得られた解を,
(1)一般因子から観測変数への直接的な影響,(2)一般因子の影響を除いた領域固有の能力から観測 変数への直接的な影響の2つへと変換する。前者は,観測変数の1次因子への負荷と1次因子の2次 因子への負荷をかけることによって得られ,後者は観測変数の1次因子への負荷と1次の独自因子の 標準偏差をかけることによって得られる。しかし両者を求める式のどちらにも観測変数の1次因子へ の負荷が用いられるため,同じグループ内の観測変数では(1)と(2)の比率が全て等しいという制 約を受けることとなり(Yung et al., 1999),同じグループ内の観測変数は,gから受ける影響力がグ ループ因子に比べて相対的に高い(あるいは低い)といった変動を許さないこととなる。したがって 高次因子モデルを選択する際には,この不自然な比率の制約に対する妥当な説明を理論に含めなけれ ばならなくなる(Gignac, 2016)。また,母数においてグループ内の観測変数が等比率でないのであれ ば,得られたデータに高次モデルを当てはめたとしても適合度は低下することとなる。Gignac(2016)
によるシミュレーションでは比率の制約への違反の程度を体系的に操作し,高次因子モデルと双因子 モデルの適合度へと及ぼす影響を検討しているが,実際に比率の制約を違反している母数から発生さ せたデータほど高次因子モデルの適合度が低下することが報告されている。
双因子モデルの別の利点として,測定対象と他の外的な変数との関連を検討する研究における有 用性が挙げられる。高次因子モデルと階層因子モデルのどちらを選ぶかの選択に際して,Bruner et al.(2012)は高次因子モデルの選択が望ましいのは,研究の対象が一般因子と他の変数の関係のみに
あり,かつ,高次因子モデルの当てはまりが階層モデルと同等に良い時のみであるとしており,その 他の全ての場合では階層モデルが望ましいと論じている。特に,一般因子だけでなくグループ因子と 他の外的な変数との関連を検討する研究においては階層モデルの選択を推奨している。
双因子モデルに関連して,モデルをベースとしたいくつかの信頼性や尺度の一次元性の指標が提案 されている。その一つが,モデルをベースにした信頼性係数のωである。ωは階層モデルにおけるp 行k列からなる因子負荷行列に対して,
ω 2
2
1 kj
= j 1
k= p
1 i= ij
pe λ i i
p 1 i= ij
= λ
(1)
として定義される。ここでλijは,i番目の観測変数の因子jへの因子負荷量,eiは観測変数iの独自 性であり,pは観測変数の数,kは階層モデルにおける全ての因子の数である。この指標は,得点全 体の変動の内,全ての因子の変動に帰することができる割合であり,尺度得点が一般因子とグルー プ因子を合わせた構成概念全体を測定する信頼性についての情報を提供している(Brunner et al., 2012)。
ωが全変動の内全ての因子によって変動を説明できる割合を意味するのに対して,特定の因子に帰 する変動の割合を示す指標がωhである。ωhは以下の式で定義される。
ωh e
p 1 2 2 i= ij 1
kj
= p
1
i p
ij i i
=
= λ
λ (2)
ωと異なるのは分子のみであり,例えばgのみや言語理解のみといった,特定の因子の変動が全変 動に占める割合である(1)。この指標が重要なのは下位尺度得点をグループ因子として解釈すること が可能かの判断に関わるからである。特に下位尺度において,ωが高くωhが低い場合に,その尺度 得点が意味あるグループ因子を反映していると解釈するのは難しいとされている(Rodriguez et al., 2016)。
またこれらと関連しよく報告される指標がExplained Common Variance(以下ECV)である。
Reise et al.(2010)によれば,ECVとは共通因子で説明される分散を一般因子が説明できる割合のこ
とであり尺度の一次元性の指標とされる。WISCの因子構造に関する研究の多くはこれを一般因子だ けでなくグループ因子にも拡張して用いている。その場合に,ECVは以下の式によって算出される。
ECV
p 1
1 i 2ij
2ij kj
= =p
1 i=
=
λ
λ (3)
この指標を用いて モデルが説明する分数の内,gが説明する割合およびそれぞれのグループ因子が説 明する割合の評価がなされている。
3.双因子モデルを用いて WISC-IV を検討した研究
本節では双因子モデルを用いてWISC-IVを検討した研究を概観する。電子データベースである PsycINFO, PsycARTICLES, ERICで「WISC-IV」「confirmatory factor analysis」をキーワードに指定 して,WISC-IVが出版された2003年から2019年の期間で検索したところ,それぞれ46件,17件,
13件の論文が該当した(2019年8月時点)。それらの中から重複を除き,(1)査読付き学術誌掲載論 文であること,(2)WISC-IVを対象としていること(WISC-IV Integratedは除外),(3)CFAを用い て双因子モデルを含めたモデルの比較検討をしていることの3点を基準にして対象とする論文を選定 した結果,9の研究が該当した。なお,WISC-IVの因子構造の研究においては,WISC-IVのマニュア ルが示す4因子か,CHC理論を仮定する5因子かが検討の対象となってきたが,議論が拡散するこ とを防ぐため,5因子の双因子モデルについて検討しているものは今回のレビューから除外した。
それぞれの論文において用いられたWISC-IV,調査対象国,対象者数および対象者の属性,デー タが補助検査を含むか,比較検討されたモデル,最終的に選択されたモデル,解釈への示唆について 表1に示した。なお,ここで1-3因子モデルとは,『理論・解釈マニュアル』pp. 56-57で検討されて いるモデル1-3を指す。その他に検討されたモデルの説明は表1の注に示した。
3.1.選択されたモデルについて
各研究で最終的に選択されたモデルに注目すると,9件の研究のうち,双因子モデルが5件,高 次因子モデルが2件,1次因子モデルが1件,1次因子と高次因子モデルのどちらも支持するものが 1件あり,大多数が階層性を仮定したモデルを選択していた。高次因子モデルと双因子モデルでは双 因子モデルを選択する研究の方が多かった。もっとも,大多数の研究において,1次因子モデル,高 次因子モデル,双因子モデルのいずれも,慣例的な適合度の基準(例えばCFI>.95など)を上回り,
良好な適合を示すことが報告されていた。モデルの選択に際しては,理論的観点,複数の適合度指標 の比較,モデルに加える必要があった制約などの複数の観点から総合的に行なわれていた。以下では,
個々の研究について概観する。
Watkins(2010)は特殊教育を受ける必要があるかの判断のためWISC-IVを受検した児童生徒を対
象に1-3因子モデル,1次因子モデル,高次因子モデル,双因子モデルを比較した。その結果双因 子モデルが最もデータに適合すると結論づけ,指標得点の解釈をFSIQの解釈よりも重視することは 誤った結論を導く可能性に言及している。
Devena et al.(2013)は,病院にリファーされた児童生徒を対象に1-3因子モデル,1次因子モデル,
高次因子モデル,双因子モデルの比較を行い,その結果,双因子モデルがよくデータを説明できるこ とを報告した。解釈においては,他の双因子モデルを支持する研究と同様に,指標得点の解釈よりも FSIQの解釈を重視する必要性に言及している。
Nakano & Watkins(2013)は,特殊教育サービス利用の適格性の判断のためにリファーされたネ
表 1 CFAを用いてWISC-IVの双因子モデルを検討した研究 番号 著者名
(発表年)用いたWISC-IV
(調査国) 対象者の属性
(人数) 検討されたモデル 支持されたモデル 臨床への示唆 1 Watkins
(2010) アメリカ版 基本10検査
(アメリカ)
特殊教育サービ ス利用の評価の ためリファーさ れた学生(355)
1-3因子モデル 1次因子モデル 高次因子モデル 双因子モデル
双因子モデル 一般知能よりも指標得点 を重視した解釈は誤った 結論につながりかねない。
2 Devena et al.
(2013)
アメリカ版 基本10検査
(アメリカ)
病 院 へ と リ ファーされた児 童 (297)
1-3因子モデル 1次因子モデル 高次因子モデル 双因子モデル
双因子モデル 解釈をする際はgの影響 を無視せず,指標得点の 解釈よりもFSIQの解釈 を優先するべき。
3 Nakano
&Watkins
(2013)
アメリカ版 基本10検査
(アメリカ)
ネイティブ・ア
メリカン(176) 1-3因子 1次因子モデル 高次因子モデル 双因子モデル
高次因子モデル さらなる追加のリサーチ が行われるまで,一般能 力(FSIQ) の 要 因 を 無 視するべきではない。
4 Watkins et al.
(2013)
イギリス版 基本10検査
(アイルランド)
学習困難aでリ ファーされた学 生(794)
1-3因子モデル 1次因子モデル 高次因子モデル 双因子モデル
双因子モデル 解釈はFSIQを中心に行 うべきである。もし,指 標得点の解釈に進むので あれば,過剰な解釈をし ないよう最大限の注意を 払うべき。
5 Canivez
(2014) アメリカ版 基本10検査
(アメリカ)
学習困難児
(345) 1-3因子モデル 1次因子モデル 高次因子モデル 双因子モデル
双因子モデル 基本的にはFSIQの解釈 に集中し,指標得点の解 釈に進む場合には最大限 の注意を払う必要がある。
6 Decker et
al. (2014) アメリカ版 基本10検査
(アメリカ)
標準化サンプル
(2200) 双因子モデル
双因子モデルからグルー プ因子を1つ除いたも の(4種)b
1因子モデル 高次因子モデル 1次因子モデル
1次因子モデル 多重共線性に気をつけな がらも,1次因子モデル で解釈すると良い。アセ スメントの価値は治療へ の示唆を得ることにある ので,指標得点の有用性 を捨てるべきではない。
7 Molinero et al.
(2015)
スペイン版 基本10検査
(スペイン)
ギフテッド
(87) 2因子モデル(VIQ-PIQ)c 2因子モデル(GAI)d 1次因子モデル 双因子モデル 高次因子モデル
1次因子モデル
高次因子モデル ギ フ テ ッ ド に 対 し て も,WISC-IVの 利 用 は 妥当。総合的に判断する と,GAIモデルのように
WM, PSの因子をなくす
よりも,4因子を用いて 解釈を行うことが望まし い。(1次因子モデルと高 次因子モデルの優劣には 言及なし)
8 Styck &
Watkins
(2016)
アメリカ版 基本10検査
(アメリカ)
限局性学習症
(1537) 1-3因子モデル 1次因子モデル 高次因子モデル 双因子モデル
双因子モデル FSIQの解釈を重視する べきで,指標得点の解釈 は測定の正確性を検討し た後に,得られる情報は 多くないという理解のも とで行うべきである。
9 Styck &
Watkins
(2017)
アメリカ版 基本10検査
(アメリカ)
注意欠陥多動性
障害(233) 1-3因子モデル 1次因子モデル 高次因子モデル 双因子モデル
高次因子モデル 得点の解釈はFSIQの水 準に止まるべきで,指標 得 点 に 進 む べ き で は な い。
a)イギリスやアイルランドでは,学習困難(learning difficulties)は特定の障害種を指す言葉でないため,多様な診断群を含 んでいると考えられる。
b)グループ因子の影響力を見る目的で,それぞれの因子を取り除いたモデルが検討された。例えば,双因子モデル-PRでは,
双因子モデルからPRのグループ因子を除いたもの(i.e.,[積木模様,絵の概念,行列推理]はgにのみ負荷)が検討された。
WM, PS, VCについても同様。
c)2因子モデル(VIQ-PIQ)では,VIQ は[類似,単語,理解,数唱,語音整列],PIQは[積木模様,絵の概念,行列推理,符号,
記号探し]で測定された。
d)2因子モデル(GAI)では,VCとPRを測定する下位検査のみが含まれ,それぞれの因子は[類似,単語,理解],[積木模 様,絵の概念,行列推理]で測定された。
イティブアメリカンを対象に因子構造を検討している。1-3因子モデル,1次因子モデル,高次因子 モデル,双因子モデルのデータへの適合度の比較の結果,高次因子モデルが支持されたことを報告し ている。また他の多くの研究と同様に,gが分散の大部分を説明することから結果の解釈においては gの影響力を無視するべきではないことを論じている。
Watkins et al.(2013)は,アイルランドで学習困難の評価のために学校心理士にリファーされた児 童生徒を対象に1-3因子モデル,1次因子モデル,高次因子モデル,双因子モデルの比較を行った。
その結果,双因子モデルがデータを最もよく説明すると結論づけている。臨床への示唆として,グ ループ因子は検査得点に対する情報量が少なく信頼性も低いことから,解釈ではFSIQのみに限定す る必要性を主張している。
Canivez (2014)もまた,高次因子モデルと双因子モデルの比較を学習困難の子どもを対象に行っ
ている。その結果,双因子モデルがデータを最もよく説明できることを報告している。また,gを除 いた他の因子(グループ因子)では信頼性が極めて低いことを報告し,臨床家がFSIQを超えて指標 得点の解釈を行う際には最大限の注意を払う必要があると指摘している。
Molinero et al.(2015)は,ギフテッドに対して,2種類の2因子モデル,1次因子モデル,高次因 子モデル,双因子モデルの比較を行なった。その結果,1次因子モデルと高次因子モデルの適合の良 さを報告しており,ギフテッドに対して2因子ではなく4因子を用いた解釈を行うことが望ましいと 主張している。
Styck & Watkins(2016)は,限局性学習症の診断を受けた児童生徒を対象にして因子構造を検討 している。1-3因子モデル,1次因子モデル,高次因子モデル,双因子モデルを比較した結果,双因 子モデルの適合が最も良いことを報告した。データの大部分はgにより説明され,他の因子の信頼性 が低いことを報告した。このことから,臨床場面では,FSIQを重視した解釈を行うべきで,それぞ れの指標得点の解釈は,測定が正確になされているのかを検討した後でのみ可能だと主張している。
Styck & Watkins(2017)はADHD児でもWISC-IVの因子構造を検討している。1-3因子モデル,
1次因子モデル,高次因子モデル,双因子モデルの比較を行い,高次因子モデルが最もデータをよく 説明することを報告している。結果からADHD臨床群への解釈の際には,やはりFSIQまでの解釈 にとどまるべきことを推奨している。
ここまでは全て階層性を考慮したモデルが選択されていたがgを想定しない1次因子モデルを支 持する研究もある。Decker et al.(2014)はアメリカ版WISC-IVの標準化サンプルを対象に,双因子 モデルから各グループ因子を除いたモデルを比較しグループ因子の持つ情報量の多さを主張した後,
1次因子モデル,高次因子モデル,双因子モデルの比較を行い,1次因子モデルを支持する報告をし ている。その結果から,臨床家は検査から得られる介入への示唆を重視するべきとする立場にたち,
FSIQの解釈のみに焦点を当てるのではなく,指標得点レベルでの解釈を行うこと推奨している。
3.2.ω, ωh, ECV について
高次因子モデルや双因子モデルが選択されていた研究ではモデルをベースとした信頼性係数や ECVが報告されていた。論文中で報告されていたもの,および報告されていない場合には因子負荷 量から(1)(2)(3)式を用いて計算したものを表2に示した。
ωについては,どの研究でもgが最も高かった。下位尺度では,VCが高い傾向にあり,WM, PS については低い傾向が見られた。また,下位尺度におけるωとωhを比べると多くの研究で2つの差 が顕著であり,ここからは下位尺度得点が意味あるグループ因子を反映していない可能性が示唆さ れた。ECVについては,共通因子によって説明される分散の大部分をg が占めていることが明らか であり,WISC-IVは高い一次元性を持っていることが示唆される結果となった。グループ因子では,
VCとPSがPRとWMに比べて若干高い傾向が見られた。
ここまでの結果をまとめると,WISC-IVの因子構造の研究では階層性を考慮したモデルが支持され る傾向にあり,2つのモデルの比較では双因子モデルが支持されていた。また,信頼性に目を向ける と下位尺度についてはωが高く,ωhが顕著に低い研究が多く,下位尺度得点はグループ因子を反映 していない可能性が示された。ECVからは,共通因子による分散の大部分はgが説明し,領域固有 の能力(グループ因子や1次の独自因子)が説明できる割合はわずかであった。それらの結果から臨 床使用においては,gを測定しているFSIQの使用については推奨できるものの,VCIやPRIなどの 4つの指標得点の解釈には慎重になるべきと警鐘を鳴らすものが多いことが明らかとなった。
4.日本版 WISC-IV のデータを用いたモデルの検討
本節では,日本版WISC-IVにおいて,前説で得られたレビューと同様の傾向が見られるかを検討 する。『理論・解釈マニュアル』のp. 49に記載の相関係数行列を用いて,1次因子モデル,高次因子 モデル,双因子モデルの3つを比較した。サンプルサイズは標準化サンプルの1285を,推定法には 最尤推定法を指定した。分析は全て,R ver 3.5.1(R Core team, 2018)を用いて行い,CFAには追加 パッケージであるlavaan ver 0.6-3(Rosseel, 2018)を用いた。
表 2 各研究で報告されたω, ωh, ECV
ω ωh ECV(%)
研究 g VC PR WM PS g VC PR WM PS g VC PR WM PS
Watkins (2010) .93 .90 .82 .73 .73 .86 .19 .12 .12 .39 75 8 5 3 10
Devena et al. (2013) .94 .90 .82 .80 .78 .87 .22 .13 .20 .27 76 8 4 5 7
Nakano & Watkins (2013) .87 .81 .70 .60 .59 .78 .22 .29 .05 .28 69 10 11 2 8
Watkins et al. (2013) .90 .87 .78 .68 .64 .80 .23 .14 .33 .38 64 9 9 9 10
Canivez (2014) .92 .88 .84 .64 .70 .84 .26 .14 .10 .33 72 10 7 2 8
Styck & Watkins (2016) .85 .82 .70 .54 .67 .67 .48 .17 .23 .53 48 22 8 6 16 Styck & Watkins (2017) .88 .79 .70 .60 .71 .78 .34 .09 .12 .37 67 15 3 4 12
表3に各モデルのデータへの適合度を示した。CFI, RMSEA, SRMRのいずれの指標においても,
Hu & Bentler(1999)が示す基準(CFI>.95; RMSEA<.06; SRMR<.08)に照らして全てのモデルが 十分に良い適合を示していた。モデル間の適合度を比べると1次因子モデルと高次因子モデルの適合 は大きく違わない一方で,双因子モデルは他2つのモデルに比べて良い適合を示していた。
表4には高次因子モデルにSL変換を行なったものおよび双因子モデルの因子負荷量,信頼性係数,
ECVを示した。2つのモデルの全体的な傾向は似ていたが,一部の下位検査では因子負荷量に違いが 見られた。例えば「知識」の下位検査では,どちらのモデルでもVCへの負荷に比べて,gへの負荷 が高いが,双因子モデルではその比が顕著に異なっていた。また「語音整列」および「算数」におい ては2つのモデル間でgの影響とグループ因子の影響との比の違いが顕著であった。
表 4 高次因子モデル(SL変換)と双因子モデルにおける下位検査の因子負荷, 信頼性係数, ECV 高次因子モデル(SL変換) 双因子モデル
検査 g VC PR WM PS e g VC PR WM PS e 類似 .608 .381 .485 .634 .317 .498 単語 .666 .417 .382 .634 .517 .330 理解 .556 .348 .570 .501 .485 .514 知識 .646 .405 .419 .704 .273 .430 語の推理 .592 .371 .513 .606 .329 .524 積木模様 .528 .316 .622 .546 .262 .633 絵の概念 .404 .241 .779 .406 .217 .788 行列推理 .579 .346 .545 .558 .400 .528 絵画完成 .515 .308 .639 .490 .378 .617 数唱 .597 .245 .583 .571 .331 .565 語音整列 .625 .256 .544 .595 .575 .315 算数 .673 .276 .470 .724 .051 .474 符号 .395 .610 .472 .355 .720 .355 記号探し .419 .646 .408 .441 .560 .492 絵の抹消 .253 .391 .783 .257 .387 .784 ω .899 .847 .683 .724 .698 .903 .852 .685 .768 .704 ωh .795 .239 .180 .104 .492 .793 .239 .194 .157 .504
ECV (%) 66.7 10.9 5.5 3.0 13.9 63.0 11.0 5.9 6.2 13.7
表 3 各モデルのWISC-IVデータへの適合度
モデル χ2 df CFI RMSEA SRMR
1次因子モデル 301.833 84 0.966 0.045 0.031 高次因子モデル 313.262 86 0.964 0.045 0.033 双因子モデル 183.159 75 0.983 0.034 0.026
2つのモデル間での因子負荷量の差には,2節で取り上げた比率の制約の問題が大きく関わってい る。例えば,WMを測定する下位検査では,高次因子モデルにおいてgとWMの因子負荷量の比が
「数唱0.597/0.245=2.44; 語音整列0.625/0.256=2.44; 算数0.673/0.276=2.44」と,グループ因子内の 等比率の制約が課されているが,双因子モデルにおいてはその制約がなく自由に推定されるためこの ような差が生まれている。双因子モデルにおける「算数」の検査で因子負荷量間に極端な差が生じて いるのは,おそらく,この下位検査がワーキングメモリー特有の能力だけでなく,様々な要因が関与 した能力を測定していることが背景にあると考えられる(なお,Keith et al. (2006)などが取り上げ るように「算数」がそもそも何を測定しているかについては以前より議論の対象となってきた)。
ωとωhに注目すると,g以外の下位尺度においては2つの差が顕著であった。ここからは,前節 でレビューした研究と同じように,下位尺度得点が意味あるグループ因子を反映していると解釈する のは難しいことが示唆される。下位尺度の中ではPSのωhが他に比べて高かった。ECVに目を向け ると,若干の数値の違いはあるものの2つのモデルの傾向は同様であった。すなわち共通因子で説明 される分散のうちの60-70%をgが,10%強をVCとPSのそれぞれが,PRおよびWMが10%未満 を説明していた。これらの傾向は前節で検討した海外における報告と同様のものであった。
まとめ
本稿は,WISC-IVの因子構造の研究において近年よく用いられる双因子モデルの妥当性を検討する ために,CFAを用いて因子構造の検討を行う研究についてのレビューを行なった。その結果,多く の研究が双因子モデルを支持していることが明らかとなった。また,それらが日本版WISC-IVにお いても妥当であるかを検討する目的で,『理論・解釈マニュアル』記載の相関行列を用い1次因子モ デル,高次因子モデル,双因子モデルを比較した結果,双因子モデルがデータに最もよく適合してい た。信頼性係数,ECVにおいても海外での研究とおおむね同様な傾向が見られた。
本稿の分析の結果から,WISC-IVの利用について言えることは2点ある。1点目は,3節,4節で の結果を踏まえると,WISCの因子構造の検討においてこのモデルを無視することはできないだろう ということである。繁桝・リー(2013)のように,日本版WISC-IVにCFAを用いる研究も若干行わ れているが,双因子モデルは含まれていない。今後は,検査の因子構造を検討する研究においても他 の外的変数との関連を探る研究においても,分析対象にこのモデルを含めていくべきであろう。
2点目はWISC-IVの臨床的利用においては,FSIQの解釈を重要視するべきで,指標得点の影響を
過大視することは避けるべきだということである。WISC-IVの解釈において指標得点のパターンから 意味を読み取ることが重視されるあまりFSIQについての解釈がなおざりになった報告書も時折見ら れる。しかし,レビューした研究の多くや本稿の分析が示すように,各指標得点が領域固有の能力を 反映している程度は限定的である可能性がある。したがって,まず最も信頼できる数値であるFSIQ を解釈した上で,指標得点の解釈の際には,指標得点やそのプロフィールパターンから過剰に意味を 読み取る危険性を考慮しつつ,関係者からの聞き取りや行動観察など多様なデータを組み合わせてク
ライエントの主訴に対する仮説を構築することが望まれる。
最後に本稿の課題を述べる。本稿で行なった日本版WISC-IVの分析は,標準化サンプルの全年齢 のみを対象としたものであり,部分的なことである。年齢により因子構造が変わるか,基本10検査 のみで変わるか等を詳細に検討し,本研究の結果がどの程度の一般性を持つのかの確認を行うべきで あろう。また,WISC-IVが発達障害を含む多様な臨床群に適用されていることを考えると,レビュー した研究と同じように多様な臨床群のサンプルで日本版WISC-IVの因子構造を検討していく必要も ある。そうすることで,科学的により妥当な心理検査の活用が可能になると考えられる。
注⑴ Brunner et al.(2012)も指摘しているが,ωhはもとは一般因子にのみ適用され,尺度得点全体に対する信 頼性として扱われていた。下位尺度への適用に際し用語の混乱を避けるためRodrigues et al.(2016)は尺度 全体に関するωに対して,下位尺度にはグループ因子名の添字をつけてωVCのように表記している。ωhも同 様で,下位尺度にはωh.VCのように表記を分けている。
文献
Benson, N. F., Floyd, R. G., Kranzler, J. H., Eckert, T. L., Fefer, S. A., & Morgan, G. B. (2019). Test use and assess- ment practices of school psychologists in the United States: Findings from the 2017 National Survey. Journal of School Psychology, 72, 29-48.
Brown, T. A. (2006). Confirmatory Factor Analysis for Applied Research. Guilford Press, New York.
Brunner, M., Nagy, G., & Wilhelm, O. (2012). A tutorial on hierarchically structured constructs. Journal of Personality, 80(4), 796-846.
Canivez, G. L. (2014). Construct validity of the WISC-IV with a referred sample: Direct versus indirect hierarchical structures. School Psychology Quarterly, 29, 38-51.
Decker, S. L., Englund, J. A., & Roberts, A. M. (2014). Higher-order factor structures for the WISC-IV: Implications for neuropsychological test interpretation. Applied Neuropsychology: Child, 3, 135-144.
Devena, S. E., Gay, C. E., & Watkins, M. W. (2013). Confirmatory factor analysis of the WISC-IV in a hospital referral sample. Journal of Psychoeducational Assessment, 31, 591-599.
Gignac, G. E. (2016). The higher-order model imposes a proportionality constraint: That is why the bifactor model tends to fit better. Intelligence, 55, 57-68.
Holzinger, K. J., & Swineford, F. (1937). The bi-factor method. Psychometrika, 2(1), 41-54.
Hu, L. T., & Bentler, P. (1999). Cutoff criteria for fit indexes in covariance structure analysis: Conventional criteria versus new alternatives. Structural Equation Modeling: A Multidisciplinary Journal, 6(1), 1-55.
Keith, T. Z., Fine, G., Taub, G. E., Reynolds, M. R., & Kranzler, J. H. (2006). Higher order, multisample, confirmatory factor analysis of the Wechsler Intelligence Scale for Children-Fourth Edition: What does it measure? School Psychology Review, 35(1), 108-127.
Molinero, C., Mata, S., Calero, M. D. García-Martín, M.B. & Araque-Cuenca, A. (2015). Usefulness of WISC-IV in determining intellectual giftedness. The Spanish Journal of Psychology, 18, 1-10
Nakano, S., & Watkins, M. W. (2013). Factor structure of the Wechsler Intelligence Scales for Children–Fourth Edition among referred Native American students. Psychology in the Schools, 50, 957-968.
R Core Team (2018) R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. https://www.R-project.org/.
Reise, S. P. (2012). The rediscovery of bifactor measurement models. Multivariate Behavioral Research, 47(5), 667-
696.
Reise, S. P., Moore, T. M. & Haviland, M. G. (2010). Bifactor models and rotations: Exploring the extent to which multidimensional data yield univocal scale scores. Journal of Personality Assessment, 92, 544-559.
Rodriguez, A., Reise, S. P., & Haviland, M. G. (2016). Evaluating bifactor models: Calculating and interpreting statisti- cal indices. Psychological Methods, 21(2), 137-150.
Rosseel, Y. (2018). lavaan: An R Package for Structural Equation Modeling. Journal of Statistical Software, 48(2), 1-36.
http://www.jstatsoft.org/v48/i02/.
Schmid, J., & Leiman, J. M. (1957). The development of hierarchical factor solutions. Psychometrika, 22, 53-61.
繁枡算男・ショーンリー(2013).CHC理論と日本版WISC-IVの因子構造―標準化データによる認知構造の統 計学的分析―.WISC-IVテクニカルレポートRetrieved from https://www.nichibun.co.jp/documents/kensa/
technicalreport/wisc4_tech_8.pdf
清水和秋・青木貴寛.(2015).Bifactor構造とBifactor回転法―自尊感情尺度を対象として―.関西大学社会学部 紀要,46(2),25-43.
Styck, K. M., & Watkins, M. W. (2016). Structural validity of the WISC-IV for students with learning disabilities.
Journal of Learning Disabilities, 49, 216-224.
Styck, K. M., & Watkins, M. W. (2017). Structural validity of the WISC-IV for students with ADHD. Journal of Attention Disorders, 21, 921-928.
Watkins, M. W. (2010). Structure of the Wechsler Intelligence Scale for Children-Fourth Edition among a national sample of referred students. Psychological Assessment, 22, 782-787.
Watkins, M. W., Canivez, G. L., James, T., James, K., & Good, R. (2013). Construct Validity of the WISC–IVUK With a Large Referred Irish Sample. International Journal of School and Educational Psychology, 1, 102-111.
Wechsler, D. (2003). Wechsler Intelligence Scale for Children-Fourth Edition Technical and Interpretive Manual.
Psychological Corporation, San Antonio. 日本版WISC-IV刊行委員会 訳編(2010).日本版WISC-IV理論・解 釈マニュアル.日本文化科学社.
Yung, Y. F., Thissen, D., & McLeod, L. D. (1999). On the relationship between the higher-order factor model and the hierarchical factor model. Psychometrika, 64(2), 113-128.