双因子モデルを用いた WISC-IV の因子構造の研究

(1)

１．はじめに

児童向けのWechsler式知能検査であるWechsler Intelligence Scale for Children（以下，WISC）は，

学校での心理臨床において最も広く使われている検査の一つである（Benson et al., 2019）。日本では

2019年現在WISC-IVが用いられており，改定版であるWISC-Vの日本版作成作業も進行中である。

WISC-IVから得られた得点の解釈は，検査が想定する因子構造に基づいて行われる。すなわち，観

測されたデータ（各下位検査の得点）を，実際には観測されない潜在変数（因子）を用いて説明するモデルを仮定することによって，得点が持つ意味の読み取りが行われる。WISCが想定する因子構造はWISCの改訂とともに変遷してきており，それに合わせ解釈の仕方も変わってきている（Wechsler, 2003;日本版WISC-IV刊行委員会，2010）。WISC-IVの因子構造の研究では，構造方程式モデリングの一種である確認的因子分析（Confirmatory Factor Analysis以下CFA）がよく用いられる。CFAでは，

複数の異なるモデルの観測データへの当てはまりを比較することで，どのモデルがデータを最もうまく説明できるかの評価を行う（Brown, 2006）。

日本版WISC-IV刊行委員会（2010）の『WISC-IV理論・解釈マニュアル』（以下『理論・解釈マニュ

アル』）においては，言語理解（VC），知覚推理（PR），ワーキングメモリー（WM），処理速度（PS）

の4つの因子から観測データを説明する1次因子モデル（first-order model）を採択している。しかし，知能の階層構造を仮定するCattell-Horn-Carroll理論（以下，CHC理論）の知能研究における隆盛を受けて，近年では階層構造を含めたモデルの検討がなされるようになってきている。具体的には，

1次因子間の相関関係を2次因子で説明する高次因子（higher-order）モデル（図1）や，全ての観測変数に影響を及ぼす一般知能因子gと特定の観測変数のクラスターのみに影響を及ぼすグループ因子からの直接的な関係を想定する双因子（bifactor）モデル（図2）の2つが近年よく用いられるようになっている。とくに双因子モデルは近年，Reise（2012）が「再発見（rediscovery）」と評するように，

知能研究やパーソナリティ研究においてその有用性が再評価されており，後に検討するようにWISC- IVの研究においても適用例が多い。

本稿の目的は双因子モデルを用いてWISC-IVを検討している研究のレビューを行い，モデルの妥当性を検討することである。そのために，まず次節で双因子モデルについて概観した後，双因子モデルを用いてWISC-IVの因子構造を検討した研究をまとめる。最後に，日本版WISC-IVの『理論・解

双因子モデルを用いた WISC-IV の因子構造の研究

―

海外における研究動向と日本版の予備的分析

^―

小野島　昂　洋

(2)

釈マニュアル』記載のデータを用いて，海外での研究と同様の結果が得られるのかの検討を行う。

２．双因子モデルの概要

本節では，双因子モデルについて概観する（モデルの詳細については，Reise 2012; Brunner et al., 2012; 清水・青木，2015などを参照）。

双因子モデルは階層的因子分析の特別な場合であり，観測変数が（1）全ての観測変数へと影響を与える一般因子（general factor）と，（2）一部の観測変数のみに影響を与える複数のグループ因子

（group factor）の2層によって説明される（図2）。ここで，全ての因子は直交していると仮定される。

このモデルでは，測定対象の広範で全体的な構成概念が一般因子として，その下位領域の狭い構成概念がグループ因子として同時に測定されることとなる。知能検査の文脈だと，CHC理論における全体的な知的能力gが一般因子として，言語理解や知覚推理といった，領域特有の狭い能力がグループ因子によって測定されることとなる。

双因子モデルが最初に紹介されはじめにその名称で用いられたのは知能研究の文脈であり，

図 1 高次因子モデル（観測変数の誤差省略）

図 2 双因子モデル（観測変数の誤差省略）

(3)

Holzinger & Swineford（1937）がSpearmanによる知能の二因子説を拡張する形でモデルを提唱したことが嚆矢である。それから20年おくれてSchmid & Leiman（1957）が高次因子モデルから階層因子モデルを導く変換手法（Schmid-Leiman変換; 以下SL変換）を提案したが，Thurstone流の斜交モデルの影に隠れこのモデルが長らく検討されることはなかった（Resie, 2012）。しかし，近年のソフトウェアの進展，解説的な論文の増加，パーソナリティ研究での有用性の再評価に伴って「再発見」

（Reise, 2012）され，利用例が増えてきている。

双因子モデルを利用する利点の一つに因子の解釈が容易なことがあげられる。高次因子モデルにおいては，観測変数の変動は1次因子の変動により説明されるが，1次因子の変動は2つの潜在変数の変動により説明される。すなわち，2次因子の変動（図1のg）と1次の独自因子の変動（図1のd_i）である。例えばWISC-IVの高次因子モデルでは，「類似」の下位検査得点は言語理解の1次因子によって説明されるが，言語理解の因子の変動は一般知能因子gと1次の独自因子d₁の2つの変動によって説明される。このため類似の得点が高い（低い）ことが，一般知能の高さ（低さ）によるものか，

領域固有の言語に関する能力の高さ（低さ）によるものなのかの判別が難しくなる（Brunner et al.,

2012）。こうした問題から，因子の解釈を容易にするため，高次因子モデルにSL変換を適用し，一

般因子の影響と領域固有の能力の影響に分離することが推奨されている（Brunner et al., 2012）。

しかし，SL変換によって得られた母数間には比率の制約があることが知られており（Yung et al.

1999），双因子モデルを用いる別の利点として，母数間の比率に制約を課さずに母数の推定が可能な点が挙げられる（Brunner et al., 2012; Reise, 2012）。SL変換では高次因子モデルで得られた解を，

（1）一般因子から観測変数への直接的な影響，（2）一般因子の影響を除いた領域固有の能力から観測変数への直接的な影響の2つへと変換する。前者は，観測変数の1次因子への負荷と1次因子の2次因子への負荷をかけることによって得られ，後者は観測変数の1次因子への負荷と1次の独自因子の標準偏差をかけることによって得られる。しかし両者を求める式のどちらにも観測変数の1次因子への負荷が用いられるため，同じグループ内の観測変数では（1）と（2）の比率が全て等しいという制約を受けることとなり（Yung et al., 1999），同じグループ内の観測変数は，gから受ける影響力がグループ因子に比べて相対的に高い（あるいは低い）といった変動を許さないこととなる。したがって高次因子モデルを選択する際には，この不自然な比率の制約に対する妥当な説明を理論に含めなければならなくなる（Gignac, 2016）。また，母数においてグループ内の観測変数が等比率でないのであれば，得られたデータに高次モデルを当てはめたとしても適合度は低下することとなる。Gignac（2016）

によるシミュレーションでは比率の制約への違反の程度を体系的に操作し，高次因子モデルと双因子モデルの適合度へと及ぼす影響を検討しているが，実際に比率の制約を違反している母数から発生させたデータほど高次因子モデルの適合度が低下することが報告されている。

双因子モデルの別の利点として，測定対象と他の外的な変数との関連を検討する研究における有用性が挙げられる。高次因子モデルと階層因子モデルのどちらを選ぶかの選択に際して，Bruner et al.（2012）は高次因子モデルの選択が望ましいのは，研究の対象が一般因子と他の変数の関係のみに

(4)

あり，かつ，高次因子モデルの当てはまりが階層モデルと同等に良い時のみであるとしており，その他の全ての場合では階層モデルが望ましいと論じている。特に，一般因子だけでなくグループ因子と他の外的な変数との関連を検討する研究においては階層モデルの選択を推奨している。

双因子モデルに関連して，モデルをベースとしたいくつかの信頼性や尺度の一次元性の指標が提案されている。その一つが，モデルをベースにした信頼性係数のωである。ωは階層モデルにおけるp 行k列からなる因子負荷行列に対して，

ω ₂

2

1 kj

＝ j 1

k＝ p

1 i＝ ij

pe λ i i

p 1 i＝ ij

＝ λ

（1）

として定義される。ここでλ_ijは，i番目の観測変数の因子jへの因子負荷量，e_iは観測変数iの独自性であり，pは観測変数の数，kは階層モデルにおける全ての因子の数である。この指標は，得点全体の変動の内，全ての因子の変動に帰することができる割合であり，尺度得点が一般因子とグループ因子を合わせた構成概念全体を測定する信頼性についての情報を提供している（Brunner et al., 2012）。

ωが全変動の内全ての因子によって変動を説明できる割合を意味するのに対して，特定の因子に帰する変動の割合を示す指標がω_hである。ω_hは以下の式で定義される。

ω^h e

p 1 2 2 i＝ ij 1

kj

＝ p

1

i p

ij i i

＝

＝ λ

λ （2）

ωと異なるのは分子のみであり，例えばgのみや言語理解のみといった，特定の因子の変動が全変動に占める割合である^（１）。この指標が重要なのは下位尺度得点をグループ因子として解釈することが可能かの判断に関わるからである。特に下位尺度において，ωが高くω_hが低い場合に，その尺度得点が意味あるグループ因子を反映していると解釈するのは難しいとされている（Rodriguez et al., 2016）。

またこれらと関連しよく報告される指標がExplained Common Variance（以下ECV）である。

Reise et al.（2010）によれば，ECVとは共通因子で説明される分散を一般因子が説明できる割合のこ

とであり尺度の一次元性の指標とされる。WISCの因子構造に関する研究の多くはこれを一般因子だけでなくグループ因子にも拡張して用いている。その場合に，ECVは以下の式によって算出される。

ECV

p 1

1 i 2ij

2ij kj

＝ ^＝_p

1 i＝

＝

λ

λ （3）

この指標を用いてモデルが説明する分数の内，gが説明する割合およびそれぞれのグループ因子が説明する割合の評価がなされている。

(5)

３．双因子モデルを用いて WISC-IV を検討した研究

本節では双因子モデルを用いてWISC-IVを検討した研究を概観する。電子データベースである PsycINFO, PsycARTICLES, ERICで「WISC-IV」「confirmatory factor analysis」をキーワードに指定して，WISC-IVが出版された2003年から2019年の期間で検索したところ，それぞれ46件，17件，

13件の論文が該当した（2019年8月時点）。それらの中から重複を除き，（1）査読付き学術誌掲載論文であること，（2）WISC-IVを対象としていること（WISC-IV Integratedは除外），（3）CFAを用いて双因子モデルを含めたモデルの比較検討をしていることの3点を基準にして対象とする論文を選定した結果，9の研究が該当した。なお，WISC-IVの因子構造の研究においては，WISC-IVのマニュアルが示す4因子か，CHC理論を仮定する5因子かが検討の対象となってきたが，議論が拡散することを防ぐため，5因子の双因子モデルについて検討しているものは今回のレビューから除外した。

それぞれの論文において用いられたWISC-IV，調査対象国，対象者数および対象者の属性，データが補助検査を含むか，比較検討されたモデル，最終的に選択されたモデル，解釈への示唆について表1に示した。なお，ここで1-3因子モデルとは，『理論・解釈マニュアル』pp. 56-57で検討されているモデル1-3を指す。その他に検討されたモデルの説明は表1の注に示した。

3.1．選択されたモデルについて

各研究で最終的に選択されたモデルに注目すると，9件の研究のうち，双因子モデルが5件，高次因子モデルが2件，1次因子モデルが1件，1次因子と高次因子モデルのどちらも支持するものが 1件あり，大多数が階層性を仮定したモデルを選択していた。高次因子モデルと双因子モデルでは双因子モデルを選択する研究の方が多かった。もっとも，大多数の研究において，1次因子モデル，高次因子モデル，双因子モデルのいずれも，慣例的な適合度の基準（例えばCFI＞.95など）を上回り，

良好な適合を示すことが報告されていた。モデルの選択に際しては，理論的観点，複数の適合度指標の比較，モデルに加える必要があった制約などの複数の観点から総合的に行なわれていた。以下では，

個々の研究について概観する。

Watkins（2010）は特殊教育を受ける必要があるかの判断のためWISC-IVを受検した児童生徒を対

象に1-3因子モデル，1次因子モデル，高次因子モデル，双因子モデルを比較した。その結果双因子モデルが最もデータに適合すると結論づけ，指標得点の解釈をFSIQの解釈よりも重視することは誤った結論を導く可能性に言及している。

Devena et al.（2013）は，病院にリファーされた児童生徒を対象に1-3因子モデル，1次因子モデル，

高次因子モデル，双因子モデルの比較を行い，その結果，双因子モデルがよくデータを説明できることを報告した。解釈においては，他の双因子モデルを支持する研究と同様に，指標得点の解釈よりも FSIQの解釈を重視する必要性に言及している。

Nakano & Watkins（2013）は，特殊教育サービス利用の適格性の判断のためにリファーされたネ

(6)

表 1 CFAを用いてWISC-IVの双因子モデルを検討した研究番号著者名

（発表年）用いたWISC-IV

（調査国）対象者の属性

（人数）検討されたモデル支持されたモデル臨床への示唆 1 Watkins

（2010）アメリカ版基本10検査

（アメリカ）

特殊教育サービス利用の評価のためリファーされた学生（355）

1-3因子モデル 1次因子モデル高次因子モデル双因子モデル

双因子モデル一般知能よりも指標得点を重視した解釈は誤った結論につながりかねない。

2 Devena et al.

（2013）

アメリカ版基本10検査

（アメリカ）

病院へとリファーされた児童（297）

双因子モデル解釈をする際はgの影響を無視せず，指標得点の解釈よりもFSIQの解釈を優先するべき。

3 Nakano

&Watkins

（2013）

（アメリカ）

ネイティブ・ア

メリカン（176） 1-3因子 1次因子モデル高次因子モデル双因子モデル

高次因子モデルさらなる追加のリサーチが行われるまで，一般能力（FSIQ）の要因を無視するべきではない。

4 Watkins et al.

（2013）

イギリス版基本10検査

（アイルランド）

学習困難^aでリファーされた学生（794）

双因子モデル解釈はFSIQを中心に行うべきである。もし，指標得点の解釈に進むのであれば，過剰な解釈をしないよう最大限の注意を払うべき。

5 Canivez

（2014）アメリカ版基本10検査

（アメリカ）

学習困難児

（345） 1-3因子モデル 1次因子モデル高次因子モデル双因子モデル

双因子モデル基本的にはFSIQの解釈に集中し，指標得点の解釈に進む場合には最大限の注意を払う必要がある。

6 Decker et

al. （2014）アメリカ版基本10検査

（アメリカ）

標準化サンプル

（2200）双因子モデル

双因子モデルからグループ因子を1つ除いたもの（4種）^b

1因子モデル高次因子モデル 1次因子モデル

1次因子モデル多重共線性に気をつけながらも，1次因子モデルで解釈すると良い。アセスメントの価値は治療への示唆を得ることにあるので，指標得点の有用性を捨てるべきではない。

7 Molinero et al.

（2015）

スペイン版基本10検査

（スペイン）

ギフテッド

（87） 2因子モデル（VIQ-PIQ）^c 2因子モデル（GAI）^d 1次因子モデル双因子モデル高次因子モデル

1次因子モデル

高次因子モデルギフテッドに対しても，WISC-IVの利用は妥当。総合的に判断すると，GAIモデルのように

WM, PSの因子をなくす

よりも，4因子を用いて解釈を行うことが望ましい。（1次因子モデルと高次因子モデルの優劣には言及なし）

8 Styck &

Watkins

（2016）

（アメリカ）

限局性学習症

（1537） 1-3因子モデル 1次因子モデル高次因子モデル双因子モデル

双因子モデル FSIQの解釈を重視するべきで，指標得点の解釈は測定の正確性を検討した後に，得られる情報は多くないという理解のもとで行うべきである。

9 Styck &

Watkins

（2017）

（アメリカ）

注意欠陥多動性

障害（233） 1-3因子モデル 1次因子モデル高次因子モデル双因子モデル

高次因子モデル得点の解釈はFSIQの水準に止まるべきで，指標得点に進むべきではない。

a）イギリスやアイルランドでは，学習困難（learning difficulties）は特定の障害種を指す言葉でないため，多様な診断群を含んでいると考えられる。

b）グループ因子の影響力を見る目的で，それぞれの因子を取り除いたモデルが検討された。例えば，双因子モデル-PRでは，

双因子モデルからPRのグループ因子を除いたもの（i.e.,［積木模様，絵の概念，行列推理］はgにのみ負荷）が検討された。

WM, PS, VCについても同様。

c）2因子モデル（VIQ-PIQ）では，VIQ は［類似，単語，理解，数唱，語音整列］，PIQは［積木模様，絵の概念，行列推理，符号，

記号探し］で測定された。

d）2因子モデル（GAI）では，VCとPRを測定する下位検査のみが含まれ，それぞれの因子は［類似，単語，理解］，［積木模様，絵の概念，行列推理］で測定された。

(7)

イティブアメリカンを対象に因子構造を検討している。1-3因子モデル，1次因子モデル，高次因子モデル，双因子モデルのデータへの適合度の比較の結果，高次因子モデルが支持されたことを報告している。また他の多くの研究と同様に，gが分散の大部分を説明することから結果の解釈においては gの影響力を無視するべきではないことを論じている。

Watkins et al.（2013）は，アイルランドで学習困難の評価のために学校心理士にリファーされた児童生徒を対象に1-3因子モデル，1次因子モデル，高次因子モデル，双因子モデルの比較を行った。

その結果，双因子モデルがデータを最もよく説明すると結論づけている。臨床への示唆として，グループ因子は検査得点に対する情報量が少なく信頼性も低いことから，解釈ではFSIQのみに限定する必要性を主張している。

Canivez （2014）もまた，高次因子モデルと双因子モデルの比較を学習困難の子どもを対象に行っ

ている。その結果，双因子モデルがデータを最もよく説明できることを報告している。また，gを除いた他の因子（グループ因子）では信頼性が極めて低いことを報告し，臨床家がFSIQを超えて指標得点の解釈を行う際には最大限の注意を払う必要があると指摘している。

Molinero et al.（2015）は，ギフテッドに対して，2種類の2因子モデル，1次因子モデル，高次因子モデル，双因子モデルの比較を行なった。その結果，1次因子モデルと高次因子モデルの適合の良さを報告しており，ギフテッドに対して2因子ではなく4因子を用いた解釈を行うことが望ましいと主張している。

Styck & Watkins（2016）は，限局性学習症の診断を受けた児童生徒を対象にして因子構造を検討している。1-3因子モデル，1次因子モデル，高次因子モデル，双因子モデルを比較した結果，双因子モデルの適合が最も良いことを報告した。データの大部分はgにより説明され，他の因子の信頼性が低いことを報告した。このことから，臨床場面では，FSIQを重視した解釈を行うべきで，それぞれの指標得点の解釈は，測定が正確になされているのかを検討した後でのみ可能だと主張している。

Styck & Watkins（2017）はADHD児でもWISC-IVの因子構造を検討している。1-3因子モデル，

1次因子モデル，高次因子モデル，双因子モデルの比較を行い，高次因子モデルが最もデータをよく説明することを報告している。結果からADHD臨床群への解釈の際には，やはりFSIQまでの解釈にとどまるべきことを推奨している。

ここまでは全て階層性を考慮したモデルが選択されていたがgを想定しない1次因子モデルを支持する研究もある。Decker et al.（2014）はアメリカ版WISC-IVの標準化サンプルを対象に，双因子モデルから各グループ因子を除いたモデルを比較しグループ因子の持つ情報量の多さを主張した後，

1次因子モデル，高次因子モデル，双因子モデルの比較を行い，1次因子モデルを支持する報告をしている。その結果から，臨床家は検査から得られる介入への示唆を重視するべきとする立場にたち，

FSIQの解釈のみに焦点を当てるのではなく，指標得点レベルでの解釈を行うこと推奨している。

(8)

3.2．ω, ω_h, ECV について

高次因子モデルや双因子モデルが選択されていた研究ではモデルをベースとした信頼性係数や ECVが報告されていた。論文中で報告されていたもの，および報告されていない場合には因子負荷量から（1）（2）（3）式を用いて計算したものを表2に示した。

ωについては，どの研究でもgが最も高かった。下位尺度では，VCが高い傾向にあり，WM, PS については低い傾向が見られた。また，下位尺度におけるωとω_hを比べると多くの研究で2つの差が顕著であり，ここからは下位尺度得点が意味あるグループ因子を反映していない可能性が示唆された。ECVについては，共通因子によって説明される分散の大部分をg が占めていることが明らかであり，WISC-IVは高い一次元性を持っていることが示唆される結果となった。グループ因子では，

VCとPSがPRとWMに比べて若干高い傾向が見られた。

ここまでの結果をまとめると，WISC-IVの因子構造の研究では階層性を考慮したモデルが支持される傾向にあり，2つのモデルの比較では双因子モデルが支持されていた。また，信頼性に目を向けると下位尺度についてはωが高く，ω_hが顕著に低い研究が多く，下位尺度得点はグループ因子を反映していない可能性が示された。ECVからは，共通因子による分散の大部分はgが説明し，領域固有の能力（グループ因子や1次の独自因子）が説明できる割合はわずかであった。それらの結果から臨床使用においては，gを測定しているFSIQの使用については推奨できるものの，VCIやPRIなどの 4つの指標得点の解釈には慎重になるべきと警鐘を鳴らすものが多いことが明らかとなった。

４．日本版 WISC-IV のデータを用いたモデルの検討

本節では，日本版WISC-IVにおいて，前説で得られたレビューと同様の傾向が見られるかを検討する。『理論・解釈マニュアル』のp. 49に記載の相関係数行列を用いて，1次因子モデル，高次因子モデル，双因子モデルの3つを比較した。サンプルサイズは標準化サンプルの1285を，推定法には最尤推定法を指定した。分析は全て，R ver 3.5.1（R Core team, 2018）を用いて行い，CFAには追加パッケージであるlavaan ver 0.6-3（Rosseel, 2018）を用いた。

表 2　各研究で報告されたω, ω_h, ECV

ω ω_h ECV（％）

研究 g VC PR WM PS g VC PR WM PS g VC PR WM PS

Watkins （2010） .93 .90 .82 .73 .73 .86 .19 .12 .12 .39 75 8 5 3 10

Devena et al. （2013） .94 .90 .82 .80 .78 .87 .22 .13 .20 .27 76 8 4 5 7

Nakano & Watkins （2013） .87 .81 .70 .60 .59 .78 .22 .29 .05 .28 69 10 11 2 8

Watkins et al. （2013） .90 .87 .78 .68 .64 .80 .23 .14 .33 .38 64 9 9 9 10

Canivez （2014） .92 .88 .84 .64 .70 .84 .26 .14 .10 .33 72 10 7 2 8

Styck & Watkins （2016） .85 .82 .70 .54 .67 .67 .48 .17 .23 .53 48 22 8 6 16 Styck & Watkins （2017） .88 .79 .70 .60 .71 .78 .34 .09 .12 .37 67 15 3 4 12

(9)

表3に各モデルのデータへの適合度を示した。CFI, RMSEA, SRMRのいずれの指標においても，

Hu & Bentler（1999）が示す基準（CFI＞.95; RMSEA＜.06; SRMR＜.08）に照らして全てのモデルが十分に良い適合を示していた。モデル間の適合度を比べると1次因子モデルと高次因子モデルの適合は大きく違わない一方で，双因子モデルは他2つのモデルに比べて良い適合を示していた。

表4には高次因子モデルにSL変換を行なったものおよび双因子モデルの因子負荷量，信頼性係数，

ECVを示した。2つのモデルの全体的な傾向は似ていたが，一部の下位検査では因子負荷量に違いが見られた。例えば「知識」の下位検査では，どちらのモデルでもVCへの負荷に比べて，gへの負荷が高いが，双因子モデルではその比が顕著に異なっていた。また「語音整列」および「算数」においては2つのモデル間でgの影響とグループ因子の影響との比の違いが顕著であった。

表 4　高次因子モデル（SL変換）と双因子モデルにおける下位検査の因子負荷, 信頼性係数, ECV 高次因子モデル（SL変換）双因子モデル

検査 g VC PR WM PS e g VC PR WM PS e 類似 .608 .381 .485 .634 .317 .498 単語 .666 .417 .382 .634 .517 .330 理解 .556 .348 .570 .501 .485 .514 知識 .646 .405 .419 .704 .273 .430 語の推理 .592 .371 .513 .606 .329 .524 積木模様 .528 .316 .622 .546 .262 .633 絵の概念 .404 .241 .779 .406 .217 .788 行列推理 .579 .346 .545 .558 .400 .528 絵画完成 .515 .308 .639 .490 .378 .617 数唱 .597 .245 .583 .571 .331 .565 語音整列 .625 .256 .544 .595 .575 .315 算数 .673 .276 .470 .724 .051 .474 符号 .395 .610 .472 .355 .720 .355 記号探し .419 .646 .408 .441 .560 .492 絵の抹消 .253 .391 .783 .257 .387 .784 ω .899 .847 .683 .724 .698 .903 .852 .685 .768 .704 ω_h .795 .239 .180 .104 .492 .793 .239 .194 .157 .504

ECV （％） 66.7 10.9 5.5 3.0 13.9 63.0 11.0 5.9 6.2 13.7

表 3　各モデルのWISC-IVデータへの適合度

モデル χ² df CFI RMSEA SRMR

1次因子モデル 301.833 84 0.966 0.045 0.031 高次因子モデル 313.262 86 0.964 0.045 0.033 双因子モデル 183.159 75 0.983 0.034 0.026

(10)

2つのモデル間での因子負荷量の差には，2節で取り上げた比率の制約の問題が大きく関わっている。例えば，WMを測定する下位検査では，高次因子モデルにおいてgとWMの因子負荷量の比が

「数唱0.597/0.245＝2.44; 語音整列0.625/0.256＝2.44; 算数0.673/0.276＝2.44」と，グループ因子内の等比率の制約が課されているが，双因子モデルにおいてはその制約がなく自由に推定されるためこのような差が生まれている。双因子モデルにおける「算数」の検査で因子負荷量間に極端な差が生じているのは，おそらく，この下位検査がワーキングメモリー特有の能力だけでなく，様々な要因が関与した能力を測定していることが背景にあると考えられる（なお，Keith et al. （2006）などが取り上げるように「算数」がそもそも何を測定しているかについては以前より議論の対象となってきた）。

ωとω_hに注目すると，g以外の下位尺度においては2つの差が顕著であった。ここからは，前節でレビューした研究と同じように，下位尺度得点が意味あるグループ因子を反映していると解釈するのは難しいことが示唆される。下位尺度の中ではPSのω_hが他に比べて高かった。ECVに目を向けると，若干の数値の違いはあるものの2つのモデルの傾向は同様であった。すなわち共通因子で説明される分散のうちの60-70％をgが，10％強をVCとPSのそれぞれが，PRおよびWMが10％未満を説明していた。これらの傾向は前節で検討した海外における報告と同様のものであった。

まとめ

本稿は，WISC-IVの因子構造の研究において近年よく用いられる双因子モデルの妥当性を検討するために，CFAを用いて因子構造の検討を行う研究についてのレビューを行なった。その結果，多くの研究が双因子モデルを支持していることが明らかとなった。また，それらが日本版WISC-IVにおいても妥当であるかを検討する目的で，『理論・解釈マニュアル』記載の相関行列を用い1次因子モデル，高次因子モデル，双因子モデルを比較した結果，双因子モデルがデータに最もよく適合していた。信頼性係数，ECVにおいても海外での研究とおおむね同様な傾向が見られた。

本稿の分析の結果から，WISC-IVの利用について言えることは2点ある。1点目は，3節，4節での結果を踏まえると，WISCの因子構造の検討においてこのモデルを無視することはできないだろうということである。繁桝・リー（2013）のように，日本版WISC-IVにCFAを用いる研究も若干行われているが，双因子モデルは含まれていない。今後は，検査の因子構造を検討する研究においても他の外的変数との関連を探る研究においても，分析対象にこのモデルを含めていくべきであろう。

2点目はWISC-IVの臨床的利用においては，FSIQの解釈を重要視するべきで，指標得点の影響を

過大視することは避けるべきだということである。WISC-IVの解釈において指標得点のパターンから意味を読み取ることが重視されるあまりFSIQについての解釈がなおざりになった報告書も時折見られる。しかし，レビューした研究の多くや本稿の分析が示すように，各指標得点が領域固有の能力を反映している程度は限定的である可能性がある。したがって，まず最も信頼できる数値であるFSIQ を解釈した上で，指標得点の解釈の際には，指標得点やそのプロフィールパターンから過剰に意味を読み取る危険性を考慮しつつ，関係者からの聞き取りや行動観察など多様なデータを組み合わせてク

(11)

ライエントの主訴に対する仮説を構築することが望まれる。

最後に本稿の課題を述べる。本稿で行なった日本版WISC-IVの分析は，標準化サンプルの全年齢のみを対象としたものであり，部分的なことである。年齢により因子構造が変わるか，基本10検査のみで変わるか等を詳細に検討し，本研究の結果がどの程度の一般性を持つのかの確認を行うべきであろう。また，WISC-IVが発達障害を含む多様な臨床群に適用されていることを考えると，レビューした研究と同じように多様な臨床群のサンプルで日本版WISC-IVの因子構造を検討していく必要もある。そうすることで，科学的により妥当な心理検査の活用が可能になると考えられる。

注⑴ Brunner et al.（2012）も指摘しているが，ω_hはもとは一般因子にのみ適用され，尺度得点全体に対する信頼性として扱われていた。下位尺度への適用に際し用語の混乱を避けるためRodrigues et al.（2016）は尺度全体に関するωに対して，下位尺度にはグループ因子名の添字をつけてω_VCのように表記している。ω_hも同様で，下位尺度にはω_h.VCのように表記を分けている。

文献

Benson, N. F., Floyd, R. G., Kranzler, J. H., Eckert, T. L., Fefer, S. A., & Morgan, G. B. (2019). Test use and assessment practices of school psychologists in the United States: Findings from the 2017 National Survey. Journal of School Psychology, 72, 29-48.

Brown, T. A. (2006). Confirmatory Factor Analysis for Applied Research. Guilford Press, New York.

Brunner, M., Nagy, G., & Wilhelm, O. (2012). A tutorial on hierarchically structured constructs. Journal of Personality, 80(4), 796-846.

Canivez, G. L. (2014). Construct validity of the WISC-IV with a referred sample: Direct versus indirect hierarchical structures. School Psychology Quarterly, 29, 38-51.

Decker, S. L., Englund, J. A., & Roberts, A. M. (2014). Higher-order factor structures for the WISC-IV: Implications for neuropsychological test interpretation. Applied Neuropsychology: Child, 3, 135-144.

Devena, S. E., Gay, C. E., & Watkins, M. W. (2013). Confirmatory factor analysis of the WISC-IV in a hospital referral sample. Journal of Psychoeducational Assessment, 31, 591-599.

Gignac, G. E. (2016). The higher-order model imposes a proportionality constraint: That is why the bifactor model tends to fit better. Intelligence, 55, 57-68.

Holzinger, K. J., & Swineford, F. (1937). The bi-factor method. Psychometrika, 2(1), 41-54.

Hu, L. T., & Bentler, P. (1999). Cutoff criteria for fit indexes in covariance structure analysis: Conventional criteria versus new alternatives. Structural Equation Modeling: A Multidisciplinary Journal, 6(1), 1-55.

Keith, T. Z., Fine, G., Taub, G. E., Reynolds, M. R., & Kranzler, J. H. (2006). Higher order, multisample, confirmatory factor analysis of the Wechsler Intelligence Scale for Children-Fourth Edition: What does it measure? School Psychology Review, 35(1), 108-127.

Molinero, C., Mata, S., Calero, M. D. García-Martín, M.B. & Araque-Cuenca, A. (2015). Usefulness of WISC-IV in determining intellectual giftedness. The Spanish Journal of Psychology, 18, 1-10

Nakano, S., & Watkins, M. W. (2013). Factor structure of the Wechsler Intelligence Scales for Children–Fourth Edition among referred Native American students. Psychology in the Schools, 50, 957-968.

R Core Team (2018) R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. https://www.R-project.org/.

Reise, S. P. (2012). The rediscovery of bifactor measurement models. Multivariate Behavioral Research, 47(5), 667-

(12)

696.

Reise, S. P., Moore, T. M. & Haviland, M. G. (2010). Bifactor models and rotations: Exploring the extent to which multidimensional data yield univocal scale scores. Journal of Personality Assessment, 92, 544-559.

Rodriguez, A., Reise, S. P., & Haviland, M. G. (2016). Evaluating bifactor models: Calculating and interpreting statistical indices. Psychological Methods, 21(2), 137-150.

Rosseel, Y. (2018). lavaan: An R Package for Structural Equation Modeling. Journal of Statistical Software, 48(2), 1-36.

http://www.jstatsoft.org/v48/i02/.

Schmid, J., & Leiman, J. M. (1957). The development of hierarchical factor solutions. Psychometrika, 22, 53-61.

繁枡算男・ショーンリー（2013）．CHC理論と日本版WISC-IVの因子構造―標準化データによる認知構造の統計学的分析―．WISC-IVテクニカルレポートRetrieved from https://www.nichibun.co.jp/documents/kensa/

technicalreport/wisc4_tech_8.pdf

清水和秋・青木貴寛．（2015）．Bifactor構造とBifactor回転法―自尊感情尺度を対象として―．関西大学社会学部紀要，46（2），25-43.

Styck, K. M., & Watkins, M. W. (2016). Structural validity of the WISC-IV for students with learning disabilities.

Journal of Learning Disabilities, 49, 216-224.

Styck, K. M., & Watkins, M. W. (2017). Structural validity of the WISC-IV for students with ADHD. Journal of Attention Disorders, 21, 921-928.

Watkins, M. W. (2010). Structure of the Wechsler Intelligence Scale for Children-Fourth Edition among a national sample of referred students. Psychological Assessment, 22, 782-787.

Watkins, M. W., Canivez, G. L., James, T., James, K., & Good, R. (2013). Construct Validity of the WISC–IV^UK With a Large Referred Irish Sample. International Journal of School and Educational Psychology, 1, 102-111.

Wechsler, D. (2003). Wechsler Intelligence Scale for Children-Fourth Edition Technical and Interpretive Manual.

Psychological Corporation, San Antonio. 日本版WISC-IV刊行委員会訳編（2010）．日本版WISC-IV理論・解釈マニュアル．日本文化科学社．

Yung, Y. F., Thissen, D., & McLeod, L. D. (1999). On the relationship between the higher-order factor model and the hierarchical factor model. Psychometrika, 64(2), 113-128.

双因子モデルを用いた WISC-IV の因子構造の研究

双因子モデルを用いた WISC-IV の因子構造の研究

海外における研究動向と日本版の予備的分析

小野島 昂 洋

小野島　昂　洋