一般化プロクラステス解法による多群の異種多次元 解の比較
その他のタイトル Generalized Procrustes Analysis for Comparing Different Multidimensional Solutions from Multiple Subject Groups
著者 柴田 満
雑誌名 関西大学社会学部紀要
巻 19
号 1
ページ 205‑237
発行年 1987‑11‑30
URL http://hdl.handle.net/10112/00022695
一般化フ゜ロクラステス解法による多群の異種多次元解の比較
柴 田 満
Generalized Procrustes Analysis for Comparing Different Multidimensional Solutions from Multiple Subject Groups
Mitsuru Shibata
abstract
The purpose o f t h i s study i s to develop m a t h e m a t i c " a l formulations and a l s o computer programs o f generalized Procrustes a n a l y s i s f o r comparing the multidimensional solutions such a s factor a n a l y s i s , component a n a l y s i s o f correlation o r covariance matrix and multidemensional scalings according t o the methods proposed by G o w e r , Ten Berge so that the method can be applicable t o different multivariate solutions from the different many C a t l e a s t two o r more) groups.
The author made a modification i n order t o promote interpretability and comparability among multidimensional s c i l u t " i o n s obtained after central dilations, translations and r o t a t i o n ̲ s . H e proposed t o p u t f o r t h e first time t h e inductive criterion point a s a target upon t h e . factor analytic space t o which other solutions would be shifted to g e t maximun approxi‑
mations i n a l e a s t square sense because reserchers are very f a m i l i a r with the type of solution consisted of correlation coefficients between coordinates and observed variables.
The proposed method i s a d o p t e d ‑ t o three types o f analyses : factor analysis o f correlation matrix, component analysis o f correlation .matrix and component analysis of covariance matrix of the YG Personality Questionnaire administered t o Japanease highschool students.
Key words : P r o c r u s t e s a n a l y s i s , f a c t o r a n a l y s i s , component a n a l y i s , c o n s t r a i n t o f f a c t o r a x e s , YG P e r s o n a l i t y I n v e n t o r y .
抄 録
この研究の目的は,異なる多くの(すくなくとも2群かそれ以上)集団からの異種の多変量解 に適用されうるように,
Gower
ゃTenBergeによって提案された方法に従って,因子分析法,
相関行列や共分散行列の成分分析法,多次元尺度法で得られる多次元解を比較するための一般化 プロクラステス法の数学的展開とコンヒ°ュータプログラムの開発をおこなうことである。
著者は,座標空間全体としての拡張・短縮,座標原点の移動および回転の後に得られた多次元 解の間の解釈可能性と比較可能性を促進するための解法の修正を試みた。そして,研究者が,相 関係数から成る型の解にひじょうに親しんでいるという理由で,まず最初に,因子分析的な空間 を標的として演繹的基準点を置き,その他の解を,最小二乗法的意味において最大近似を得るよ うに変換することを提案した。
提案された方法では,
3
つの型の分析を採用した。すなわち, 日本の高校生に施行されたYG
性格検査の資料の相関行列の因子分析,相関行列の成分分析,そして共分散行列の成分分析である。
キーワード:プロクラステス法,因子分析法,成分分析法,因子軸の固定,
YG性格検査
‑205‑
〔 要 約 目 次 〕
〔問 題〕 ・・・・・・・・・・...........................................................................................・
( 2 0 7 )
(一般化プロクラステス解法は,異種解析かつ多群の多変量解析解の比較を可能とするが,
この一般化された比較の方法論と実質科学的解釈の相違について指摘した。)
〔方法〕・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・
・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ( 2 1 0 ) 1 . Gowerの解法
2 . Ten Bergeによる修正解法とその問題点 3 .
本稿における修正解法とその立場(相関係数を要素とする解を標的とする解法の提案と解法の手順)
4 .
単純構造の原理による回転(帰納基準の
2
型と演繹基準の3
型の特徴と問題点)〔結果と解釈〕 ・・・・・....................................................................................・・・・・・・
( 2 2 1 )
1. 拡張・短縮のスカラーの数値例Table2
本稿で紹介された3
種の解法による拡張・短縮のスカラーの数値例2 .
相関係数から成る解の特徴Table3
分散共分散行列に基づく成分分析解Table4
本稿の修正解法に基づく確認システム施行後の解相互間の比較〔考 察〕 ・・・・・・....................................................................................・・・・・・・・・・・・
( 2 2 6 )
1. 異種解析かつ多群間のプロクラステス解法の諸問題2 .
本稿の修正解法とその問題点3 .
将来の展望〔異種解析かつ多群間解法システムのプログラム〕••….................. …...... ・・・・・・・・・・・・・・・・(
2 2 7 )
〔参考文献〕・.................................................................................................・
( 2 3 6 )
〔 問 題 〕
現代心理学,とりわけ人格心理学の領域では,気質・価値観などの構成概念の構造解明とその 実質科学的解釈を行う一連の研究が,様々な多変量解析法を用いて広く行われるようになってき た。このような状況のもとで,多変量解析法の研究者は,データの特性や分析の目的に応じて,
新技法の開発や従来からの優れた技法の改良を相次いで行い,多様な構成概念の構造解明に尽力 している。また,心理学者は,この多変量構造の実質科学的解釈を行い,人間の実際的経験との 検証的対比に基づいて構造を意味づけている。この解折と解釈は,研究を行う場合の一連の過程 ではあるが,純粋な技術的問題である解析法と研究者の主体的な選択的判断にゆだねられる解釈 の問題とは,やはり一線を画すものである。もちろん,心理測定家も,この解釈の側面に無関心 であったわけではない。たとえば,因子分析法に携わる心理測定家は,様々な因子軸の回転法を 提案し,実質科学的解釈を可能なかぎり容易ならしめるように努力してきたところである。
われわれは,この因子分析法における因子軸の回転問題を中心に,複雑な様相を示す多次元空 間の座標軸体系を確認する問題にとりくんできた。この因子軸の回転問題の発展史は,単純構造 の原理
( p r i n c i p l e o f s i m p l e s t r u c t u r e )
に基づく解法群と因子対応の最大近似(maximum a p p r o x i m a t i o n )
をめざす所謂プロクラステス法に属する解法群の2
つの流れに大別される。前 者の単純構造の原理に基づく解法群は.当面する因子分析解の構造の解釈可能性を高める目的で 開発され,単純構造をいかなる基準(Varimax
基準などを含むOrthomax
基準,Promax
基 準など)で達成するのが望ましいかについての議論が行われてきた。したがって,この原理に基 づく回転の基準は,あくまでも単一の因子解を手がかりとするものであり,2
群あるいはそれ以 上の多群の比較を念頭においたものではない。換言すれば,われわれが,この原理に基づく解法 を用いて,同一変量から成るテストバッテリーに基づくいくつかの初期因子解をそれぞれ回転し ても,これらの最終解の構造がかなり異なることが多々あると考えられるのである。一方,後者 のプロクラステス法に属する解法群は,因子対応あるいは各種解析解の対応の最大化をはかるも のであり,Mosier( 1 9 3 9 )
以来,最小二乗解の達成を競って多数の解法が開発されてきた。この 回転法は,解析解の比較可能性を高めることを直接の目的としており.2
群あるいはそれ以上の 多群の解の比較を最大限に可能ならしめることができるが,この最大化は必ずしも解釈の容易性 を保証するものではない(辻岡・柴田1 9 8 3 ,
柴田・辻岡1 9 8 4
参照)。以上のように,
2
つの原理に基づく各種の回転法は,それぞれの特徴を主張しながら,発展継 承されてきた。筆者らの一連の論文(辻岡•柴田 1983, 柴田・辻岡1 9 8 3 , 1 9 8 4 ,
柴田1 9 8 5 , 1 9 8 6 , 1 9 8 7 )
は,これら回転法の特徴をふまえて,第一に,プロクラステス変換によって,対応する解 析解の類似度の最大化をはかり,比較可能性を追求した上で,第二に,単純構造解のもたらす実 質科学的な解釈の容易性を追求するものであった。また,この際の一貫した目標は,類似度の最 大化を損うことなく単純構造への回転を行い,しかも,これらの回転が,すべての集団の分析結‑207‑‑
果において同一の座標軸間相関を与えるように配慮するものであった。また,これと同時に,こ の同一の座標軸体系上での実質科学的な比較を可能にするような確認システムを構成することで あった。これらの目的を実現するためには,第一段階として,プロクラステス変換の対象となる 解析解(標的を設定する場合はそれも含めて)をひとまず直交解に限定し,この前提のもとで,
いずれかの直交フ゜ロクラステス変換を施し,まず,直交座標軸体系上での対応変量ベクトル頂点 間のユークリッド距離の最小化をはかる。そして,第二段階として,これらの頂点間の距離を維 持固定しながら,同一の回転行列を用いて,単純構造への直交あるいは斜交回転を行うことによ
って,同一の座標軸体系を導くといった一連の手順が有効であることが検証された。
そして,このような構想のもとに,辻岡・柴田
( 1 9 8 3 )
は,2
群の因子負荷行列の比較を行う ための確認システムを構成し,また,柴田・辻岡( 1 9 8 3 )
は,2
群の因子得点行列の比較を行う 場合においても上記の構想を適用した。さらに,柴田・辻岡( 1 9 8 4 )
は,この因子負荷行列と因 子得点行列の両面から因子の比較を行う場合の問題点を整理するとともに,2
群の因子負荷行 列あるいは因子得点行列を同時に回転する正準回転型の確認システムにも言及した。これらの方 法は,いずれも2
群の因子分析の諸結果を対象にしたものであったが,現実に存在する様々な資 料や種々の多変量解析法による分析結果を比較するためには,さらに一般化されたフ゜ロクラステ ス解法に基づきながら,上記の確認システムの構想を統一的に実現する方法論が必要となってき た。このような目的のもとに,柴田
( 1 9 8 5 , 1 9 8 6 , 1 9 8 7 )
は,多群間の因子解同士の比較(柴田1 9 8 5 )
や2
群の異種解析間の比較(柴田1 9 8 6 , 1 9 8 7 )
を行うことを主眼として,確認システム の機能の拡張をはかってきた。本稿は, これらの確認システムをさらに一般化し,『異種解析解 の間の比較でかつ多群間の解を比較する場合」を対象として,上記の構想にそった実質科学的に 活用可能な確認システムの構成を企図するものである。また,このような構想に基づく一連の確 認システムはTable 1
のように整理された。このような異種解析かつ多群の場合に用いられる直交プロクラステス解法を最初に提起したの は,
Gower( 1 9 7 5 )
であった。彼の解法は,その分析手順を概観すれば明らかなように,2
群の 異種解析間の分析をめざしたSchonemann & C a r r o l l ( 1 9 7 0 )
の解法と多群間の因子解同士の 比較をめざしたK r i s t o f & Wingersky ( 1 9 7 1 )
の解法とを結合した方法と考えられる。すなTable 1
碓認システムの位置づけ~~
」巴 因子分析間の比較 異種解析間の比較2群間の比較 辻岡・柴田
( 1 9 8 3 )
柴田( 1 9 8 6 )
柴田・辻岡( 1 9 8 3 )
柴田( 1 9 8 7 )
柴田・辻岡( 1 9 8 4 )
多群間の比較 柴田
( 1 9 8 5 )
本稿の方法〔柴田
1 9 8 7 b
〕わち,多群の異種解析解のそれぞれについて,
Schonemann& C a r r o l l
の解法において取り入 れられた座標空間全体としての拡張・短縮( c e n t r a ld i l a t i o n )
と座標原点の移動( t r a n s l a t i o n )
と従来からの座標軸の回転の 3種の変換の組み合わせを許容するプロクラステス変換を考えた上 で,この回転と拡張・短縮の変換パラメーターの推定を行うにあたって,
K r i s t o f& Wingersky
の多群間解法の拡張法を用いるものである。 しかし, 柴田( 1 9 8 5 )
において詳述したように,この
Gower
の解法において大きな役割を担うK r i s t o f& Wingersky
の解法における推定方 法は, 後にTenBerge ( 1 9 7 7 )
によってさらに改良されている。また, この際,Ten Berge ( 1 9 7 7 , p p . 2 7 4 ‑ 2 7 5 )
は,このGower
の解法についても言及し,同一の理由,すなわち必要条 件の強化の必要性から,この解法の改良の可能性を示唆している。本稿では,上記のような発展史をふまえ,まず,このような異種解析かつ多群の解法において も,先のプロクラステス変換と単純構造への回転の結合や同一の座標軸体系上での比較が行いう ることを示した上で, この
Gower
の解法とTenBerge
の解法および本稿独自の修正解法を 対比しながら検証を進めることとした。また,この比較は,方法論のみならず,実際の資料を用 いた数値例比較によっても行われる。そして,この比較にあたっての基本方針は,プロクラステ ス解法を施す基本的な目的が,先述したとおり,解析解の比較を最大限に容易ならしめることに あることをふまえて,異種解析かつ多群の複雑な確認システムの構成にあたっても,この基本目 的を最大限に実現する方法を確立することにある。すなわち,これまで述べてきた例でも明らか なように数理論的な精緻さが,必ずしも実質科学的な解釈を容易ならしめるわけではなく,数理 論と実質科学の両面からみて整合的な方法を用いることが望ましい。とりわけ,異種解析かつ多 群の場合には,これまでにない難問を解決していかなければならない。たとえば,2
群の異種解 析間の比較の場合には,柴田( 1 9 8 6 , 1 9 8 7 )
の数値例によって検証されたように,因子分析解を 標的とすることによって,実質科学的に解釈しやすいプロクラステス解を得ることができたが,多群間の比較の場合には,より複雑な配慮が必要となる。また,様々な解析解を対象とする
Gower
の解法やTenBerge
の修正解法では,座標空間全体としての拡張・短縮を司るスカラ ーを最小二乗法的に繰り返し推定することによって,この標的の問題に対処しているが,このよ うな推定に任せた解が,常に実質科学的に解釈しやすい解になるとは考えにくい。一方,実質科学者,とりわけ心理学者は,様々な構成概念を間隔尺度上での得点としてとら ぇ,それらの相対的な関連の強弱に基づいて相互関係を考えるという伝統的な研究方法の特質も 手伝って,古くから相関係数に慣れ親しんできた。そして,因子分析法が,今日でも,多変量解 析の中で主要な地位を占めつづけている理由も,この方法の解が,因子軸と各変量との相関関係 によって表現されることと無縁ではない。そして,なによりも多くの因子分析家によって発展継 承されてきた単純構造の原理による回転は,実質科学的に解釈しやすい因子解,すなわち,因子 得点という合成変量をあらわす因子軸と各変量の相関係数を導いてくれる。
本稿では,このような視点から,異種解析かつ多群間のプロクラステス解法をとらえなおし,
‑209‑
座標軸の拡張・短縮にあたっても,相関係数的に取り扱える指標の導入を念頭において,新たに 独自の方法を提案することとした。
また,本稿では,同じく実質科学的な銀点から,
Gower
の解法とTenB e r g e
の修正解法を 比較し,両者の解法手順の相違が,実際の資料の分析にあたって,いかなる相違をもたらすかに ついても検証した。さらに,本稿における主要な目的の1
つは,異種解析かつ多群間のプロクラ ステス解法においても,これまでの単なる多群間の因子分析解あるいは2
群の異種解析解の間の 場合と同様に,同一座標体系上で比較を行うという実質科学的な目的を達成することにあり,こ の目的に対しても,プロクラステス解法や単純構造への回転に様々な工夫を施した。上記のとおり,本稿は,一連の確認システムの拡張問題の総整理を企図するものであり,取り 扱える解析法の種類と集団の数において,最も一般化された確認システムの構成をめざすもので ある。
〔 方 法 〕
異種解析かつ多群間のプロクラステス解法は,問題において述ぺたように,
Gower
によって 提唱され,TenBerge
によって改良修正が施された。TenB e r g e
の解法の主な修正点は,多 群間解法における回転行列の繰り返し推定にともなう必要条件の強化と,座標軸の拡張・短縮の ためのスカラーの設定にともなう条件の改良にあった。しかし,このGower
の解法およびTen B e r g e
の修正解法の企図するところは,あくまでも数学的整合性をもった最小二乗解を導くことにある。換言すれば,彼らの解法は,その結果としての多次元構造が実質科学的に解釈しやすい 有効な解であるか否かについては全く関知していないのである。
本稿は,この数学的整合性を可能なかぎり維持しながら,問題で述べた基本構想に従って,彼 らの解法を再吟味し,実質科学的に有効な結果を導くための確認システムの構成にとりくもうと するものである。本稿における改良は,具体的には,まず座標軸の拡張・短縮を操作するスカラ ーの解を求めるにあたって,
Gower ( 1 9 7 5 , p p . 3 6 ‑ 3 7 )
が示した2
つの方法を再吟味し,両者 の得失をとらえなおすことによって行われる。すなわち,Gower
は,多群間問題における2
群 の解法という特殊なケースにおいて,標的の変更にともなう拡張・短縮のスカラーの数学的不整 合性を問題として,両者のうち一方の方法を放棄した。しかし,実質科学的視点から,両者の方 法をとらえなおすとき,この放棄された側の方法の有効性が再評価され,新たな視点に基づく確 認システムの構成が可能であると考えるのである。1 . Gower
の解法とその問題点Gower
の解法は,当時すでに開発されていた2
つの解法,すなわち,2
群の異種解析解の間 の比較を行うためのSchonemann & C a r r o l l
のプロクラステス解法と多群の因子解相互の比校を行うための
K r i s t o f & Wingersky
のプロクラステス解法を基礎にして開発された方法で ある。すなわち,異種解析間の比較を行うには,Schonemann & C a r r o l l
が示した座標空間の 拡張・短縮や原点移動が必要であり,多群間の比較を行うには,最小二乗解としての必要条件を 満たすK r i s t o f & Wingersky
の繰り返し推定法が必要であることを考え合わせ,この2
つの 目的を同時に達成する方法を提案したのである。したがって,Gower
によって構成された誤差 平方和を示す関数も,この2つの構想を組み合わせた形式で示された。すなわち, K個の群のそ れぞれの直交解析解(いずれもnxm
次,n
は変量数,m
は解析次元数;以下同様)を,それ ぞれA i ,A 2 , . .
…・,Ak
とし,mxm
次の疸交プロクラステス回転行列を,それぞれT i , T 2 , . . .
…,
T k ,
座標空間全体としての拡張・短縮のためのスカラーを, それぞれd i ,
必……,d k ,
座標 原点の移動を司るベクトル(mx 1
次 ) を そ れ ぞ れ C1, C2, • …••,らとすると,第 i 群と j 群 についての誤差行列E ; 1(nxm
次)は,(1)
Eij=(d;A
ぶ ー1
ぶ)ー( d
心T1‑1
む)とあらわされ,さらに,各群の組み合わせについての誤差平方和を示す関数
/ 1
は, (2) /戸 ~tr(E;/E 1 1 )
•<j
とあらわされる。 ここで, (1)式の
l n ( n x 1
次)はすべての要素が1
のベクトルである。なお,Gower は, (2)式の誤差平方和の表現として,主積率,すなわち, ~tr(E;1E;/) を用いて以下の ヽ
< j
展開を行っているが,本稿では,従来のプロクラステス問題の伝統的な手法に準じて従積率を用 いた。また,各種の行列やベクトルの表記法も,柴田
( 1 9 8 5 , 1 9 8 6 )
の表記法に統一した。この(2)式の誤差平方和の最小化にあたっては,従来の直交フ゜ロクラステス回転と同様に, K個 の回転行列のそれぞれについて正規直交条件を考慮しなければならないばかりでなく,さらに座 標の拡張・短縮のためのスカラーめに対しても,なんらかの制約条件を加えなければならない。
なぜならば,この解法は,すべての群の座標空間に拡張・短縮を想定するため,すべての群につ いて
d ;を 0
とおけば,( 2 )
式は最小値となってしまうからである。このような無意味な解が求ま ることを防ぐため,Gower
は2
つの方法を提案している。第一の方法は,任意の1
群を選び,この群の解析解を標的として,その他すべての群の解析解の座標空間にそれぞれ拡張・短縮の操 作を施し,各スカラー
d ;を固定してしまう方法である。
しかし,多群間問題の特殊例としての2
群間のプロクラステス解法を想定すれば明らかなように,この方法では,A2
を標的として,A 1
に拡張・短縮の操作を施して求められたスカラーふが,A1
を標的として,ムに拡張・短 縮の操作を施して求められたスカラーd 2
の逆数とはならない。Gower
は, このような問題点 を指摘した上で,第二の方法として,スカラー山に,(3)工
d ; 2 t r ( A ; ' A ; ) = : E t r ( A / A ; )
i=l i=l
という条件を設け,回転行列を求める際の
K r i s t o f & Wingersky
型の繰り返し推定の中に,このスカラー山の推定を組み込む方法を提案した。 しかし,この後者の方法を実質科学的な観
点からとらえなおすとき,このような数理論的整合性が必ずしも解釈しやすい分析結果を導くと は考えにくい。
そこで,本稿では,
Gower
が放棄した第一の方法に再び着目し,第二の方法との比較を通じ て,座標空間の拡張・短縮のためのスカラーd 1
の解法について新たな立場を示したいと考えて いる。すなわち,本稿における基本的な立場は,以下のようなものである。まず,実質科学的な 視点から,先の第二の方法をとらえなおすとき, スカラーd 1
の推定を繰り返し推定に任せる方 法が,必ずしも解釈しやすい解を導くとはかぎらない。様々な単位で測定され,種々の解析方法 で分析された多様な解の比較を想定する異種解析かつ多群の解法において,このような推定法を とることは,一般に,大きな単位をとる座標空間を短縮し,小さな単位をとる座標空間を拡張し ながら,その調和をはかることを意味する。したがって,繰り返し推定が収束した時点での座標 値は,分析対象となる解析解の単位がすべて類似している特殊な場合を除いて,一般に,いずれ の解析解の座標値の特徴をも維持できない。このような調和的な座標値は,実質科学的に取り扱いにくい解を導く可能性が高く,たとえ数 理論的に望ましい解であるとしても,実質科学的側面からの再検討が必要であると考えるのであ る。本稿では,このような立場から,スカラー
d 1
の解を繰り返し推定にゆだねない方法, すな わち,Gower
が放棄した第一の方法に着目し, 繰り返し推定の場合との数値例比較などを通じ て,2
つの方法の実質科学的特質を明らかにする(後述,方法3
節および結果と解釈1
節〕。これらの諸問題を念頭におきながら,再び
Gower
の解法,すなわち( 3 )
式の条件に基づく解法 に視点をもどそう。まず,Gower
が採用した( 3 )
式の条件は, スカラーd 1
によって拡張・短縮 された後の個々の群ごとの跡和d ; 2 t r ( A ; ' A 1 )
の全群にわたる合計 ((3)式左辺)が, 拡張・短縮 前のそれと等しいことを意味している。これは,各群の解析解ごとの座標体系の無意味な短縮に よって, (2)式の誤差平方和が小さくなることを防ぐとともに,群内の跡和の全群にわたる総和を 一定に保つことによって,群間の誤差平方和のみを純粋に取り扱うことをめざしたものである。このような前提のもとに,
Gower
は,最終的な目的関数を,k k k
(4)
/2=/
げI ; t r { A ; ( T / T ; ‑ 1 ) } +μ1
がtr(A/A; )
ーI ; t r ( A ; ' A ; ) }
i=l ! ~
t=l i=l
= I : : t r ( E ; /
E, 心 +~{ A ; ( T ; ' T ;
ーJ)}+μ{ I : :
がtr ( A i ' A ; )
一I : : tr(A/ A ; ) }
i < i
•=1 i=l i=lと設定した。ここで,
A;(mxm
次)は, 回転行列T ;
の推定に伴なうラグランジュの未定乗数 から成る対称行列であり,各群ごとにA 1 ,A 2 , ……, A k
のK
個,すなわち一km(m+l)
個の未定2
乗数が存在する。また,μ は,スカラー
d ;
の推定に伴なうラグランジュの未定乗数である。ついで,
Gower
は,この(4)式を順次,未知のベクトル C;,回転行列T ; ,
スカラーd ;
につい て偏微分し, (4)式の最小化をはかった。 なお本稿では, この偏微分の過程の詳細は,Gower
( 1 9 7 5 , p p . 3 7 ‑ 3 9 )
にゆずり,これにつづく具体的な推定の手順やその推定に関連した諸問題を中心として,実質科学的観点に焦点をしぽって検討を進めることとした。
まず,原点移動のためのベクトル
C
は,Schonemann & C a r r o l l
の解法においても示され たとおり,最小二乗推定そのものに対しては原理的に無関係であり,結果として,各解析次元の 重心へ座標原点を移動するため,推定法上の誤差を平等に扱えるという利点をもつのみである。Gower
は,多群間問題においても同一の結論に達し,具体的な推定にあたっては,K
群の各解 析解の各次元ごとの原点を,あらかじめ重心へ移動した上で, 回転行列T ;
とスカラーd ;の繰
り返し推定を行う手1
項を示している(Gower, 1 9 7 5 , p . 3 8 , p . 4 3 )
。この際,重心への原点移動 の方法について,Gower
は何もふれていないが,本稿では, 柴田( 1 9 8 6 )
において,Schone‑
mann & C a r r o l l
の解法の幾何学的説明に用いた直交射影子I I . 1 (nxn
次)を用い,この重心 への原点移動を表記しておく。すなわち,各解析次元について,重心へ原点移動された解析解を^
A;(nxm
次)とすると, これは,^
(5)
A;=Il.1A;=(l.‑l.ln'!n)A;
とあらわされる。ここで,
I.(nxn
次)は単位行列,J . ( n
X1
次)は, すべての要素を1
とする ベクトルである。ついで,プロクラステス回転のための正規直交行列
T ,
の解の特徴を考える。まず,T ;
の各 要素について, (4)式を偏微分し,その結果をすべてゼロとおいた式を移項整理すると,最終的に,(6)
T 1 ' ( d 1 . A 、 ' G )= ( d ; 2 A ; ' A
叶A . ; ) / k
となる。ここで,
G(nxm
次)は,(7) G = ‑
k 工
d ; . A 、 T ;
J=l
であり,座標軸の拡張・短縮および回転と各解析次元の重心への原点移動が行われた後の全集団 にわたる重心から構成された座標系である。なお,
Gower
は,先述した理由から, (6)式, (7)式 にあるいはそれ以後の展開において,原点移動を考慮の対象とせず,解析解A;
そのもので表記 しているが,本稿では,解法過程に従って,わかりやすく数式展開を進めるという立場から,上 述のようにA;
を用いた。さて, (6)式において,右辺は明らかに対称であり,したがって,左辺も対称である。そこで,
左辺の回転行列
T ,
を除く行列群を,(8) $戸dふ'G
と表記すれば,従来のプロクラステス解法の場合と同様に,
(9)
T ; ' S 1 = S ; ' T 1
とあらわされ,以下,
S ;
の主積率と従積率の固有行解を,U O ) S ; S ; ' = P 1 4 ; 2 P ; ' U l ) S ; ' S , = Q 1 4 ; 2 Q ; '
‑213‑
として,整理すれば,
( 1 2 ) T ; = P;Q/
となり,目的とするプロクラステス回転行列 Tiが求まる。しかし, (8)式から明らかなように,
固有分解の対象となる
8 1 ( 8 1
単独の場合はEckart‑Young
分解)の中には,未知数を含む行列G
が含まれており,最終的な解を求めるためには,繰り返し推定が必要となる。Gower
は,こ の繰り返し推定の方法として,K r i s t o f & Wingersky
の方法を採用した。この推定法につい ては,先述したとおり,TenBerge
による修正が加えられ, 必要条件の強化がはかられた(後 述方法2
節)。最後に,座標空間の拡張・短縮のためのスカラー
d ;
の解法は,同じく( 4 )
式を,d ;
に関して偏 微分した結果をゼロとおいて,さらに整理すると,( 1 3 ) cd;=k tr(T/ A ; ' G ) / ( k + ‑ l ) t r ( A ; ' A ; )
となり,スカラー叫(以後,他の解法のスカラーと区別するため,
Gower
の解法のスカラーを 叫とする。)が導かれる。この( 1 3 )
式から明らかなように,Gower
の解法におけるスカラーc d ;
は,Schonemann & C a r r o l l
の2
群間解法におけるスカラーd
の解の標的部を,多群の重心 行列G
に置き換えたものになっている。したがって,Gower
の解法におけるスカラーc d 1
に よる拡張・短縮は,多群の重心に対する個々の座標空間の拡張・短縮を意味する。このため,先 述したように,大きな数値単位の布置を示す座標系は短縮され,小さな数値単位の布置を示す座 標系は拡張されることになり,すぺての群の座標系が, 多群の重心行列 G の座標単位に調整さ れることになる。しかし,この重心行列 G の座標単位は, 当面する複数の異種解析解のバラン スの上に成り立った所謂セントロイドであり,なんら実質科学的意図をもつものではない。本稿 では,このスカラーd ;
の推定について, 実質科学的な観点から新たな提案を行う(方法3
節)。 また,Gower
は,実際の叫の推定にあたって,U 3 l
式から未知数μを消去するため,(k+μ)
~A/ A;=k2G'G (Gower 1 9 7 5 , p . 3 9 )
の関係を適用して,U 3 )
式を,ヽ=1
k ' , A ,
U 4 l cd
戸t r ( T / A/G)~tr(A/ A , ) / k t r ( A , ' A , ) t r ( G ' G )
i=1
と表現しなおした。なお, (7)式から明らかなように,
U 4 l
式においても, 重心行列 G にはスカラ ー叫が含まれており,最終的な解を求めるためには,繰り返し推定が必要となる。Gower
は, このc d 1
の推定を,回転行列T ;
の繰り返し推定のためのK r i s t o f& Wingersky
の方法の中 に組み込み,回転行列の推定と並行して繰り返し推定する手順を採用した。しかし,この点につ いても,TenBerge ( 1 9 7 7 , p . 2 7 5 )
は,より適確な代数解の存在を指摘して,解法の修正を試 みた(方法2
節)。このように解法そのものは, (4)式の条件付の目的関数を解くことによって完成するが,実際の コンビュータを用いた数値解析にあたっては, (5)式に基づく原点移動を施した後,さらに(3)式の 条件を満たすために,
(15)~
,lt r ( A ; ' A ; ) =k
•=I
という条件を満たすスカラー Aを求めなければならない。すなわち,このえによって,ふの各 要素を割ったものを,入
A;(nxm
次)とあらわすとき,この各要素の全群にわたる平方和が,k
(16)~tr( ふ’凶)
, ‑ 1 =k
となるように, Aを設定すればよいのである。
Gower
は, このAの求め方に特に言及していな いが,闘 l= ✓t
t r ( A ' ; '
ふ)i=l
とおき,この
i
でふの各要素を割って,入ふを導くのが一般的であろう。ついで,この入ふを もとに,K r i s t o f& Wingersky
の推定を施し,回転行列と拡張・短縮のためのスカラーを求め るのである。また,彼の解法では,このような処理を施し,繰り返し推定によって,プロクラステス変換に関 わる回転行列とスカラーが求まった後,後述するような重心行列の主軸への回転
(Gower 1 9 7 5 , p . 4 3 )
や]によって調整された解析解を元の座標単位へ復元する手順(Gower 1 9 7 5 , p . 4 7 )
についても述べている。本稿のプログラムでも,この主軸への回転や座標単位の復元を行えるように工夫されている。
さらに,
Gower
は,異種解折かつ多群のプロクラステス問題においては,測度の単位がか なり異なる複数の解折解が分析対象となる場合があることを指摘し,その対応策に言及した(Gower 1 9 7 5 , p . 4 4 ) o
彼は,この対応策として,K
群の解のすべてに対して,繰り返し推定に 先立って, (3)式の設定にかわって,それぞれの群ごとに解析解の全要素の平方和を1とする手続きを加えることを提案した。すなわち,すぺての群について,
( 1 8 ) t r ( A ; ' A
か=1
という条件が成り立つように尺度化することによって,各解析解の座標単位が直接繰り返し推定 に影響する事態を防ごうとしたのである。この(18)式の設定に基づいて解法を進めた場合にも,先 の場合と同様元の座標単位への復元が必要となろう。ただし,
U S )
式の手続きから明らかなよう に,復元のためのスカラーの値は各群ごとに異なる。また,仮に復元を行わなければ, (1布式のi
を用いる場合にも,U S )
式の手続きを用いる場合にも,各座標値の値はきわめて小さなものとなり,実質科学的な解釈に支障をきたすであろう。
2 . Ten Berge
による修正解法とその問題点これまでの諸検討でも述べたように,
Ten Berge
の指摘は,解法数理論の本質的な部分に関 わるものではなく,最小二乗推定の精緻化あるいは最適化に関連するものである。したがって,Gower
の解法の問題点の指摘による改良解法自体は,その修正解法として位置づけられる。Ten Berge
は,多群間のプロクラステス問題,とりわけ, 回転問題に重点をおいて取り扱った論文の中で,
K r i s t o f & Wingersky
の繰り返し推定法の改良を提案し,つづいてGower
の 解法にも言及して,同一の理由から,その改良の必要性を主張した。すなわち.多群間問題(柴 田1 9 8 5
参照)においては,プロクラステス回転行列の最小二乗推定にあたって.その十分条件を 満たすことは困難であり,実際的には必要条件を満たすことになるが,Ten B e r g e
による推定 法の改良によって,この必要条件を満たす最小二乗推定の到達度の向上をはかることができると いうのである。換言すれば.彼は.当面,推定の対象となっている任意のi
群の標的行列G;(nxm
次)を,先の(7)式の Gからi
群の行列を除いて,U 9 )
G;=土 J~ 砧 Tiと設定し,この標的行列を用いて繰り返し推定を進めることによって,より精度の高い最小二乗 解を得ることができ,必要条件の強化につながると主張したのである(具体的な推定法について は,
TenBerge 1 9 7 7 , p . 2 7 2 ,
柴田1 9 7 5 , p p . 8 0 ‑ 8 3
参照)。また,
Ten Berge
は,座標空間の拡張・短縮のためのスカラー山の推定法についても修正 を加えた。彼の方法では, まず各群の解析解の従積の組み合せによる跡和から成る行列 V(kxk 次)を,叫
' A 1 ) t r ( A
凶)……t r ( A
凶 )0 1 v‑[ t r ( :
心t r ( i " ' A
交…・ ・ t r C f A , )
!~=~· ( 2 1 ) う:ここ:し::::~:::i三度:~ロご芯X定~-~
V= D. -½VD.-, し こ 三
'C!l式の Vをとあらわした。そして,この V の固有分解における第一固有ベクトルを ~p1(kX1 次), その各 要素を;
PH(i=l, 2 ,
……,k )
とするとき,各群ごとの拡張・短縮のためのスカラー Bdi(以後,他の解法のスカラーと区別するため,
TenBerge
の解法のスカラーを叫iとする。)は,( 2 2 )
砂=(t r ( A k
⑭));! Pu
となることを証明し,繰り返し推定を用いないで解が求まることを示した(証明の詳細は,
Ten B e r g e 1 9 7 5 , p . 2 7 5 )
。しかし,ここでの改良も,
Ten B e r g e
自身が述べているように,数値解析法としては新しい 提案ではあるが,Gower
の解法と全く異った構想に基づく解法手順を示したというわけではな い。すなわち,TenBerge
は,Gower
の 叫 つ い て の( 1 4 )
式を,すべての群の砒jについて同 時に,ベクトル・行列概念を用いて表記しなおすとき,彼の(2 2 )
式と等価の結果を導びくことを指 摘した上で,Gower
の方法では, 収束の性質が未知の繰り返し推定に依存しているのに対し,彼の方法が,正確な解を導くことが保証された安全な方法であるという点を強調したかったので
ある。したがって,
Ten B e r g e
の修正解法も,基本的な原理においては,Gower
の解法と同 様の方法であると考えられる。3 .
本稿における修正解法とその立場座標軸の位置によって,微妙に趣きを異にする多次元構造の実質科学的解釈やその比較を効率 的に進めていくためには,比較を容易ならしめるためのプロクラステス解法の適用によって,数 学的に精緻な解を求めるばかりでなく,その結果が,実質科学者にとって有意味で理解しやすい ものでなければならない。すなわち,問題の章でも述べたとおり,解の類似性は,今日でも,最 終的には研究者が判断し,評価しているわけであり,解析的にどれほど緻密なものであっても,
実質科学者の判断を混乱せしめるような解は望ましくない。
このような立場から,本稿では,心理学者などの実質科学者が,解釈を行うにあたってもっと も慣れ親しんでいると考えられる相関係数から成る座標体系を基軸として設定し,プロクラステ ス変換後の解が,この相関係数あるいはそれに類似する係数値から構成されるような方法を提案 したい。したがって,本稿における修正解法の焦点も,座標軸の拡張・短縮のためのスカラーの 問題にあり,また,発展史の中に位置づけれぱ,先に
Gower
によって放棄された単一標的への 拡張・短縮法を本稿の立場からとらえなおし,積極的に実質科学的意味づけを行おうとする立場 に立つものであるっ先述したとおり,
Gower
の解法は, すべての群の座標体系を,多群のセントロイドによって 構成される標的行列の座標体系の単位に調整するものであり,その結果が実質科学的に解釈しや すいものであるか否かについては,なんらの配慮もはらわれていない。また,先述したように,Ten B e r g e
の解法も,原理的にGower
の解法と類似するものであり,その結果の実質科学的 解釈には,同じく,なんらの工夫もこらされていない。このような両者の立場は,プロクラステ ス解法が,M o s i e r( 1 9 3 9 )
以来の最小二乗問題を絶えず意識しながら発展してきたという歴史的 経緯にも深く関わるものである。しかし,その数理論的な目的をほぽ達成しえた今日,これらの プロクラステス諸解法を,実質科学者にとって有意味な理解しやすい方法論として位置づけていくことが急務であると考えるのである。
本稿では,実質科学者にとって,もっとも理解しにくい方法論と考えられる異種解析かつ多群 の間のプロクラステス解法をとりあげ,上記のような様々な視点を念頭において,次のような修 正解法を提案するc
本稿の修正解法では,まず,先に
Gower
によって放棄された方法,すなわち,任意の一群を 標的として,他のすべての群の座標体系の全体としての拡張・短縮を行うという方法を再評価す るとともに,新たに,この任意の一群として,相関係数を構成要素とする解析解を用いる方法を 提案したい。すなわち,この修正解法の意図するところは,まず,相関係数を行列の要素とする 解析解を標的とすることによって,他のすべての群の解析解のプロクラステス変換後の座標値を,相関係数に類似する値とし,これによって実質科学者にとって理解しやすい座標体系の中に 各種解析解を位置づけ,多群間の解析解の比較を可能にしようと試みることにある。ここで,相 関係数に類似する座標値と述べたのは,この変換法が,
1
つのスカラー値によって,座標空間全 体を拡張あるいは短縮するだけのものであり,相関係数の定義に基づいて,座標軸と各変量の相 関を算出しなおしたものではないことを指摘したのである。すなわち,この拡張・短縮に関する プロクラステス変換は,結果として,各解析解を構成する各要素が相関係数を想定させる値とな るように変換するものであるが,厳密な相関係数ではなく,場合によっては,土1 . 0
を超えるこ ともある。このような問題点を十分に認識した上で,本稿の修正解法の特徴を整理してみよう。まず,本 稿の修正解法は,相関係数を構成要素とする
1
つの解析解を標的として,他のすべての群の座標 体系の拡張あるいは短縮を行うものであるが,標的を1
つの解析解に固定するため,拡張・短縮 のためのスカラーの解法そのものは2
群間解法となる。すなわち,拡張あるいは短縮のスカラー の解法は,標的とそれ以外の k‑1群の解析解のそれぞれとの間の2群間解法と考えられるので ある。このような2
群間問題における拡張・短縮のスカラーの解法については,S c h i : i n e m a n n &
C a r r o l l
の解法が提案されているが, この方法では, 変換される解析解をA
。(nxm
次),標的 解をB
。(nxm
次),プロクラステス回転のための変換行列をT
。(mxm)
とするとき,拡張・短 縮のスカラーd
を,( 2 3 ) d = t r ( T ,
。'A
。' I I. L B
。)/ t r ( A
。' I I. L A
。)と定めている。したがって,
Schonemann & C a r r o l l
の解法では,拡張・短縮のためのスカラ‑ dは,回転行列 T。の解法後に求められる。
一方,直交プロクラステス回転行列は,
Schonemann & C a r r o l l
の提案した2
群間解法に関 する限り,拡張・ 短縮のスカラーとは無関係に定まることが明らかにされている(詳細な検討 は, 柴田1 9 8 6
参照)。 したがって,2
群間問題に限定すれば, 先に回転行列が求められ,つい で,拡張・短縮のスカラーを求めるという手順が確定するが,多群間問題の場合はどうであろう か。まず,多群間解法においては,
2
群間解法のように,いずれか一方の側の座標体系が拡張・短 縮されるわけではなく,それぞれの群が拡張・短縮の対象となる。しかし,この拡張・短縮は,いずれも座標体系全体としてのものであり,解析解のそれぞれにおいて,座標軸上の変量の相対 的位置関係,すなわち,変量相互の距離の相対的大小関係には変化がない。また,本稿の修正解 法は,