因子分析における最尤推定法と因子負荷量の回転 Maximum Likelihood and Rotation in Factor Analysis
中央大学大学院 理工学研究科 数学専攻 皆迫 満 MINASAKO Mitsuru
1 序論
因子分析が用いられ始めてから,モデルの理解を行うために様々な方法が提案されてきた. まず, 因子分析モデ ルには共分散行列における分解の独自性の問題が存在する. 計算機による計算が容易に用いられるようになった 1940年代以降は, 様々な推定量が提案されてきた. 最尤推定量(Lawley(1940))もその一つである. 本論文では 最尤推定法によって因子の推定値を求める方法を挙げる.
また, 因子分析モデルには因子回転における不定性の問題が存在する. この問題を解決するために用いられる のが回転の基準である. 直交回転ではクァーティマックス基準やバリマックス基準, 斜交回転ではクァーティミ ン基準やオブリマックス基準がよく知られている. 本論文ではKn¨usel [3]によって提案されたカイ二乗マックス 基準を斜交回転へ応用する方法を挙げ, どの様な性質を示すか他の斜交回転と比較することで示す. さらに,因子 負荷量行列が単純構造を示すための斜交回転について挙げる. 因子負荷量行列の単純構造とは全ての変数が唯一 の因子に対して説明される行列の構造を指す. しかし, 行列がこの様な構造を持つ場合は極めて少ない. そこで, この行列に対する問題と提案を当該論文では明らかにする.
2 因子分析モデル
観測ベクトルをx= (x1, . . . , xp) とすると, この平均と共分散行列は E(x) =μ,Var(x) = Σと表される. 因 子分析モデルは
x=μ+ Λf + (1)
となり, それぞれ共通因子ベクトル f = (f1, . . . , fk), 独自因子ベクトル = (1, . . . , p), 因子負荷量行列 Λ (p×k)を表す. ここでE(f) =0, Var(f) = Φ(正定値行列), E() = 0, Var() = Ψ(対角行列)を仮定する. また, 共通因子と独自因子は無相関Cov(f,) =0 であると仮定する. 以上により共分散行列は
Σ = ΛΦΛ+ Ψ. (2)
という分解を持つこととなる. 直交モデルが仮定される下ではΦ =I である.
3 最尤推定法による因子の推定
本章では Lawley(1940) によって示された, 最尤推定法によって因子分析モデルの各因子を推定する方法
について挙げる. N(μ,Σ) に従う N 個の観測変数を x1, . . . ,xN とする. 共分散行列 Σ の不偏推定量を
S = N
i=1(xi −x)(x¯ i − x)¯ /(N − 1) ( ¯x = (N −1)−1N
i=1xi) とすると, これは Wishart 分布に従う. Wishart分布を最大化するには, 相違関数
F(Σ, S) = trSΣ−1−log|SΣ−1| −p, (3)
1
が最小化されることになる. そこで, 因子負荷量行列と独自因子の分散の最尤推定値 Λˆ,Ψˆ を求めるには, Newton-Raphson法を用いて(3)を最小化すれば良い.
4 因子負荷量行列の回転
まず,直交モデルにおいて, 因子負荷量行列Λは直交行列の回転行列RによってΛ = Λ˜ Rと表すことができる. 共通因子ベクトルはg =Rf となり, E(g) = RE(f) =0, E(gg) = E(RffR) =RE(ff)R= RR= Ik
となる. 回転により因子分析モデルや共分散行列は
x=μ+ ˜Λg+=μ+ ΛRRf +=μ+ Λf +, Σ = ˜Λ ˜Λ+ Ψ = ΛRRΛ+ Ψ = ΛΛ+ Ψ
と表すことができ, 本質的には変化していないことが分かる.
次に, 斜交モデルにおいて, 回転後の共通因子の相関行列はV(g) = Φg =RΦRとなる. このとき, 対角行列 のみdiag(RΦR) =Ik という条件の下で回転行列Rが定められ, 因子負荷量行列はΛ = Λ(˜ R)−1 と表される.
4.1 カイ二乗マックス基準を用いた斜交回転
4.1.1 カイ二乗マックス基準
カイ二乗マックス基準は Kn¨usel [3] によって提案された直交回転の基準である. 共通性と寄与を ci =
k
r=1λ2ir, (i= 1, . . . , p), dr =p
i=1λ2ir, (r = 1, . . . , k)と表すと, 最大化すべき基準は xC(Λ) =
i,r
λ4ir cidr
となる.
4.1.2 勾配射影法による斜交回転
斜交カイ二乗マックス回転は勾配射影法(general projection algorithm)(Jennrich [2])によって実現すること ができる. しかし, 勾配射影法は, 本来基準を最小化する手順である. そのため, 元のカイ二乗マックス基準に対 して変形を与え, xOC(Λ) =−xC(Λ)とする. 勾配射影法ではxOC におけるΛ˜ の勾配Gxが問題となるので,
Gx =
∂xOC
∂λ˜ab
(a= 1, . . . , p, b= 1, . . . , k) (4)
となり, 各偏微分は
∂xOC
∂λ˜ab
= 2˜λab
r=b
˜λ4ar
c2adr + 2˜λab
i=a
λ˜4ib
cid2b − 4˜λ3abcadb−˜λ5ab(ca+db)
c2ad2b (5)
となる.
4.2 計算による例
Harman [1] による8 つの心理テストにより得られた因子負荷量行列を用いる. カイ二乗マックス基準と
クァーティミン基準, オブリマックス基準の比較を行う. 2
表1 : ハーマンの8つの心理テスト; ci(i= 1, . . . ,8) はxi の共通性, dr(r = 1,2)は寄与を表す.
4.3 結論
計算による例により, カイ二乗マックス基準において寄与に最も差がある. また, カイ二乗マックス基準は第2 因子によって影響を受けるはずの変数において, 第1因子に最も大きな値が残っている状態となった. これらの 性質は直交回転のときにも見られたもので, 2つ目の性質は改善すべき点である.
5 単純構造における斜交回転
因子負荷量行列が単純構造を持つ場合は少ない. 幾つかの変数が多くの因子から影響を受ける行列を得られる ことが多い. また, 回転の幾何学的意義は最も因子が軸の周りに位置する様な新たな軸を求めることである. 斜 交回転は直交回転よりもその性質が強いため,多くの因子から影響される変数に影響を受ける回転が得られる可 能性がある. そこで, 以下の方法によって影響を受けない回転を行う.
1. 多くの因子から影響を受ける変数を因子負荷量行列から取り除く. 2. 手順1より得られた因子負荷量行列により, 回転行列を求める. 3. 元の因子負荷量行列に対し回転行列をかける.
この方法により, 回転が因子の意味を決定する. ゆえに, 多くの因子から影響を受ける変数が意味することや, そ れらの影響の強さを求めることができる.
3
6 計算による例
表 2 : 影響を受ける変数の寄与における大きさの変化 表 3 : 単純構造の部分における角度の変化
7 結論
まず1つ目の例により, 本論文で提案した方法による回転では, 多くの因子から影響を受ける変数においてよ り小さい共通性を示した. よって, 提案した方法を用いない回転においては,この変数に対して過大評価を与える 可能性があることが分かる.
2つ目の例により, この方法による回転は, 例として用いた行列の単純構造を示す上 3行Λ[1] と下3行Λ[2] が 最も単純構造に近い形に回転できることが明らかである. この性質は回転によって得られる軸の角度が大きくな ると, より強くなることが分かる.
また, 本論文の例では斜交カイ二乗マックス基準を用いて回転する方法について挙げた. そのためカイ二乗 マックス基準における性質が現れたことによる影響がある可能性がある. ゆえに, 多くの因子から影響を受ける 変数を除いて回転する方転は他の基準を用いることにより, その比較を行うことができると考えられる.
参考文献
[1] Harman, H. H. (1976). Modern Factor Analysis, Third Edition Revised: University of Chicago Press.
[2] Jennrich, R.I. (2002). A simple general method for oblique rotation: Psychometrika-vol.67, No.1, 7-20.
[3] Kn¨usel, L. (2008). Chisquare as a rotation criterion in factor analysis: Computational Statistics and DataAnalysis, 52, 4243-4252.
4