主成分分析

第 9 章混合モデルと EM

12.1 主成分分析

12.1.1 分散最大化による定式化

ここではD次元の観測値のデータ集合{x_n}をM<D次元の空間の上に射影することを考える。

まず１次元空間への射影を考える。この空間の方向をD次元ベクトルを用いて、u1と表すことにすると、各データ点はu^T₁xnに射影される。その平均値は

¯ x= 1

∑N n=1

x_n (12.1)

を用いてu^T₁x¯nと表すことができる。また、その分散は 1

∑N n=1

{u^T₁xn−u^T₁x¯}²=u^T₁Su1 (12.2) であらわされる。ここで

S= 1 N

∑N n=1

(xn−x)(x¯ n−x)¯ ^T (12.3)

である。これを最大化するuを求めるためには、ラグランジュ未定乗数法を用いて

u^T₁Su1+λ1(1−u^T₁u1) (12.4)

を微分し

Su1=λ1u1 (12.5)

を得る。これに左からu^T₁ をかけると

u^T₁Su1=λ1 (12.6)

を得る。これらのことから、分散を最大にするにはu₁をSの最大固有値に対応する固有ベクトルにすればよいことがわかる。

12.1.2 誤差最小化による定式化

今度は射影誤差の最小化に基づいた主成分分析の定式化を考える。まずD次元の完全正規直交系

u^T_iu_j=δi j (12.7)

を導入する。すると各データ点は一意的に

xn=

∑D i=1

αniui (12.8)

と表すことができ、正規直交性より

xn=

∑D i=1

(x^T_nui)ui (12.9)

と書くことができる。しかしここではM個の変数で各データ点を近似することにあるのであって、

各データ点を

˜ x_n=

∑M i=1

z_niu_i+

∑D i=M+1

b_iu_i (12.10)

と近似する。ここで{zni}はデータ点に依存しているが、{bi}はすべてのデータ点に共通である。近似は、誤差関数

J= 1 N

∑N n=1

||x_n−x˜_n||² (12.11)

を最小化するように{u_i},{z_ni},{b_i}を決めることによって行う。{z_ni}とb_iについては、Jにx˜_nの表式を代入して微分をすることで

zn j = x^T_nuj

bj = x¯^Tuj (12.12)

を得る。これより

x_n−x˜_n =

∑D i=M+1

{(x_n−x)¯ ^Tu_i}u_i (12.13)

が従い、

J= 1 N

∑N n=1

∑D i=M+1

(x^T_nu_i−x¯^Tu_i)²=

∑D i=M+1

u^T_iSu_i (12.14)

となる。これを最小化するにはui(i>M)をSの小さい固有値に対応する固有ベクトルに選べばよく、

∑D i=M+1

λi (12.15)

となる。

12.1.3 主成分分析の応用

主成分分析はデータベクトルxnに対する圧縮方法として利用することができる。これは

¯ x=

∑D i=1

( ¯x^Tu_i)u_i (12.16)

より

x˜_n =

∑M i=1

(x^T_nu_i)u_i+

∑D i=M+1

( ¯x^T_nu_i)u_i

= x¯+

∑M i=1

(x^T_nui−x¯^T_nui)ui (12.17) となるため、D次元ベクトルをM次元ベクトルで置き換えたことになるためである。

また主成分分析はデータの前処理にも応用できる。例えば、データ集合に対して標準化された共分散行列は

ρi j= 1 N

∑N n=1

(xni−¯xi) ρi

(xn j−¯xj) ρj

(12.18) であらわすことができるが、SU =U Lを満たす固有ベクトルの行列U および、対角成分が固有値の行列Lを用いて、

y_n=L⁻¹^/²U^T(x_n−x)¯ (12.19)

を定義すると、

1 N

∑N n=1

y_ny^T_n =I (12.20)

となるため、平均が0で標準化された共分散行列が単位行列となる。

12.1.4 高次元データに対する主成分分析

ここでは、データ点の数がベクトル空間の次元Dよりも小さい場合を考える。まず、Xをn番目の行が(xn−x)¯ ^T であるN×D次元の行列とする。するとS=N⁻¹X^TXと書くことができて、

固有ベクトルの方程式は

NX^TXui=λiui (12.21)

となる。これは、D次元の固有値方程式であって、D次元空間のN点の集合は高々N−1次元の部分空間を定義するので、D−N+1個の固有値は0になる。0でない固有値は上の指揮にXをかけて、

NXX^T(Xui)=λ(Xui) (12.22)

とすることでN次元の固有値方程式の解として得ることができる。

ドキュメント内 PRML pdf PRML ( N x t y(x, w) = w 0 + w 1 x + w 2 x w M x m = M w j x j (1.1) j=0 E(w) = 1 {y(x n, w) t n } 2 (ページ 90-93)

第 9 章 混合モデルと EM

12.1 主成分分析

12.1.1 分散最大化による定式化

12.1.2 誤差最小化による定式化

12.1.3 主成分分析の応用

12.1.4 高次元データに対する主成分分析

第 9 章混合モデルと EM