• 検索結果がありません。

講義内容

N/A
N/A
Protected

Academic year: 2021

シェア "講義内容"

Copied!
8
0
0

読み込み中.... (全文を見る)

全文

(1)

1

主成分分析の適用例

例1.テスト成績の解析

共分散行列を用いた主成分分析

相関行列を用いた主成分分析

相関行列を用いた主成分分析

例2

RGB信号の主成分分析

例2.RGB信号の主成分分析

例3.分光反射率の解析

例4.画像圧縮

例5.パターン認識

2

例1-テストの成績の分析-

ある中学生の集合のテストの成績を主成分分析する 共分散行列: x1(国語x2(社会x3(数学x4(理科x5(音楽x6(美術x7(体育x8(技家x9(英語 x1(国語) 470 x1(国語) 470 x2(社会) 363 459 x3(数学) 384 407 583 x4(理科) 333 383 426 462 x4(理科) 333 383 426 462 x5(音楽) 356 369 421 391 531 x6(美術) 259 229 245 224 263 300 x7(体育) 248 113 106 66 186 201 708 平均 分散 x8(技家) 321 326 320 344 301 209 95 500 x9(英語) 493 501 576 485 479 304 232 404 874 x1(国語) 52 470 x2(社会) 39 459 x3(数学) 45 583 (理科) 各教科の平均と 分散 x4(理科) 50 462 x5(音楽) 42 531 x6(美術) 62 300 7(体育) 57 708 分散 x7(体育) 57 708 x8(技家) 47 500 x9(英語) 39 874

(2)

3

得られた主成分を解釈する

第1主成分 第2主成分 第3主成分 x1(国語) 0.338 -0.121 0.095 x2(社会) 0 339 0 121 0 034 固有値 λ1 3232 x2(社会) 0.339 0.121 0.034 x3(数学) 0.377 0.174 -0.307 x4(理科) 0.337 0.207 0.099 x5(音楽) 0.349 0.004 -0.003 λ2 700 λ3 260 λ4 208 (音楽) x6(美術) 0.227 -0.153 0.173 x7(体育) 0.172 -0.926 0.012 x8(技家) 0.298 0.126 0.781 λ5 124 x9(英語) 0.472 0.041 -0.496 第1主成分について: どの科目の係数も正で体育,英語を除いて同程度の値 体育の方向 だいたい を取っている. → 総合点の意味合いをもつと解釈できる. 第2主成分について:

u

2

u

1総合点の方向 だいたい 第2主成分について: 体育は,主成分の係数の絶対値が特に大きい. → 体育の成績がばらつきを支配する. 9次元空間 第3主成分について: 技術家庭の係数が大きいが英語,数学なども比較的大きく, 有意な解釈は与えられない.

u

3 9次元空間

4

データの標準化の必要性について

仮に,「美術」が10点満点,他は100点満点で で出されていたとする. そのまま,単純に共分散行列を求めてしまうと,美術に関連した 要素が著しく小さくなる. この結果,主成分は以下のようになる. 第1主成分 第2主成分 第3主成分 x1(国語) 0.345 -0.135 -0.112 x2(社会) 0 349 0 108 -0 0432 x2(社会) 0.349 0.108 0.0432 x3(数学) 0.389 0.157 0.3113 x4(理科) 0.347 0.196 -0.0948 x5(音楽) 0.357 -0.006 0.0444 x6(美術) 0.022 -0.013 -0.0092 x7(体育) 0.168 -0.945 -0.0551 x8(技家) 0.306 0.118 -0.8271 英 x9(英語) 0.487 0.011 0.4365 どの主成分でも,美術への荷重は小さく,美術がばらつきに寄与していない. どの科目もデータのばらつきに等しく寄与させるためには,各科目の成績を

(3)

5

相関行列に対する主成分分析

変数を標準化して相関行列を作り,これに対して主成分分析を行う. 相関行列: 各要素は標準化した変数間の共分散 相関行列:

r

11

r

1m

R

1

mm m

r

r

1

R

j j jk n k i i ik ij

m

x

m

x

n

r

1

1

x1(国語x2(社会x3(数学x4(理科x5(音楽x6(美術x7(体育x8(技家x9(英語 x1(国語) 1 000 テスト成績の相関行列: x1(国語) 1.000 x2(社会) 0.782 1.000 x3(数学) 0.734 0.787 1.000 x4(理科) 0.715 0.832 0.821 1.000 x5(音楽) 0.713 0.747 0.757 0.789 1.000 x6(美術) 0.690 0.617 0.586 0.602 0.659 1.000 x7(体育) 0.430 0.198 0.165 0.115 0.303 0.436 1.000 技 x8(技家) 0.662 0.681 0.593 0.716 0.584 0.540 0.160 1.000 x9(英語) 0.769 0.791 0.807 0.763 0.703 0.594 0.295 0.611 1.000

6

相関行列に対する主成分分析

第1主成分 第2主成分 第3主成分 x1(国語)(国語) 0.362 -0.155 -0.057 x2(社会) 0.368 0.150 0.047 x3(数学) 0.358 0.184 0.372 x4(理科) 0.366 0.255 0.014 x5(音楽) 0.353 -0.003 0.236 x6(美術) 0.314 -0.299 -0.193 x7(体育) 0.145 -0.860 0.032 8(技家) 0 314 0 154 0 829 x8(技家) 0.314 0.154 -0.829 x9(英語) 0.359 0.037 0.274 第1主成分について: 第1主成分について: どの科目の係数も正で体育,英語を除いて同程度の値 を取っている. 総合点の意味合いをもつと解釈できる → 総合点の意味合いをもつと解釈できる. 第2主成分について: 体育は 主成分の係数の絶対値が大きい 体育は,主成分の係数の絶対値が大きい. 美術や理科も比較的大きい.

(4)

7

例2

RGBカラー信号の主成分分析

Original Image

オリジナル画像

1

G

R

x

1 1 1

B

G

x

2

x

x

3 1

x

RGB空間での画素値の分布 ・・・ 2 3 ・・・ Program name:PCAdemoRGB.m

8

例2

RGBカラー信号の主成分分析

Two-comonent Image 第1および第2主成分のみ One-comonent Image 第1主成分のみ

One comonent Image

(5)

9

例3 ~分光反射率の近似~

波長:400,404,...,700nm -> 61次元

0 2

0.25 First four principal components 4th

自然界の分光反射率サンプル

0 9

1 170 reflectance spectra of natural color

主成分(第1~第4) 主成分分析 0 05 0.1 0.15 0.2 1st 2nd 3rd 4th 0 6 0.7 0.8 0.9 -0.1 -0.05 0 0.05 R ef lec ta nc e 0.3 0.4 0.5 0.6 R ef lec tanc e 400 450 500 550 600 650 700 -0.25 -0.2 -0.15 0.1 0 0.1 0.2 0.3 400 450 500 550 600 650 700 Wavelength (nm) 400 450 500 550 600 650 700 Wavelength (nm)

k

( )

( )

( )

4

r

( )

m

( )

k u

( )

61 低い次元数で元の信号を表現できる.

r

m

k u

i i i

( )

( )

( )

1

r

m

k u

i i i

( )

( )

( )

1

10

分光反射率データの累積寄与率

1 0.96 0.98 1 0.92 0.94 ribut ion R at io 0.88 0.9 ul at iv e C ont or 0 82 0.84 0.86 Cu m 1 2 3 4 5 6 7 8 9 10 0.8 0.82

(6)

11

4次までの主成分で近似した例

オリジナル 近似 0.8 1 0.8 1 近似 0 2 0.4 0.6 R ef lec ta nc e 0 2 0.4 0.6 R ef lec ta nc e 400 500 600 700 0 0.2 Wavelength (nm) 400 500 600 700 0 0.2 Wavelength (nm) 0.6 0.8 1 anc e 0.6 0.8 1 anc e 0 0.2 0.4 Re fle ct a 0 0.2 0.4 Re fle ct a 400 500 600 700 0 Wavelength (nm) 400 500 600 700 0 Wavelength (nm)

12

例4 画像圧縮

PCA Hotelling Transform or Karhunen-Loeve transform

係数算出 (内積演算) オリジナル画像群 K-L変換(主成分分析)により, 分散の大きい順番に基底ベクトル u (x y)(=基底画像)を算出

k i j

f x y u x y

ij y x

( , )

( , )

( , )

係数算出:(内積演算) uij(x,y)(=基底画像)を算出.

f x y

( , )

分散の大きい係数のみ保存

(7)

13

画像の主成分分析例

I番目のブロック(8x8=64画素) 画素値

) ( 2 ) ( 1 ) ( i i i

x

x

画素値

) ( 64 2 ) ( i i

x

x

x

画像を小ブロックに分割 各小ブロック内の画素をラスタ スキャンの順に並べて列ベクト にする ルにする データセット

x

( )1

,...,

x

( )n に対して主成分分析を行い,主成分ベクトルを求め,画像圧縮に用いる.

14

画像の主成分分析例

1 2 3 4

9 Eigen value spectrum

5 6 7 8 7 8 a mb d ai ) 9 10 11 12 4 5 6 Ei ve n v a lu e (l a 13 14 15 16 30 10 20 30 40 50 60 70 4 Index (i) 固有値の大きい順に並べた 固有値スペクトル 固有値の大きい順に並べた 最初の16枚の主成分画像

(8)

15

オリジナルおよび復元画像

# of synthesized components: 1 # of synthesized components: 3

オリジナル 成分数:1 成分数:3

# of synthesized components: 10 # of synthesized components: 20 # of synthesized components: 30

成分数:10 成分数:20 成分数:30

16

例5 パターン認識

2値画像 2値画像 画素値:1 画素値:0 画素値1のプロットの共分散行列 から主成分方向とばらつきを算出 画素値1のプロットの共分散行列 から主成分方向とばらつきを算出 -固有値(λ12)からパターンの一致度がわかる

参照

関連したドキュメント

画像 ノッチ ノッチ間隔 推定値 1 1〜2 約15cm. 1〜2 約15cm 2〜3 約15cm

撮影画像(4月12日18時頃撮影) 画像処理後画像 モックアップ試験による映像 CRDレール

2. 2. - - 18 18 3号機 3号機 トーラス室調査 トーラス室調査

○炭素とイオン成分は、Q の Mass を用いて構成比を算出 ○金属成分は、PF の Mass

年平均値から日平均値(日平均値の2%除外値又は日平均値の年間98%値)への変換

10 分値の最高値の範囲は、100~119nGy/h、対照期間(事故前)の同一四半期における 1 時間

内 容 受講対象者 受講者数 研修月日 アンケートに基づく成果の検証.

画像 ノッチ ノッチ間隔 推定値 1 1〜2 約15cm. 1〜2 約15cm 2〜3 約15cm