画像処理工学

(1)

画像処理工学

画像の分類（２）－クラスタリング－

(2)

教師なし分類

0 255

255

•

クラスタリング

–

特徴空間上でクラスタ（特徴の類似した集団）を自動的に抽出する処理

–

通常は，教師データを見つけ出すための処理として用いられる

特徴空間

画像からいくつかのサンプルを取り出し特徴空間にプロット

0 255

特徴空間

255

サンプル間の類似度を基にクラスタを見つけだす

(3)

教師なし分類

•

階層的クラスタリング

– N

個のサンプルから

C

個のクラスタを抽出する処理

–

すべてのサンプルを要素数が１個のクラスタと考え，

最短距離にある２つのクラスタを融合していく処理を

C

個のクラスタになるまで繰り返す

255

要素数が２つ以上のクラスタとの距離は？

255

２つのクラスタ間の距離が最短となるものどうしを１つのクラスタに

(4)

教師なし分類

•

階層的クラスタリングの処理手順

–

ある２つの特徴で表される７つのサンプルデータをクラスタリングする

–

最短距離法（後に説明）を採用する

0 5

5 ① ②

③

④ ⑤

⑥

⑦

x ₁ x ₂

①

1 2

②

3 1

③

2 3

④

3 6

⑤

4 6

⑥

7 2

⑦

7 4

７つのサンプルデータ

特徴空間

(5)

教師なし分類

•

階層的クラスタリングの処理手順（続き）

–

２つのサンプル間の距離をすべて算出

–

最も距離が短いサンプルを１つのクラスタにする

0 5

① ②

③

④ ⑤

⑥

⑦

x x ₂

5 2 20 5 6 40

5 5 26 17 5

10 13 26 26

1 32 20

5 13 2



① ② ③ ④ ⑤ ⑥ ⑦

①

②

③

④

⑤

⑥

サンプル間の距離

最短距離

(6)

教師なし分類

• –

クラスタ（④，⑤）と他のサンプルとの距離は，④との距離，⑤との距離のうち短い方をとる

0 5

5 ① ②

③

④ ⑤

⑥

⑦

x ₁ x ₂

特徴空間

5 2 20 5 6 40

5 5 26 17 5

10 13 26 26

1 32 20

5 13 2



① ② ③ ④ ⑤ ⑥ ⑦

①

②

③

④

⑤

⑥

⑦

短い方を③と（④，⑤）

との距離とする

こちらを③と（④，⑤）との距離として採用する

(7)

教師なし分類

• –

新しいクラスタとサンプルとの距離を求めておいて，

その中で最短距離をとる２つのクラスタを融合する

0 5

① ②

③

④ ⑤

⑥

⑦

x x ₂

5 2 20 6 40

5 5 17 5

10 26 26

13 2

 

   

 



① ② ③ ④ ⑤ ⑥ ⑦

①

②

③

④

⑤

⑥

最短距離

(8)

教師なし分類

• –

クラスタ間の距離は，クラスタを構成するサンプルのうち，最短距離をとる２つのサンプル間の距離とする

0 5

5 ① ②

③

④ ⑤

⑥

⑦

x ₁ x ₂

特徴空間

5 20

5 5 17 5

10 26 26

13 2

    

 

   

 



① ② ③ ④ ⑤ ⑥ ⑦

①

②

③

④

⑤

⑥

⑦

（①，③）と（④，⑤）の距離とする

(9)

教師なし分類

• –

新しいクラスタとの距離を求めて，さらに処理を繰り返していく

0 5

① ②

③

④ ⑤

⑥

⑦

x x ₂

5 5 5 17 5

10 26 26

13 2

     

 

   

 



① ② ③ ④ ⑤ ⑥ ⑦

①

②

③

④

⑤

⑥

(10)

階層的クラスタリングにおける距離の定義

•

最短距離法

–

クラスタ

c

はクラスタ

a

と

b

が融合したものとする

–

クラスタ

c

と

h

をそれぞれ構成する要素の中で，

互いに最短距離にある要素間の距離を

c

－

h

間の距離とする

[ ]

min ,

ch ah bh

d = d d

クラスタ

c

クラスタ

a

クラスタ

b

クラスタ

h d _bh

d _ah d _ch

＝

(11)

•

最短距離法（続き）

–

１つでも近い要素が含むクラスタは次々と融合されていく傾向にある

–

そのため，連鎖状のクラスタが生成されやすい

(12)

•

最長距離法

–

クラスタ

c

と

h

をそれぞれ構成する要素の中で，

互いに最長距離にある要素間の距離を

c

－

h

間の距離とする

–

特徴空間内でできるだけ散在するようなクラスタを作りたいときに有効

[ ]

max ,

ch ah bh

d = d d

クラスタ

c

クラスタ

a

クラスタ

b

クラスタ

h d _bh

d _ah

d _ch

＝

(13)

•

メディアン法

–

最短距離法と最短距離法ではクラスタ

d _ch

として

d _ah

か

d _bh

のどちらかが使用される

–

メディアン法では

d _ah

と

d _bh

の中間の値に設定する

–

クラスタ

a

と

b

の各代表点間の中点を新たな代表点

とすることに相当する

2 4

ah bh ab

ch

d d d

d +

= −

新たなクラスタ

c

の代表点（中点）

クラスタ

a

の代表点

クラスタ

h

の代表点

d _ah

x

x x

(14)

• k

－

means

法

–

最初に適当な

C

個のクラスタにサンプルデータを分割

–

その後，より適当と思われる分割に徐々に分割の仕方を修正していく

– C

個のクラスタの平均ベクトルのみが最小限保存されていればよい

–

階層的クラスタリングの場合は，サンプル

N

個がある場合

N

（

N

－１）／２組の距離を保存しておく必要がある

教師なし分類

(15)

• k

－

means

法の処理手順

① 適当に種子点を

C

個与え，仮のクラスタ重心とする

② 各サンプルデータを最短距離にあるクラスタに振り分ける

（距離はユークリッド距離を用いる）

教師なし分類

( ) ⁰ ( ) ⁰ ( ) ⁰ ( ) ⁰

1 2

c M =   c M c M  c M K  

ある種子点

c

の位置を

_c M ⁽⁰⁾

とする

K

：特徴空間の次元数

(16)

• k

－

means

法の処理手順（続き）

③ 得られた各クラスタの平均ベクトルをそれぞれ求め，それらを新たなクラスタ重心とする

④ 処理の

i

回目と

i + 1

回目の間で，すべてのクラスタ重心が変わらないとみなせるとき処理を終了する

そうでない場合は②，③を繰り返す

教師なし分類

( ) ¹

1

^c

^N

i n

c k c k

c n

M X

N

+

=

= ∑ c ⁿ X k

i + 1

回目におけるクラスタ

c

の次元

k

の平均

_c M _k ⁽ⁱ⁺¹⁾

は

クラスタ

c

に振り分けられたサンプル

n

の次元

k

の特徴量

：

( ) ( )

( ¹ ) ²

2 1 K

i i

c c k c k

k

D M M ⁺

=

= ∑ −

^{がすべての}

^c

^{で小さい値であれば}

処理を終了

(17)

• k

－

means

法の処理進行の様子

教師なし分類

① 種子点を２個設定し，それらに最短距離にあるサンプルを振り分ける（左）

その後，振り分けたクラスタの平均ベクトルをそれぞれ求める（右）

② 平均ベクトルを新たな重心としてサンプルを振り分けなおす

(18)

• k

－

means

法の処理進行の様子（続き）

教師なし分類

③ 処理を繰り返し，新たな重心位置と前の重心位置とがほぼ一致していると見なせるならば処理を終了する

(19)

• k

－

means

法の問題点

–

クラスタ数があらかじめわかっている必要がある

•

わからない場合，多めのクラスタ数を設定して処理を行い，その結果に対して距離の近いクラスタを併合すればよい

–

最初の種子点の与え方によって分類結果が異なる

•

種子点によっては分類結果が最適でない場合がある

•

種子点の与え方として

① 与えられた

N

個のサンプルデータからランダムに

C

個を選び出して種子点とする

② 最終的に得たいクラスタを代表する平均ベクトルを分類対象画像から抽出するなど，ユーザの主観に基づいて種子点を与える

教師なし分類

画像処理工学

0 255

255

•

–

–

0 255

255

•

– N

C

–

C

255

255

•

–

–

0 5

5

① ②

③

④ ⑤

⑥

⑦

x 1 x 2

x 1 x 2

1 2

3 1

2 3

3 6

4 6

7 2

7 4

•

–

–

0 5

① ②

③

④ ⑤

⑥

⑦

x x 2

5 2 20 5 6 40

5 5 26 17 5

10 13 26 26

1 32 20

5 13 2













① ② ③ ④ ⑤ ⑥ ⑦

①

②

③

④

⑤

⑥

•

–

0 5

5

① ②

③

④ ⑤

⑥

⑦

x 1 x 2

5 2 20 5 6 40

5 5 26 17 5

10 13 26 26

1 32 20

5 13 2







x ₁ x ₂

x ₁ x ₂

x x ₂

x ₁ x ₂

x x ₂

x ₁ x ₂