画像処理工学
画像の分類(1) -教師付き分類-
画像の分類
• 分類
–
画像の各画素を,画像を構成する複数のものに対応 づける(意味づけを行う)こと
–
画像上の各パターンについて特徴量(特徴ベクトル)
を求め,それらの類似性が高いもの同士に分別する
–類似度を統計的に求めることから,統計的パターン
認識ともいう
画像の分類
• カテゴリ
–
下の画像上のパターンにおいて,りんごやみかんと いったもの(意味づけされたもの)
• 分類クラス
–
分類処理において,類似性の高いものどうしの集合
–ひとつのカテゴリが複数のクラスから成り立っている
こともある
なし りんご カテゴリ
葉 みかん
かご
濃い赤
薄い赤 分類クラス
画像の分類
• リモートセンシング画像の分類
Landsat / TM 画像の分類 (多摩地方の土地被覆)
x
黄 : 緑地 緑 : 都市域 青 : 裸地
元画像 分類結果画像
特徴空間
• カラー画像の構成
R
成分
G成分
B
成分 カラー画像
たとえば,赤色のところは
R 成分画像で明るく(値が大きい),
他の成分画像では暗い(値が小さい)
特徴空間
• 特徴ベクトル(画素の濃淡レベル)
x
y gR gG gB
各成分画像上で同じ座標(
x, y)にある濃度値を並べた ベクトル量
たとえば,鼻の部分は(白,黒,黒)という特徴ベクトルをもつ
R
成分
G成分
B成分
特徴ベクトル (
gR, gG, gB)
特徴空間
B 成分
0 255
255
各成分における値が
近い画素の集まり(クラス)
R
成分
• 特徴空間(画素の濃淡レベル)
R
B
カラー画像
特徴空間 (
R-
B空間)
特徴ベクトル
特徴空間
B 成分
0 255
255
境界線(識別関数)を 統計的に求める
R
成分
• 特徴空間の分割 (= 分類)
–
特徴空間上の各クラス間の境界を求める
–境界線を識別関数(判別関数)という
特徴空間 (
R-
B空間)
B 成分
0 255
R
成分
255特徴空間の分割 クラス1
クラス2 クラス3
x
• 分類クラスの特徴量
–
分類クラスの特徴量としては,濃淡レベルの平均値,
分散(分散・共分散)などがよく用いられる
–平均ベクトル:クラス分布の中心
–
分散・共分散行列:クラス分布の広がりの度合い
特徴空間
B 成分
0 255
R
成分
255x x
クラスの平均
クラスの分散・共分散
• 分類クラスの特徴量
特徴空間
[
1 2]
c M = cM cM c MK
[
1 2]
t X = t X t X t XK
11 12 1
21 22
1 2
c c c K
c c
c
c K c K c KK
V V V
V V
V V V
=
V
1
1 N
c k t k
t
M X
N =
=
∑
( )
( )
1
1 1
N
c ij t i c i t j c j
t
V X M X M
N =
= − −
−
∑
1, 2, ,
t = N
クラス
cの平均ベクトル
クラス
c分散・共分散行列
K : 特徴量の数(ベクトルの次元数)
N : クラスのデータの数
(特徴
kの平均値)
• 判別法
–
与えられた特徴量を使用して類似度を求め,画素を 分類クラスに分類する手法
–
類似度(判別関数)をいかに定義するかで分類結果 が変わってくる
–
最短距離法と最尤法などがある
判別法による分類
x
• 最短距離法
–
特徴空間において,データと分類クラスとの距離を 類似度(相違度)として定義し,距離が最小となる 分類クラスにデータを分類する
–
距離として,ユークリッド距離,マハラノビス距離が 用いられる
判別法による分類
0 255
x x
xx
クラス1
クラス2 クラス3
クラスの中心との距離を求め,
距離が最小となるクラスに
データ
xを分類する
• 最短距離法(続き)
–
ユークリッド距離
•
いわゆる空間上の点と点との距離
–
マハラノビス距離
•
ユークリッド距離を分散・共分散で正規化したもの
判別法による分類
( ) ( )( ) ( )
22
1
,
t K
E x c x c x k c k
k
d x c X M
=
= X − M X − M =
∑
−( ) ( ) ( )
[ ]
2 1
1 1
2 2
1
1 1 2 2
, t
M x c c x c
x c
x c
x c x c x K c K c
x K c K
d x c
X M
X M
X M X M X M
X M
−
−
= − −
−
−
= − − −
−
X M V X M
V
13
判別法による分類
( )
2 , 2
dM ∗ b =
•
ユークリッド距離とマハラノビス距離の違い
クラスの 確率密度 特徴空間
x
クラス
aクラス
b確率密度
X1
X1 X2
( )
2 , 1
dM ∗ b =
( )
2 , 1
dM ∗ a =
11 aV ( )
2 , 2
dM ∗ a =
xX1
aM1 bM1
データ x は
ユークリッド距離では 2つのクラスから 同じ距離にあるが,
マハラノビス距離では クラス b に近いと みなされる
( )
2 ,
dE x b
( )
2 ,
dE x a
11 bV
• 最尤法
–
クラス
cに対するデータ
xの尤度を考える
–
尤度が最大となるクラス
cにデータ
xを分類する
–尤度 : クラス
cにおけるデータの分布を表す関数
(正規分布に従うと仮定する)
判別法による分類
( )
( )
12 1 2 1 2( )
, exp ,
2 K c 2 M
L x c d x c
π
= −
V
|
cV|:
cVの行列式の値
データ
xがクラス
cに属することが尤もらしい度合い
( , )
dM x c
: マハラノビス距離
→
最大となる
c• 最尤法(続き)
–
尤度に対して対数をとることで計算量を削減
判別法による分類
( )
{ } ( ) ( ) ( )
( ) ( ) ( )
2
2
1 1
2 log , 2 log 2 log ,
2 2 2
log 2 log ,
c M
c M
L x c K d x c
K d x c
π π
− = − − − −
= + +
V V
実際の分類処理ではこの式を用いる
( ) { ( ) } ( )
( )
2( )
, 2 log , log 2 log c M ,
L x c L x c K
d x c
π
′ = − −
= V + →
最小となる
c上の式の両辺から
K log(
2π) を削除すると
分類の方法
• 教師つき分類
–
人間がカテゴリ(もしくは分類クラスタ)の参照データ を与え,それらの特徴量(平均,分散)を基に分類を 行う
• 教師なし分類
–
画像の特徴空間を調べ,塊となっている(類似度の 高い)集団を自動的に見つけ,それらの特徴量を基 に分類を行う
–
分類クラスタがどのようなカテゴリに対応するのか
は,分類結果からはわからない
教師つき分類
• 教師つき分類の処理手順
–
画像データ上のパターン(分類クラス)の代表となる データ領域(教師データ,トレーニングデータ)を指定 する
緑地の
教師データ 領域
都市域の 教師データ 領域
裸地の
教師データ
領域
教師つき分類
• 教師つき分類の処理手順(続き)
–
指定した領域の画素データを特徴空間にプロットし,
それぞれの特徴量(平均,分散)を求める
Landsat / TM 画像(多摩地方)
G 成分
0 255
255
B 成分
特徴空間(濃淡レベル)
×
×
×
緑地
裸地 都市域
平均
ベクトル
教師つき分類
• 教師つき分類の処理手順(続き)
–
指定した領域以外の画素
xについて,特徴空間に おける各クラスタとの類似度(距離)を求めることで 分類する
G 成分
0 255
255
B 成分 × ×
×
緑地
裸地 都市域
x× x