第 8 章 評価実験
8.2.2 連続性の効果
前節の実験で用いた画像対A,Bは同一カテゴリに属すものと想定して用意した ものであり,よってワープの結果としてはA" , 云を望んでいた.一方,単調達続 2 次元ワープをパターン認識問題に適用する場合,異なるカテゴリに属するAとBに 関してはA ヂBとなることが望ましい.そこで, 8.2.1で用いた画像A,Bのすべ ての組合せについて,その聞に単調連続2次元ワープを求める実験を行なった.結 果を図 8.4に示す.ビーム径
R
= 1000とし,ペナルティおよび整合窓を併用した (α=1073=1007ω = 5).図中の数字は求まった D(A,B)であり,この値にペナ ルティ分(P)は含まれていない.同じカテゴリに属する画像問の画像問距離D(A
,
B)と,異なるカテゴリに属す る画像聞のD(AぅB)を比較すると,2" ‑ J8倍程度後者の方が大きな値を示している.これは単調達続 2次元ワープが過変形を起こしにくいことを示している.云の様子 からもその傾向が確認できる.
このように過変形を避けることができた理由には,ペナルテイや整合窓の効果も あると考えられるが,多くは連続性条件に因っていることが以下の実験より確認され る.図 8.5に,これまでと同じ画像を用いた場合の,単調性のみを制約条件とする 2 次元ワープの結果を示す.ここでペナルテイ
α (
二10,(]二 100)と整合窓( ' w
= 5)に 関しては図 8..fの場合と同一条件とした.用いたアルゴリズムはピクセルワイズビー ムサーチDPアルゴリズムを基にしたものであるが,連続性の除外により │支Y ( x y ) 1
がO(λ12)となりその計算量は増加する.この点を考慮して R二 100とした.結果 よりわかるように,全く異なるパターンでもA" , 云となっているものが多く,ペナ ルティや整合窓を適用しているにもかかわらず過変形が確認される .D(A
, B )
の値 を見ても図 8.4の場合のような大きな差は見られず 「大」のように異なるカテゴリ の方が小さな値を示している場合もある.連続性の欠如は,以上のように過変形の原因となり,特にパターン認識問題にお いては致命的である.すなわち連続性は, 6.2で述べたように計算量低減を実現す るだけでなく,実用的な範囲の自由度を持つワープを与える点でも重要な条件と言 える.
‑・:.:.ー‑:.:・z・2・・・・・.・・:.;・.・;・,;・‑・:.;・.:"・:ー.;ー.:・.・:.・:・.・・・・... ・..:.・ . .・・. .... .. .・.:・.:.:. .・~ .~一一・,τ・:・:ー;ー.ー:.;.ご・・・=一一・2・2一・:一.:.一ー・!,.
‑ ・ ・ ・ ・
・・ ・ ・
・0・E
E ‑‑‑
. .
︐ ︐
o '
ij i‑
‑j i‑
‑‑ J3
・
2・
il
‑i
‑ zi ‑
‑
•••
•••
•••
︐. ‑
‑ ‑‑ ‑
‑ ‑‑ ‑
‑ ‑‑
‑‑ F
‑ ‑ ‑
‑ ‑ ‑
‑‑ ‑
‑ ‑ ‑
8090 22659
ゑ 時局
28173 15836
16316 5633 20305 21280 21285 37771
fJ J ・ ‑ ‑ ‑ ー = ー
=1 21 :6 :22Z2220z‑Z22・2・222
守ι守寸・ ・ z
ι ι
白
ι ι
守ι
・ ・
・
Ea ‑
‑ ‑‑
・9
・ ・ ・
・ ・ ・
・ ・ ・ e
一‑ ‑ e ‑
‑ ‑ ‑ ‑
‑ ‑ ‑
19596 12751 5273 21621 20295 41214
27081 36706 25396
22994 22920 24222 20625 7334 42410
48383 46699 44173 50551 46786 6766 図 8.4:単調連続 2次元ワープによるワープ画像亙と距離D(A,B).
6 J
655829 7 9 3 6 1 2 2 7 8 6 1 9 1 9 6 3 6 3 1 3 4 5
6963 4 5 3 2 1 0 8 0 3 6 5 6 8 7203 2 6 2 5 1
6035 5 2 6 1 5 2 0 1 5455 7 7 5 6 24379
7236 1 3 5 3 7 1 6 2 4 4 6158 34794
8379 1 1 3 2 2 1 4 0 4 4 5266 5 3 3 9 27663
3 5 9 3 2 3 6 9 7 2 3 3 8 1 3 32118 3 2 9 5 8 5 6 8 1
図 8.5:単調 2次元ワープによるワープ画像Bと距離
D ( A , B . )
66
t=O 1 2
。 =0 5 10 15 20 25 30 35
( b ) r o t a t i o n
5=0.5 0 . 6 0 . 7 0 . 8 0 . 9 1 . 0 1 . 1 1 . 2
( c ) s c a l i n g
図 8.6:パラメトリックな変形により生成された画像Aの例
8 . 3 変形追従能力の定量的評価
単調連続2次元ワープの変形追従能力を定量的に評価する実 験を行なった'‑‑'‑‑ では最適2次元ワープが既知であるA,Bを用い,アルゴリズムによ って得られた
ワープと最適2次元ワープのずれを評価基準とした.このため画像Aとして,画像 Bをパラメトリックに変形して生成した画像いけれ
,
j ) .y (
i , j ))I
i、J= 1γ・.,1 Y}
を 用いた.このとき了( i ,
j),' I J ( 1 : ,
j)がそのまま最適2次元ワープとなる,変形追従能 力の評価基準としては,変位抽出誤差ε[18]を用いた.ε= 1/iy2
t L
!fA;~j) ‑x ( ' i
・j)} 2 + { y ( i ,
j)一百(川)}2 (8.1)4二 1j=1
変形関数T:,万としては,以下のいずれかを用いた.
平行移動 (0三f三10):
67
了
, i ' (
j)二 i‑t九百 U ,
j)=j‑t,ん
回転 (00 :::;
e
三450):Y( i
,
j)二 f‑(ifcosO‑jf siI18‑tf)ム
拡大・縮小 (0.5三s三1.5):
百
, : 1 (
j)二 j‑( 1 '
sin )(+
j' cose ‑
j')f
了(hj)=i‑(jf‑f/s)f17 万(i
,
j) = j ‑(j' ‑j'/ 叫 ん
ここで‑;'= 1 ‑1: V/2, j' = j ‑1V/2, 五 =sin(付/1V),んニ sin(jπ/1V)で あ る . ん ん は変形を画像の範囲内に収めるために用いた.これらのX,
Y
は実数値となるため四 捨五入により整数値化した.画像Bとして前節の実験と同じ画像6サンプル (B)を 用いた.このBを変形して生成したAの例を図 8.6に示す.今回用いた変形パラメータの範囲では, :1:,万は単調達続性(2.3),,‑,(2.6)を満たし ていた.すなわちすべての場合で
D ( A , B )
ニOかつ ε=0となる最適2次元ワー プが存在する.言い換えると単調達続2次元ワープはこのような変形に追従する能 力を理論上持っている.第一の実験として,異なるビーム径Rの下で変位抽出誤差εの6画像対分の平均値 を求めた.結果を図8.7に示す.ここでペナルティと整合窓は用いていない .R
=
1000 の時を見ると ,e
~ 400や s= 0.5程度の大きな変形を除いては, ξは0.2画素程度で あり,単調連続2次元ワープの基本的な変形追従能力が定量的にも確認できた.ま たこの実験から Rに対するεの単調減少性が認められる.すなわち R を大きくす れば平均的に変形追従能力が向上している.この傾向は 4.6.2,5.6.3での乱数画像 に対するD(A , B )
の測定実験の結果と一致している.なお,変形を全 く行なわない 場合でも ε#0となっているが,目的関数D(A
、B)
の値は Oであった.第二の実験として,ペナルティの重み0'を変えながら同様にεを求めた.結果を図 8.8に示す.ここで
R =
1000, ,3=
100とした.整合窓は用いていない.α二10000は単純重ね合わせに相当する. 0'二 lと0'= 10の場合を比較すると, α =10の方 が変形追従能力が落ちることがわかる.これはペナルテイP1がワープによる変形量
を少なくするためのエネルギーであることから説明される.
ε10
0.1
0.01
ε10
0.1
0.01
0 2 4 6 (a) translation
8 10
o 5 10 15 20 25 30 35 40 45 (b) rotation
e
(deg)ε10
0 1.
0.01
0.4 0.6 0.8 1.2 1.4 1,6 (c) scaling S
‑*‑ ー + ‑
‑0‑ 一日ーR=10 R=100 R=1000 R=10000
図 8,7:変位抽出誤差 εのビーム径 Rに対する変化
手書きひらがな認識による評価
8 . 4
ε
10門̲‑Qご
l f ' "
臼‑D‑‑フ .‑0‑官‑.Q ."十'/ B Q〆̲'V 十̲
じゴノタ/〆) ー キ
本節では,単調達続 2次元ワープ法の変形追従能力の定量的評価を目的とした手
実験試料
実験試料として手書き文字データベース ETL8B(160データセット)[61]を利用 した.各文字ノTターンについて文字の大きさを正規化した後,
i ‑ J i " ' ‑ J i
IJ i / J
の4方向について線素方向特徴[62]を抽出した.この結果,画素特徴は 1画素あた り輝度値を含めて5次元ベクトルとなる.このように画素特徴を高次元化すること ワープ精度の向上が期待できる.線素方向特徴の抽出後 縮小処理により画像 書きひらがな (46文字種)認識実験の結果について述べる.
8 . 4 . 1
10 8 2 4 6
(a) translation
0.1
0.01 0
ε
10で,
こうして得られた文字 パターンのうち,偶数番80セットを入力パターン