九州大学学術情報リポジトリ
Kyushu University Institutional Repository
ファジーハフ変換によるロバスト画像処理
岡田, 正之
九州芸術工科大学
https://doi.org/10.11501/3168352
第5章 ア二一リングファジ-ハ フ変換
5.1 まえがき
この章では, ロバスト回帰の1手法としてアニーリングファジーハフ 変換による方法を提案する
[
53]
.ノイズに埋もれたデータからパターンを抽出する問題は1種のロバスト 回帰である. ロバスト回帰の方法はこれまで数多く提案されてきており
[
19
]
, ハフ変換もその1つである[
31]
. ハフ変換は大域的な構造を抽出す る優れた方法であることが認められているが3 実用的な難点としてパラ メータの数が増えたときの計算量の増加やディジタル化するための量子 化幅の設定の困難などが指摘され, 多くの改良案が考案されてきており[
38]
, そのなかの一つにファジーハフ変換がある[
32]
. しかしファジーハフ変換においてもファジ一度の設定や初期値設定など実際の適用におい て難しい問題がある. 本章ではファジーハフ変換のこのような難点を解消 するために組合せ最適化で用いられるアニーリング
[
54]
を導入する. ァニーリングは基本的に整数計画問題に導入されるものであるから, Roth ら
[
31]
やStephensら[
55]
の非線形計画問題としての表式やHanら[
32]
のファジ一理論による定式化には導入できない. そこでここではファジー ハフ変換を整数計画問題として定式化してアニーリングを導入する. そ のためにまずテンプレートマッチング
[
30]
を整数計画問題として定式化 して, それをロバスト化したものでパラメータ空間での最適解を抽出す る場合がハフ変換に帰着されることを導く. またこの整数計画問題の定 式化に基づいてハフ変換をファジー化し, それが代表的なロバスト推定 であるM推定の1種となることを示す. 更にこの整数計画問題によるファ ジーノ\フ変換の定式化にアニーリングを導入して, データ分布のスケー ルや初期値に依存しない解を得る方法としてアニーリングファジーハフ 変換を導く. ファジーハフ変換[
32]
でのテンプレート抽出の基本的なス テップは3 大域最適解すなわちパラメータ空間の分布の最大ピークを1つ78
取り出すことである.複数個のパターンを抽出するには, 取り出された テンプレートに所属するデータを除去した後に次の大域最適解を取り出 すということを繰り返す.ここでも同じようにして逐次にパターンを抽 出する方法をとることにする.そうすると抽出の各段階では大域最適解 を1つ求めればよい.
3章でも触れているが、 この章でも基礎として可変形テンプレート マッチングの復習をしておく.データとしてm個の点di
(i
= 1γ・.,m)が与えられるとする.この点パターンからη個のテンプレートを抽出す る.テンプレートのパラメータを釣(j = 1γ・1η)とする.例えばテンプ レートが直線y=αx+bである場合にはめ=(αj,bj)である.点diと第j テンプレートとの距離を D(di,pj)と記す.このように定義するとテンプ レートマッチングは
m n
mln 乞乞xijD(di, Pj)
1二1 j二l
subj.to
L
Xij = 1, Xijε{O,l} ,,,E店、、 にJU 1Eょ 、、EEFJという混合整数計画問題として定式化される.バイナリ変数Zりは点diが 第3テンプレートに属すメンバーシツプを表す.式(5.1)で最適化すべき 変数はZりとめである.式(5.1)は可変形( deformable)テンプレートマッ チングと呼ばれ, 近似最適解を求めるニューラルネットアルゴリズムが 提案されている[33].しかし式(5.1)では各diは必ずどれか一つのテンプ レートに属すことになるので,テンプレートから大きく外れたノイズデー タがあると抽出されるテンプレートが正しい位置からずれてしまう.こ の問題点を解消して外れデータ(outliers)に対してロバストにするには式 (5.1)を
min L玄Xij・D(di,pj)+α玄Xi,n+1
i=1 j二1 ì=1
subj.to η+1 乞Xij= 1, Xijε{O,l} (5.2)
と変更すればよい.こうすればどのテンプレートからも距離α以上離れ ているような外れデータではXij =
0 u
= 1γ・1η), Xiη+1 - 1となり,そのような外れデータは無視される.
この方法では抽出するテンプレートの数ηを予め設定しなければなら ないが, この設定は一般には困難である. そこでいっそのことη= 1と してみる. すなわちテンプレート図形を1個抽出する場合を考える. す ると式(5.2)は
luin
L
XiD(di, p) +α乞
(1-Xi) (5.3)i=l 2=1
となり, 定数項は取り除いてよいので結局
mln
乞
[D(di,p) -α]Xi (5.4)i=l
α α
<一>
PA PA
,d,d DD
1i ハU
/llIt--K 一一
は小川Z 解
のAせにυ
式るな
〉」
(5.5)
となる. 距離 D(di,p)の取り方にはいろいろあるが, 特殊な場合として
1
0 DE(di, p)三αD(dzJ )=
{ l
(5 6)D E ( di, p) D E ( di, p) >α
というのを考える. ここで DE(di,p)はdiとテンプレートとのユークリツ ド距離である. D(di,p)がこのような距離であるときには式(5.4)は
mln α
L
Xi (5. 7)すなわち
m
max
L
Xi (5.8)となり, 式(5.5)は
{
� o恥川DE(di似似川d仇t
DE(dιi,P刈) >α (5.9) となる. すなわちパラメータpの空間で式(5.9)に従ってXiを算出すれ ば, その累積値�Xiが最大になるpがテンプレートの位置を与えること になる. これは多数決による検出であり, ロバストハフ変換法の一種で ある[36].α↓Oの極限が狭い意味のハフ変換すなわちラドン変換になる [37]. 以上によりハフ変換が式(5.4)の整数計画問題として表せることが導かれた.
80
5.2 ア二一リングファジ-ハフ変換
以上の方法すなわちハフ変換はねが 0か 1の整数値であるのでディジ タルアルゴリズムであり3 コンビュータで効率的に実行できるが, テン プレートのパラメータの数が増えると探索空間が急速に増加して計算量 が増加し, また量子化誤差などの問題がある[38]. 例えば式(5.3)のαが 小さすぎると抽出結果がノイズに敏感になり, 逆に大きすぎるとロバス ト性が低下する. 適正なαの値の設定は難しい.
ディジタルハフ変換のこのような問題に対処する1方法としてファジー ハフ変換が提案されている[32]. そこではファジ一理論に基づいてファ ジーハフ変換が導かれているが, ここでは上記の最適化問題のファジー 化としての導出を与える.
ここで, アニーリングファジーハフ変換に入る前に基礎となるファイジ イハフ変換に再度触れておく. 前節の整数計画問題をファジー化するに は引が取る値を実数値[0,1]として3 式(5.4)にエントロビーに似たファ ジ一化関数ゆ(x)(具体的な関数形は後で導く)を付け加えて
mlll
乞
D(di,p)[ -α仇+乞
ゆ(Xi) (5.10)ì=l 2=1
とする. 以下ではD(di,p)はユークリツド距離の 2乗11 di -q 112とする.
ここでqは diに最も近いテンプレート上の点である. 関数ゆ(Xi)に対す る条件について考える. 式(5.10)の解Xiは
D(di,p) -α + ァdゆ = 0 αXi
、、1E,,J11ム11ょに.υ〆'『t、、
を満たす. これからD(di,p) -α= -dゆ/d Xiとなるからこれを式(5.10) に代入すると式(5.10)は
mむ (zt)-dl
(5.12)となる. 従ってkをある正定数としてゆ(Xi)が
ゆ(Xi) - Xiア= -kXi αXi dゆ (5.13)
を満たせば式(5.10)は式(5.8)すなわちハフ変換と同じになる. ただしこ の場合Xiは実数値を取るのでファジーハフ変換になる. 逆に式(5.10)が
81
44・rI,
ハフ変換をファジー化したものになるためにはゆ(Xi)は式(5.13)を満たさ なければならない. 式(5.13)の解は
ゆ(Xi)= kXi(ln Xi -1)
となる. ゆ(Xi)が式(5.14)のとき式(5.10)の解 Xi は式(5.11)から
Xi二e k となり3 これを代入すると式(5.10)は
となり, これは
a ごL -whP) max ek � e k
と 一D(川〕
max �e k i=l
(5.14)
(5.1 5)
(5.16)
(5.17)
としてもよい. 以上のことはファジーハフ変換ではα=0としてもよい ことを意味する. 式(5.17)は既に提案されているファジーハフ変換[32]
の式の一つに一致する. 以上により, ファジーハフ変換の最適化問題に よる定式化が導かれた. ディジタルハフ変換が{ 0,1}投票による多数決 であったのに対しファジーハフ変換は[0,1]投票によるファジー多数決で ある. ファジーハフ変換のメンバーシツプ関数 (式(5.17)の指数関数)は ファジ一理論により経験的に設定されていた[32]が, ここでの導出によ り数理計画論的な根拠が与えられたことになる.
5.2.1
口バスト推定としての表式
Rothら[31]はディジタルハフ変換がロバスト推定の1種として表せる ことを示したが, ここではファジーハフ変換がM推定の1種として表せ ることを示す. M推定は最も代表的なロバスト推定の1つである. 1\11推 定の基本は最小2乗法である:
min
L
D(di,p) (5.18)i=l
M推定は式(5.18)で距離のノルムを変えたものである[18]:
min
L
σ(D( di,p))
(5.19)82
関数σとしては飽和する関数が使われる(ここではD(di,p)をユークリツ ド距離の 2乗としているのでσを導入した ). 特にσ(X)= _e-xjkとした ものが式(5.17)であり,従ってファジーハフ変換はM推定の1種であると いえる. 確率分布をガウス分布と仮定したときの最尤推定が最小2乗法 であり, M推定はガウス分布以外の分布を仮定していることになる. 例 えばラプラス分布に対 する最尤推定値はメジアンである[17]. ファジーハ フ変換の基となる分布を調べるために, まず式(5.10)のゆとしてニュー ラルネットなどで最もよく使われるシャノンエントロビー
ゆ二k[xi1nxi+ (1 -xi)ln(l - Xi)] (5.20)
の場合について調べよう. ゆが式(5.20)のときの式(5.10)の最適解Xiは X,; =一一一一一l
t 1+eD(dup)/k (5.21)
となる. ただしα=0とした. これを式(5.10)に代入すると式(5.10)は max
玄
ln(l + eD(川)jk) (5.22)i=l
となる. 式(5.22)はStephens[55]の確率的ハフ変換PHTに一致する. す なわちデータの分布を一様分布とガウス分布の和 1+ e-D(di,p)jたと仮定し たときの対数尤度が式(5.22)である. しかし式(5.16)の導出で述べたよ うに式(5.22)はmax �Xiとはならずディジタルハフ変換の式(5.8)には帰 着されない. 式(5.8)に帰着されるのはゆが式(5.14)のときであり, この とき式(5.10)は式(5.17)となり,これはデータの分布を
p-D(di,P)jk
e- (5.23)
と仮定したときの対数尤度である. グラフを書いてみれば分かるように 1 + e-D(di,P)jkと式(5.23)はよく似た関数である. 以上によってファジー ハフ変換(17)はデータの分布を式(5.23)と仮定したM推定であり,確率 的ハフ変換 [55]とほとんど等価であることが分かった. 式(5.22)や(23) を微分すれば分かるようにこれらはば推定のなかの再減少(redescending) 型[18]に属する.
5.2.2 ア二一リング
ファジーハフ変換はディジタルハフ変換よりもノイズに対してロバスト である[32]が,デ、イジタルハフ変換の問題点である量子化誤差は本質的には
解決されてはいない.ディジタルハフ変換の問題点であったαの設定の難し さはファジーハフ変換ではkの設定の難しさとして受け継がれている.この ことを簡単な例で調べておく. データもテンプレートも1次元空間中の点 であるとする.データは 9個としそれらの位置は0,0.25,0.5,0.75,1,2,3,4,5 とする.ハヌ変換解すなわちモード値は0.5 である.式(5.17)の解は最急 降下法で求めることにする. 初期値はデータの重心11/6とする. このと き求まる解はkによって図5.1 の実線のように変化した.この理由は,k が大きいときにはファジーハフ変換は最小2乗法となり従って解はデー タの重心11/6となる.kが次第に小さくなると解はモード値に近づくが,
更にkが小さくなると局所最適解が生じて最急降下法は それに捕われる ようになる.このような結果解は図5.1 のような変化をする.またデータ を全て10倍したときと0.1倍したときの解も同図に示す.
この結果はkの設定の難しさを示している. すなわちデータ分布のス ケールが異なる個々のデータについて最適なkの値を予め知ることは一 般に困難である.このことはHanら[32]も示しており,kの設定 法は課 題として残されている.ここではアニーリング法[54]によるこの問題の 解消法を提案する. まえがきでも述べた ように, テンプレートの抽出は Hanら[32]のファジーハフ変換に従い逐次に行うので, 各段階での抽出 では大域最適解を1つ取り出せばよい. アニーリングは整数計画問題の 大域最適解を取り出す1つの方法であるから, 前に導いた整数計画問題 の定式化にアニーリングを導入することにする.アニーリングはこの場 合, 十分にファジーな解から出発してファジ一度を徐々に減少させてい き,最終的にディジタルハフ変換を得る方法である.すなわち式(5.14 )を 代入した式(5.10)(α はOにする)においてkを最初大きな値にした解から 出発してkを徐々に減少させながら式(5.10)の解を追跡し,十分小さなk でディジタルハフ変換を得る(k↓Oのときファジーハフ変換式(5.10) は ディジタルハフ変換式(5.4) に収束する). こうすることによって大域最 適解に近いディジタルハフ変換解を得ることができる. このことは次の 性質によって間接的に示される.
[性質l]kを減少させながら式(5 .10)の解を追跡すると�D(di, P)Xi は単 調に減少する.
([正明)Xi (i = 1,・•,m)とpとを合わせて一つの変数y = [ Xlγ・, Xm,p]
と記す.またf(y)= �D(di,P)Xi, g(y) = �xi(lnxi -1 )とおくと,α=0 であるので,式(5.10)は
luin f(y) + kg(y) (5.24)
84
100
10
0.1
0.01
0.0001 0.01
K
図5.1: kによる解の変化
I /'
i / /
I /
I /
l_..- ...
100
(実線:スケール1, 破線:スケール10, 点、線:スケール0.1)
10000
である. 式(5.24)の解は
θf θ。
一一+k�乙二O
θu θy (5.25)
の解である. 式(5.25)を kで微分すると θ2f θ2g θu θg
(-+k-)-+一=0
θy2 θy2θk θu (5.2 6)
となる. これから
を得る. これを
に代入すると(28)は
θY 一 二一fθ2f( 一一+k一一θ2g \-1δg )-1:.7
θk \θy2 θy2/ θu
df θfθu dk θuθk
(5.27)
(5.28)
df θffθ2f θ2g \ー1 θg
一=一一 (ー す +k-) i- (529) dk θY \ 8y θy2/ θu
となる.これに式(5.25)から求まる θf/θν=-kθg/θyを代入すると df θg/θ2f θ291 -1 θg
一=k一一(�τ +k-) 一 (5.30)
dk θY \ 8y θy2/ θν
を得る.解は式(5.24)の極小解で、あるから目的関数のヘツセ行列 θ2f/θy2+
kθ2g/θy2は正定値行列であり, kは正であるから式(5.30) よりdf/ dkは 正である. 従ってkが減少すれば fも単調に減少する. (証明終)
min 'ED(di1 P)Xiの解がディジタルハフ変換であるから,性質1はアニー リングによって大域最適解に近いディジタルハフ変換が得られることの 一つの根拠となる. なお式(5.14)を代入した式(5.10)は式(5.17)になる のでアニーリングにおける各kでの解は ファジーハフ変換式(5.17)で求
めればよい.アニーリングでは最初kは 大きな値にするのでいつで も最 小2乗解から出発することになり,初期値依存性はなくなる. すなわち
k↑∞のとき解はスケールによらず最小2乗解になる. また k↓Oのとき 解は ディジタルハフ変換解の一つに収束する. ディジタルハフ変換解は 離散値をとるので有限の吸引域を持つ. 従ってkの初期値を十分 大きく とればスケールによらず同じ(スケールは異なるが)解が得られる.この ようにしてアニーリングによってファジーハフ変換の難点であるスケー ル依存性が解消される.
86
本節の冒頭であげた9個の1次元データについてアニーリングを行っ たところデータのスケールによらずいつでも最適解O.5xスケールが得ら れた. 別の例として図5.2のような8個の 2次元データに直線を当てはめ る例において回帰直線がkの減少とともに変化する様子を同図に示す. な お直線のパラメータ表現はxcos8+ ysin8 =ρを用いた. 図5.2は,3章で 述べた通常のk固定のファジーハフ変換でkの値が充分小さくないと正 しい直線が得られないことを示している. どのくらいkが小さければよ いかというのは自明ではなく3 また図5.1でも示したようにkが小さいと 式(5.17)の関数が平坦になるので最適解に収束しにくくなる. アニーリ ングは最適解を追跡することによってこのような収束の困難も解消して いる. 同様な事例を 3章で行った図 3.1のデータを使用して行った. 結果 を図5.3に示す. 図5.3がアニーリングファジーハフ変換で得られた 2つ の放物線であり,図5.4は比較のためにkを大きな値に設定してファジー ハフ変換で得られたもので3 ノイズの影響により正しい曲線からずれて いる. このようにアニーリングファジーハフ変換によればノイズに影響 されずに テンプレートを抽出することができる.
5.2.3
オフティ力ルフロー推定への応用
ここで提案したアニーリングファジーハフ変換法の有効性を検証するた めに画像強度の時空間微分によるオプテイカルフローの推定の例に応用し てみる. 時刻tでの第(i,j)画素でのグレイレベルをI
L
と記す. このグレイレベルの勾配
DX;j
二1;+
1,j - 1L, D�� = 1f,j+1 - 1f,j' D
Ti�
二Ir
l-4
による第(i,j)画素での速度ベクトル切=(
均
, vÏj
)に関する拘束はDX; 坊 +DK; υ む +D勾=
0 (5.31)である. 2個の変数υ
ふ
uC
に対して式(5.31)1個だけでは式が足りないの で,近傍の画素での勾配も用いてυ5
7坊
が推定される. このとき最小 2乗 法だとノイズや物体境界などで推定値が歪むのでロバストな推定法が必 要とされる. ここでは上記のアニーリングハフ変換を適用してみる. す なわちファジーハフ変換max 乞 乞e一(DX;jvtj+D小九+DTi})2
jkPEN(i) qεN(j)
(5.32) によってυ
ふ
υむ
を求め,kを小さくしながら解を追跡し,最終的な解を得 る. これを各画素(i,j)で行う. 式(5.32)でN(i),N(j)は'ì,Jの近傍すな3 T T 丁 寸 寸
/ 一ノノ /1i / /
β / ハU /
ニ / LK ノ / / / / /
〆ノ
/
'・ノ ー 'I
F/'・
。 '
,mw'・,ノ。て
/ A
/・'hvy,・Jん.f
,/Av
, / dvノ
〆,ノ
, / ト
』r ハU FhJV |ur
2.5ト
2←
1.5ト 一
k=O.6
1← . 。・. . ‘ ー
- k=100
。
。 i
O 0.2 0.4 0.6 0.8
-0.8 ・0.6 -0.4 -0.2
図5.2: kによる回帰直線の変化
88
丁 寸す
AV
AV AV -AV
AV 。 。
0 0 0
。 も o
O o 0 0 V0 6 0 09 0 v
^ 0 0 0
o 0 ^ 0 OV 0
80付 。 ; 0 0 o 0 、 o 0 0
0 ^ 0 .00
%、P 9 0 0 0.0め 宇q
o υo w 0 宇,
マ 。 o 0", 0 0 0 ó 0 ,Y
60トo 0や o V V 00 0 � 外
o 'ò? 0 0 0 0 0 ^ V i 0
。、ゆ o0 (> 0 0 0 v (/ 0
o 0 "、o 0 o^ Vo 00 00 00 </
40卜 o '<ll 00 s 0 (;) 0 0 〆
「 。 、 o 0 o .,�込o 0 0
iO ^ 0、 00 (> 0 0 (> タ 。
I • V 、^ o' 仏 o 0 0,"
20トv、<(� (> " j{ 0
^ 0 G>'V,. ^ 0 }'
。 冷 奇o 0" __ÇJ (>
\ 00 4 90 JS V 0 0
0 、受企.<')-�.(>__ 0.ò.'O一申�,�,O'O�o一合阜J
。 かO'い杭己益金 o。 ぞか令<s. 'O'O-�'O
\。向。o 、。九J+句ず F600 J
Ø-��O<Y g ^"o (;) ^ 0 v 0 v8�0... 0
'"・ov ^ 0 " 0 0 V 0 v .�ト0
.20ト 90e 9 6 0 9 0 0 0
r "y " . 0 0 0 。 ^ v 0 0 0 0 O. 00 0 00 0 0 c
8 0 0 0 ..^ 0 0 " ^
(> . <X>V 0 V
∞ ぐ 九 o 0 0 o 0 0 0 000 v ^ O �vv O 0 0 v ^ 、0 。
VO 0 c品 。 ∞'0 $ 0
,v 1 9 0
o 1
。 o 00 ^ o �
o 00 。。
。。
AV
AVAV
AV
00 9
ー60.3 .2
図5.3:放物線の抽出例(アニーリングファジーハフ変換)
丁 0
0 0 AV AV AV AV o o
0
。-r--oo o 00 ^
o �.
。 も 。
。 o 。 。 。 。 。 。。
0 9 0 o
。 0 0 0 00
。 。
、 。0 0 09co 0
。 。 。。
。。 。 o 0 0
。
o 0 0 0
8
。 事
-40 � 0
Aιv AV
AV AV AV AV AV
。。
AV AVAV
AV AV -ny
ー60 。 。
・3 -2
図5.4:放物線の抽出例(kが大きすぎるファジーハフ変換)
90
わちウインドウである.図5.5(a)は最 小2乗法で得られたフローの例であ り,一方本方法では図5.5(b)のように物体の境界付近での誤差が図5.5(a) よりも小さい結果が得られた. ウインドウは 5x 5である.これまでも
オプテイカルフローの推定には種々のロバスト推定が用いられている[56]
が, 最も多く用いられているM推定はここでのkのようなパラメータを 含み, 通常図5.5(a)と(b)の中間的な結果が得られる.k固定のファジー ハフ変換も同様である. ディジタルハフ変換による方法[57]は量子化幅 の設定が問題である.2章で提案したロバスト推定の 1種であるLTS法 にアニーリングを用いてスケール不変にした手法も適用 してみた[14]が,
LTS法での計算時間が 55秒であったのに対し, 本方法では8秒であった.
5.3 ニューラルネットによるファジーハフ変換!
アニーリングはニューラルネットでよく使われる手法である.ファジー ハフ変換をニューラルネットで実現するために, まずパラメータpの空 間を離散化して各離散セルのpの代表値をめ(j = 1,. 川)とする. する と式(5.17)の解は
max 3 {乞e-Ð(仰j)/k,ji=l = 1, ...,η} (5.33)
の解をfとするとPj*である. 式(5.33)は次の整数計画問題に定 式化で きる.
mpx 乞XjYj j=l
subj.to 乞zj二1? ZJε{O,l} (5.34)
ここでYj二�ie-D(di)Pj)/たである. 式(5.34)の解は上記のfによりXj*= 1, Xj二o (j # jつと表される.従って 式(5.17)の解 Pj*は (5.34)の解zに より
Pj* =
:L
XjPj (5.35)3二1
と与えられる.これらの過程は図5.6のようなネットワークで 表せる.
ランダムに動く点パターンからグローパルな運動を検出するニューラ ルネットとして図5.6と同じようなネットワークがモデル 化されている
\.0 tv
\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ
\レ\レ\レ刈/ψいlζv-\J/ --v .:::J �叫--V-...v"レ\レ吋/'\)/
\レ\レ-...v\J/\V\ムビ弘、/_J �当'-V\J/\J/\J/'\)/'\)/
\レ\レ'-V'....vY "-1.:ζ ιし.J � -:去しL"-\V
ψ
\レ\レ\レ-l)ラプLえ ぐf守 ラシfぞ(L"レ\レ
、 てベフペ171/トノト/トノト/ト冷Jて!てFて ど
\レ\レノ , l' '\"レ
v
'\)/ '\)/.J寸明ポ小小小小小小
六
六下L'\)/'\)/\レ\レゾ寸/へ/久/ト/ト/ト/トノトノトバ'r- (ν\レ\レ
\レ\レv)ぺ小、/ト/ト/ト/ト/ト/トパ'r-く\V"レ\レ
\レ\レ〉寸ペ/人/卜/ト小小小小パ\介、ぐ\V"レ\レ V A パ,/れノト 小/ト/ト小小 /T'-AA.V
\レ\レ /"" ハ"''\)/'\)/
\レ\レvv-1ムム)')ペ「ぐくしYy"レ\レ
\レ\レ'\Vvザ��三J斗-JLι\t-\v \J/ '\v "レ\レ
\レ\レ-...v-...v--v剖�当ふlザレーIL�乙ψ\J/ '\j/"レ\レ
\レ\レ\レ\レJ斗/¥斗l.:_.j-..vv-"乙仏、ψ刈/"レ\レ\レ
\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ
\レ\レ\レ\レ'\)/'\)/ "レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ
\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ'\)/'\)/ "レ\レ\レ\レ\レ
(p) 棚よJN淵時
\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ
\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ
\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ�'\)/ '\)/ '\)/
'\)/
'\)/ '\)/vψψ'\)/'\)/料料ぷ淵�'\)/'\)/'\)/'\)/
'\)/'\)/'\)/ 、
同
小小小小小小小小不利(
'\)/ '\)/ '\)/\レ\レ\レ \レ\レ\レ
小小/ト小小小小/ト/ト/ト
\レ\レ\レ\レ \レ\レ\レ\レ
/ト/ト小小小/ト小小/ト小
\レ\レ'\)/
'\)/ � �
: : : : : : : : '\)/ '\)/ '\)/ '\)/小小小小小小小小小小
\レ\レ\レ\レ \レ\レ\レ\レ
小 /ト小/ト/ト/ト小小小/ト
\レ\レ\レ-, , , , , , , , , , ' "レ\レ\レ\レ A 小/トノト小/ト/ト小/ト/ト/ト/ト
\レ\レ\レハ \レ\レ\レ
小/トノト小小小/ト/ト
\レ\レ\レ\レ\レ \レ'\)/'\)/ '\)/ "レ
寸/"レ\レ\レ\レ\レ\レ\レ\レ\レ\レ"-"レ\レ\レ\レ\レ\レ
\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ
\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ
\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ'\)/'\)/'\)/'\)/
\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ'\)/'\)/'\)/'\)/'\)/'\)/
'\)/ '\)/ '\)/ '\)/ '\)/ "レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ σd
uuいl三℃山川,,リuuuいU久、/リー糊潜
図ωω一斗刈。中いよけ」ヤ刈口182
• • • •
- ・ ・ .
dl
- ・ ・ .dn
図5.6: ファジーハフ変換ニューラルネット
[58] . Zohary[59]らはランダムドットの運動方向の分布を変えて心理実 験を行い, 平均値とモード値の中間的なファジーな値が知覚されると報
告している. その実験状況をファジーハフ変換により
max
L
aie-[(cosBi-CosB)2+(Si叫-sinB)2l/k (5.36)と表してみよう. 8iはドットの運動方向であり,度で表すと0,30,60,90の いずれかであり,。は知覚される運動方向である.αtは 8i方向に運動する ドットの割合である.図5.7(a)はZoharyらの心理実験の結果の1例であ り3 図5.7(b)は式(5.36)の結果の例(k = 0.5)である. これらの図で横軸 は玄αi8iであり,縦軸はOである. 両図はよく似ており, 知覚系のニュー ラルネットはファジーハフ変換でモデル化されると推測される.
5.4 むすび
テンプレートマッチングの最適化問題としての定式化からハフ変換の 整数計画問題による表式を導き, それをファジー化してファジーハフ変換 の混合整数計画問題による表式を導出した. その整数計画問題にアニー リングを導入して, データ分布のスケールや初期値によらないハフ変換 の方法としてアニーリングファジーハフ変換を提案した. このアニーリ ングファジーハフ変換によるロバスト回帰法の有効性を曲線検出とオプ テイカルフロー推定の簡単な例について検証した. また階層的ニューラ ルネットによるファジーハフ変換の実現についても触れた. 他の画像処 理への応用や計算の高速化などが今後の課題である.
94
(Oω刀)CO一ちω」一刀刀ω〉一UU」ω止
。 20 40 60 80 /0(;
Calculated mean (deg)
(a)
ハUηζ
ハUa司,EE
nU ハu nU ハU ハu nU ハU ハU ハU nu 9 8 7 6 5 4 3 2 1
30 40
(b)
50 60 70 80
図5.7:知覚される運動方向のデータ分布による変化
第6章 フアジハフ変換による運 動検出
6.1 まえがき
この章では, フアジハフ変換を簡単な動画像からの運動検出に応用し てみる. 6.2 節では, 仮現運動の検出を フアジハフ変換で モデル化し,6.3
節では動画像から主要な動き領域を逐次抽出する方法を提案する[60].
6.2 運動知覚モデル
運動知覚のメカニズムの1つの 論点は局所的な運動が空間的に統合さ れる過程である. 計算論的な モデルの多くは正則化法による平滑化に基 づく統合を基礎としている[41]. しかしながら正則化による平滑化では不 連続も 平滑化され,運動の境界がぼける. こうして, 平滑化 (smoothing) と分割(segmentation)という相反する処理をどのようにして両立させて いるかに興味が持たれており [61],最近パーパーポール錯視を使って多 くの心理実験が行われている[62]. それらの実験結果は専ら端点に特異 的に応答する(end-stopped)ニユーロンと正則化による伝播で説明され ている[63]. しかしながらほとんどの運動検出ニユーロンは端点非特異
(non-end-stopped)である[64 ].
そこで本節ではロバスト推定の1種であるファジーハフ変換 [32]に基 づく空間統合 モデルを提案する. 本モデルは局所運動の検出に単純な相 関だけを使っており,端点に応答するこユーロンと輪郭に応答するこユー ロンという 2種類の運動検出器を用いるモデル [63, 65]より も単純であ る. 本論文で用いる仮定は次のようなものである:1)2値画像を扱う . た だし濃淡画像への拡張は容易である. 2)時間を離散化して局所運動を相 関で検出する. 3)運動情報は局所的なニューロン結合により空間的に 伝 播する. 4)窓枠による隠蔽の効果も取り入れる. この最後の 仮定は心理
96
実験によって確認されており3 窓枠の裏側に線が延びていると認識され ると, 窓枠がないときと同じ運動が知覚される[66]. 2種類の運動検出器 モデルではこのとき端点ニユーロンは無視されると説明される[66]. 本節 ではその代わりに隠蔽に対応する重み付けを導入する. また3番めの仮 定の空間伝播は心理学実験で、も確認されており[67], ヒステリシスなどの 原因と推測されている[68]. 本節で出てくるニユーロンはガウス関数を受 容野とし, 生理学的にも妥当なものである. 本モデルに最も近いものは Noest[69] によるものであるが, 彼のモデルはアパーチャ問題のような唆 昧なデータは扱っておらず, また空間伝播による統合も含まない.
6.2.1
局所運動の検出
まず最初に空間の各場所で局所的な動きが検出される. そのような運 動検出器としてこれまでいくつか提案されてきている[70] が, ここでは
最も単純な相関によるものを考える. 図6.1のような 2フレームの画像
で説明する. これは長方形の固定窓の中で斜めの直線が水平に右に移動 したものである. これを図6.2のようなデータでモデル化する. ここで は図6.1の枠を横4個, 縦6個のセルに分割した(後述する実験では横15 個とした ). 第1フレームでは 2個の点、が, 第2フレームでは3個の点が 枠内に見えている. 枠の左に点、線で示している格子は, 実際には隠蔽さ れていて見えないが直線が枠の外にも延びていると知覚されることを表 している. 枠内で見えている直線を黒点で, 枠外で見えない直線を灰色 の点で表している. 直線の右下の端点は枠に達していないのでこのよう な延長はない. 図6.2のような画像データに対して次のような局所運動 データが検出されるとする. 例えば第1フレームの(x,y) = (0, 3) にあ る黒点は第2フレームでは(2ス),(1,3),(0,4),(-1,5),(-2, 6)のうちのどれか に動いた可能性がある. これらの動きのベクトルはそれぞれいdx, Vdy) =
(2, -1), (1, 0), (0, 1), (-1, 2), (-2, 3)である. そこでこの5個(枠外にはこ
の2個の先にも点があるので実際にはもっと多い )を場所(0,3)のデータ とする. ただし枠外への動き(-1, 2)と(-2,3)には重みω1を付ける(以下の 実験ではω1 = 0.5とした ). また第2フレームの(0,4)の点は第1フレー ムの(1,2),(0,3),(-1,4)ぅ(-2,5),(-3, 6)から来 た可能性がある. これらの動き は(-1,2),(0, 1), (1 ,0), (2,-1), (3,-2)であるので, これらを場所(0,4)のデータ (枠外の点はもっとあることとそれらへの重み付けは前と同じ )とする. こ のようにして第1フレームと第2フレームで点が存在する場所に速度デー
-
'.
タが得られる. なおこれら全ての速度データに, 速度の大きさに応じた 重みω2 = e-811均112を付ける (11日||2=dz+duである). 以下の実験では
ð = 0.02 とした. 従って枠外の点を始点あるいは終点、とする動きには重 みω1ω2 (それ以外の動きには重みω2)が付くことになる.
6.2.2
ファジーハフ変換による最尤推定
前節で求めた動きデータは局所運動検出器によって観測される動きで ある. 場所Xd = (Xdl Yd)で観測される局所動きデータVdk = (υ�XlV�y)(各 場所に複数個のデータがあるので それらに番号kを割り振る)は, 場所 X = (丸Y)の真の速度ベクトルV= (υXl Vy)にノイズが加わって生成され
観測されたものとみて, このノイズの分布を p以(1りdク引cつIV川V川) =
1e川ω吋;〆e汁一
Z (6.1)
と仮定する.αとFは正定数,zは規格化定数,ωjはデータの重みであ る.この分布関数 ewe-x は図6.3に示すように1+ω(e-1)e-X2とほぼ等 しく3 一様分布と ガウス分布の和に近い. これはロバスト推定でよく使 われる分布である[71]. このような分布の仮定の下で, 観測データけか ら真の速度Vを最尤推定
ηx HF川IV)
(6.2)で推定することにする. 確率が積になるのは 各観測データりが互いに独 立と仮定しているためであり, TId TIkは全データにわたって積をとること を表している. 対数をとると式(6.2)は
ηx z z 州りIV)
(6.3)となり,これに式(6.1)を代入すると
円与X
LLω〉一(αIIX-XdW+βIIV-り112) (6.4)となる. 式(6.1)は1+ω(e-1)e-X・2でもよいのだが,このように対数尤 度にしたときに簡単な式(ガウス関数)になるので ewe-X2にした.式(6.4) がファジーハフ変換によるロバスト推定である[29].
98
1st frame 2nd frame
図6.1:運動画像の例
E 圃T
• E.
oy-“ ・・ -L圃 • E -E
-• ・E
-d ・・
• 1Ei
I
• 内〈υ
"• • • 凡ソ“ 4ttよ ハHHV 411ム n--“ η『U
Z
ハHU m nAu pl n41i i+EU 門、U 41Eよ
4
I I I-
T
E
-
--
凡ソ“ ・・ ・』 • 1 -E
-・d • ・・
4EEよ • ..
I
• qd
"• • • 凡ソ“ 4EEよ ハHU 4EEよ 凡ソ“ 内〈υ
Z
2nd frame
図6.2:動きデータ
100
3
2.5
2
1 .5
1
0.5
O -3 -2 -1 。 1 2 3
図6.3:ee-22の関数形
式(6.4)の解Vは最急降下法などで求めることができるが3並列ネット ワークでこれを行うためにハフ変換に倣ってVの空間を �(i=1,2,・・,n
)
と離散化して,それらの離散値の中から式(6.4)を最大にするものを出力す ることにする.以下の実験では離散値は町二(-2,-2),九=(-2,-1)γ?九5二
(2,2)のように整数点だけにとった.このように離散化すると式(6.4)は
となる.ここで
�a/x f(�)
Z又1にn
(6.5)
f(V)
=乞乞吋e-(αIIX-XdI12+βIIV-り112)
(6.6)である.これを各場所Xで行えばその場所でのVが求まる.このように して空間内の全ての場所で速度を求めることができるが, 興味の対象は 図6.2の各黒点、の動きであるから以下の実験では第1フレームで点がある 場所だけでVを求めた.式(6.5)はη個の f(�)の中から最大のものを探 すのであるからWTAネットで実行できる.そのために式(6.5)を次のよ うに書き直す:
n
max
L
f(�)qii=l
n
subj.to
乞
qi= 1, o ::; qi ::; 1 (6.7) i=lこれの解では, f(�)が最大となるtのqiが 1になり3その他のqiは 0と なる.従って離散化誤差の範囲内で式(6.4)の解が
V=乞qi� (6.8) i=l
によって与えられる.式(6.7)の解は次のように して求められる[72].
E 1 T
qi =ε?=leTJ (6.9)
とおけば式(6.7)の制約条件乞Llqt=1? 0三qi三1は自動的に満たさ れるから, riを最急上昇法:
dri θ n
E二死
霊
f(巧)qj二f(只) (6川 102で変化させればよい. 以上の式からηを消去するには, 式(6.9)から
dO-i ,dr η バ
ず
=仏(ず
-E
q33f
)となるので, これに式(6.10)を代入すれば
主
=仏 [f(Yi)ート
川l、、自『,ノーtム11ム円hu〆''Et、、
(6.12)
となる.これが式(6.7)を解く微分方程式である.この式からd '�E.r:=l f (Yi)qd dt = ε�l f(Yi)qi[f(Yi)-L:J=l qjf(Vj)] 2:: 0 となるので, qiの初期値をε;Llqz=
1を満たすよう( 例えば全て1/η)にして式(6.12)で qiを変化させれば式 (6.7)の最適解に収束する.式(6.12)をニューラルネットで図示すると図 6.4のようになる. ただしXもVも実際には 2 次元であるが,1次元で表 示した. また丸印で示したニユーロンはある1つの場所のものだけを示 したが, 実際にはこれがX方向に並ぶ.Yiと記したニユーロンは式(6.6) のf(Yi)を出力するRBF(radial basis function)ニユーロンであり, 受容 野の中心が(X, 1�)で, X方向の受容野の広さはfoに反比例する.v方 向の受容野はゾ7Jに反比例する. なお以後単に受容野と言った場合X方 向の受容野を指す. 2 段めのニユーロンは式(6.12)のダイナミックスに従 うWTAニユーロンである. 式(6.12)から分かるようにこれらのニユーロ ン聞には抑制性の結合があり. これを図中の件で示している. 最上段の ニユーロンの出力V二L:r=lqi yiがその場所での速度である. f(V)は式 (6.6)のようにその場所の近傍の観測データを統合したものであるから,V
は%を局所的に平滑化したものとなる. この平滑化は, 正則化による平 滑化とは違い, ファジーハフ変換のロバスト性により不連続を保存する.
このファジーハフ変換による局所平滑化の空間範囲( すなわち受容野) はVが連続な領域よりも狭くなくてはならない. その条件が満たされれ ば各連続領域内のノイズは平滑化され, かつ領域境界のエッジも保存さ れる. しかしこの条件が満たされなければ受容野よりも狭い領域はノイ ズとみなされて平滑化されてしまう. このことが原因となってこの単純 なファジーハフ変換ではアパーチャ問題を解決できないという問題が生 じる. なぜならばアパーチャ問題を解決するためには各点での受容野が 端点を含むように十分広くなくてはならないからである. このことを図 6.5の例で調べてみた.0が第1フレームの点, +が第 2 フレームの点で ある.左端と右端は固定枠上にあり,従ってこれらの左右に重み 0.5の点 が延長されている( 図6.5では省略した).図6.5の矢印はα二1,ß = 2 で
図6.4:式(6.12)のニューラルネット
104
得られた速度ベクトルである. このαの値が正しい結果を与えるほぼ最 大の値であり, それより大きくしてα=l.5,グ=2にすると図6.6のよう に知覚と合わない結果になる. これはα=l.5では受容野が狭くて端点の 情報が全体には届かないためである. なお図6.6の上下が非対称なのは,
第1フレームの点で速度を求めているのでデータが上下非対称なためで ある. 第lフレームと第2フレームの中間の場所で速度を求めると図6.7 のように上下対称になる. 以上のことからこの例ではαは1以下でなけ ればならない. そこで次に図6.8のように 3つの領域からなる例をやって みるとα=1, ß = 2では同図に示すように正しい結果が得られない. こ れは受容野が広すぎて領域聞の情報が混ざり合うためである. このよう にこの単純な方法では図6.5ではα<1でなければならず,一方図6.8で はα三l.5でなければならず, 両方で正しい結果を出すようなαは存在 しない.
6.2.3
協調による統合
以上のように前節の単純な方法では全ての心理実験を説明するのは難 しい. この方法で大域的な空間統合を行うには個々のニユーロンの受容 野が大域的な広がりをもっ必要がある. しかしながら生理および心理実 験での知見によればニューロンの受容野は局所的であり,ニユーロン聞の 空間的な相互結合によって大域的な空間統合が行 われているようである [73]. 前節のニューラルネットではニユーロンにはX方向の空間的な相互 作用はなく, 空間的な情報は受容野だけによって統合されていた. そこ でニューロン聞に空間的な相互作用を導入することにする. ここでは最 も簡単な結合様式として3 隣接するニユーロン間だけに結合を導入する.
前節ではVの場所を明示する必要はなかったので省略してきたが, ここ からは場所Xでの qiを qiXと記す. なおXも離散化した場所だけを考 え,簡単のため1次元として説明する( 実際の実験では2次元である ). 式 (6.6)のf(V)を, Xを明記して,fx (V)と書けば式(6.7)は
n1ax
LL
fx(只)qiXX i=l
subj.to
L
qix = 1, 0 � qiX三1 (6.13)木lu。\ 木JC 木ーーふ I
木llG 木十l冶 \ 木li恐 木llc 木l込
一
15←
10←
一
5←
一
0トー一一一一;ー
i O
よ 5
」 10
斗- 15
図6.5:運動例1(α=1,ß二2)
106
15←
10←
5←
0ト…
i O
よ
5
...L
10 図6.6:運動例1(α= l.5, ß = 2)
_l_
15
ー
一
一
T 15←
10←
5←
Oトー ひ
i
O
よ 5
」 10
図6.7:中間点でのV(α二1.5うß = 2)
108
...L 15
一
一
一
となる. これを
max
2二 L
[!x(Vi)qiX +γqiXqi,X +1]X i=l
subj.to
L
qiX 二 1, 0三qiX 三 1 (6.14)i=l
に変更する. 新たに付けた項qiXqi,X+1は元々は隣接するqiXを互いに近 づけるエネルギーすなわち-(qiX -qi,X +1)2なのであるが,qiX は0か1 でかっε;Llqzx=1なのでL�l(qiX -qリ+1)2二L�l(q;x -2qiXqi,X+1 +
《
x+l)=乞�1(qiX -2qiXqi,X +1 + qリ+1)= 2 -2 L�l qiXqi,X+1となり,この積の項だけが残るのである(従って当然ながら2乗エネルギーを使っ ても以下の実験結果は同じである) . そこで 式 (6.9) と同じく
とおいて
driX dt
eriX
qiX二..--..2--I二竹 1e伊' ー
J.II.
=
-!:- L t
[!州)qjY +川,Y+1 ]VljiX Y j=l
= !x(Vi)十γ(qi,X-1 + qば+1) でηxを変化させればよい.アiXを消去すると結局
一三=dq dt qix{!x(Vi) +γ(qi,X-l + qi,X+1)
- L
qjX[!X(Vj) +γ(qj,X-1 + qj,X+1) ]}(6.15)
(6.16)
( 6.17)
を得る. この式は図6.4 のネットワークに おいて,第2段のニユーロンが 空間的に( すなわちX方向に) 隣り合うニユーロンと興奮性の結合で相互 作用することを表す. すなわちニユーロンはV方向にはWTA動作のた めに競合的に結合し,X方向にはviが同じになるように協調的に結合す る. このような結合様式は生理学的にも確認され ている[6 4].
このネットワークで シミュレーションしてみた結果,α=1.5,ß = 2で も図6.5の例では図6.5と同じ結果が, また図6.7の例では図6.9のように 正しい結果が得られ た. また直線の右端が固定枠 に達していない図6.10 の例で も同図に示すように正しい[6 5]結果が得られ た. これは固定枠か ら左に延長する点の重みが0.5であり 1より小さいためである. また図
6.11のように鈍角の窓枠のときも知覚されるのと同じ右向き( すなわち両 端点の動きの平均)の速度が得られた. 最後にこのネットワークで図6.5 の例をシミュレーシヨンしたときの速度ベクトルの収束の時間経過を図
6.12に示す. 初期値はqiX= 1/ηにしているので最初はV = 0である. そ の後全ての点で右斜め上向きになり, それから端点からの情報が伝播し て次第に上向きになっていく様子が分かる. ここで伝播が上下対称でな いのは, 図6.6で述べたように第lフレームの点で速度を求めているので データが上下非対称なためである. 第1フレームと第2フレームの中間 の場所で速度を求めると図6.13のように上下対称になる.
6.2.4 むすび
ファジーハフ変換に基づく運動知覚のニューラルネットモデルを提案 してパーパーポール錯視の例をシミュレーションして心理実験結果を再 現できることを確認した. 本モデルと従来の正則化によるモデル[41]と の違いは, 正則化では変数は速度Vそのものであり, 正則化項は(1ウピ
I公+1)2であるのに対し, 本モデルでは正則化はニユーロンの出力に作用 し,(qiX -qi,X+l)2である. 従来の正則化では不連続も平滑化されてなまっ てしまうのに対し, 本方法では不連続が保存されるのは, まず第1段の f(V)による局所統合はロバスト性により不連続を保存し3 次段のニユー ロン聞の相互作用では, WTAによりqiXは 1-out-of-nベクトルであるの で(qiX -qi,X+l)2はOか 1であり,Viの不連続のジャンプ幅によらずエネ ルギー差は一定値 1であるので, 不連続が保存され, こうして全体を通 して 不連続が保存されるためである. このようにして本方法では, ノイ
ズの平滑化3 不連続の保存, アパーチャ問題の解決を同時に行うような 空間統合が実現されている. なおここではWTAは大域的すなわち大域 最大値をlつ選択するとしたが, これを局所的なWTAとして複数の極 大を検出するようにすれば透明視[74]も再現できる[75]. これはハフ変換 において複数個のピークを抽出することにより複数個の図形を検出でき ることに対応している. またここでは空間的な統合だけを使ったが, フ レームが 3個以上あれば時間的な統合(積分)も行え, 実際心理実験や生 理実験の根拠もある[76]. そのような時間軸での統合も取り入れるのは今 後の課題である.
110
15
木ーーち木||冷 木ーー冶 \ ↓小ーも \ + や + 冷
\ゑlψT ゑー中 \念ドlvf
、 私||平 木ー-c 木ー-c 木ーも 木-ー冶 \ 木llG \
10
5
O ←一一一一一一一一:一一一一一一一一一
。 5 10 15
図6.8:運動例2(α=1, ß = 2)
木ーーち 木il冶 \ 木ーーも \ 木|Jゆ\ 木ーゆ\ \ゑ|心平 泳ー中 ゑー中 、ー中 \arlvf l
木|IG \ 木ll冷 木||冷 木ーー。 木ー-c
15←
一
10←
一
5←
一
0トー
i O
よ 5
」
10
i 15 図6.9:運動例2(α=1.5, ß
=
2,γ二2)112
15
10
。
。一→妹、ァーが
、一一今敬一一争時、殺一一歩
5
、食ー今、全一一決
、食一一決
、令ァー券
、一一決
10
図6.10:運動例3(α= l.5,グニ2,γ= 2)
15
t:;:
+
15ト
10ト
5ト
0卜 十
+
5 10 15 20
図6.11:運動例4(α= 1.5,グ= 2,γ= 2)
114
木ーーち木ーーも 木ーーも 木 木11 4↑lφ 、
サ 々 、 仲 J U明
7、,,v、
+ i JO + ? 枝 、 i +, dw T +小/ @ 、
15ト
+
15 6、ぜm‘F フ+ J、J
、〈ム ヌ J
ナ、ノー
10トぐォ玖 ー 'tl
5ト• 、
OトT 7 寸
5 10 15
t=75
15ト
{I 添U、f +、 吋 � 1.1
→ 15
10ト
ltr
4 105ト
II
、;
4 5:、;
。 5 10 15
t=200
よ O
斗
5 10
_j_
15
t=150
i勺下七 ‘ 勺
i、111
1勺勺
• 、 .
。 5 10 15
t=225 図6.12: Vの収束の様子
r-1'
�
ï+折
、
、九百
。/' + ー刻
、、4tq百
� 〆 +司 令
/'+ つ珂
。/'
+司
令
可争 〆 +ー / 河 +折
、 fデ出
、 , 宅〉
1!、If少
。、よず+河
。、よ七九十河 魚、 4 九九 、 久
勺 :! ?
15
『
15ト10
『
10ト5 5ト
Oト
よ
0
i 1 ム
15
10 5 10 15
t=150 t=175
小+lhv 小十lhw 小+l
h明、
小十l hv、
小↑吹 か?φ
、
i伊/ 品円 、
+/AK 伊/
魚、
か1 AM、
小+la 小ふ|、 小+|。
小+lhu
小+|。 小↓lnv
小T、 小+l
hv、
小T hv、 小↑
』守、
小TU玖- AlT L欲 不↑
、 鉄
ホ↑ 、企 小+|
、由同 小Ti、 小+la
小+ー、
小+ー、 〈明
15ト 15
10ト 10
5ト 5
Oト
。
。
5 10 15。
10 15t=200 t=250
図6.13:中間点でのVの収束の様子
116
6.3 動き検出
複数の動きを含む動画像から個々の動きを抽出するにはロバストな推 定法が必要であり, 代表的なロバスト推定法であるハフ変換もよく使わ れている.ハフ変換ではパラメータ空間での分布のモードを取り出すの で, 主要な動きから順に逐次に取り出すことができる. 混合分布モデル のように同時に複数の動きを取り出す方法では動きの個数をMDL法な どの込み入った方法で決める必要がある[77] が,逐次抽出法では抽出の 停止条件を与えるだけでよく, 抽出された動きの主要順位も分かる. ま た動きを一つずつ求めていくので求解の困難度も軽減することができる.
通常は少数の動き領域を抽出するだけで十分な場合が多く, 特に背景画 像を連結して作られるモザイクとかスプライトなどと呼ばれるパノラマ 画像は通常, 最も面積が広い動き領域だけを抽出すればよく, ハフ変換 が適している.
本節ではアフィン変換動きモデルによる大域的動き領域分割を考える が,これにもハフ変換はよく用いられている[9].しかしハフ変換には3量 子化幅の設定やパラメータ数による探索量の増大などの問題点がある.計 算量については, しきい値処理による逐次動き抽出による簡略法が提案 されている[78].一方,ハフ変換の種々の難点、を解消する一方法として,
ファジーハフ変換が提案されている[32, 75, 53].そこで本節では,ファ ジーハフ変換に基づいて動画像から主要な動き領域を逐次に抽出する方 法を提案する.
6.3.1
ファジーハフ変換による運動検出
多くの動き検出法で用いられているように, 本報告でも動きをアフィ ン変換として表すことにする.すなわち場所(x,y)の画素の動き(υx,vy
)
が
υx
=
(α-l)x + by + c%二dx+
(e
- 1)ν+f (6.18)で表されるとし,係数(α,b,c,dぅ久f)を動画像の二つのフレームから求め る.これはl種の関数回帰問題であるので, まず最初にファジーハフ変
換による関数回帰法[75] について述べる.
4章で, ファジーハフ変換による関数回帰について説明しているが,
再度ここでも触れておく.独立変数zと従属変数uの組のデータがη組