ファジーハフ変換によるロバスト画像処理

(1)

九州大学学術情報リポジトリ

Kyushu University Institutional Repository

ファジーハフ変換によるロバスト画像処理

岡田, 正之

九州芸術工科大学

https://doi.org/10.11501/3168352

(2)

第5章ア二一リングファジ-ハフ変換

5.1 まえがき

この章では，ロバスト回帰の1手法としてアニーリングファジーハフ変換による方法を提案する

[

⁵³

]

^.

ノイズに埋もれたデータからパターンを抽出する問題は1種のロバスト回帰である. ロバスト回帰の方法はこれまで数多く提案されてきており

[

19

]

，ハフ変換もその1つである

[

³¹

]

. ハフ変換は大域的な構造を抽出する優れた方法であることが認められているが3 実用的な難点としてパラメータの数が増えたときの計算量の増加やディジタル化するための量子化幅の設定の困難などが指摘され，多くの改良案が考案されてきており

[

³⁸

]

，そのなかの一つにファジーハフ変換がある

[

³²

]

^{. しかしファジーハ}

フ変換においてもファジ一度の設定や初期値設定など実際の適用において難しい問題がある. 本章ではファジーハフ変換のこのような難点を解消するために組合せ最適化で用いられるアニーリング

[

⁵⁴

]

^{を導入する.} ^ァ

ニーリングは基本的に整数計画問題に導入されるものであるから， Roth ら

[

³¹

]

^{やStephensら}

[

⁵⁵

]

の非線形計画問題としての表式やHanら

[

³²

]

^の

ファジ一理論による定式化には導入できない. そこでここではファジーハフ変換を整数計画問題として定式化してアニーリングを導入する. そのためにまずテンプレートマッチング

[

³⁰

]

を整数計画問題として定式化して，それをロバスト化したものでパラメータ空間での最適解を抽出する場合がハフ変換に帰着されることを導く. またこの整数計画問題の定式化に基づいてハフ変換をファジー化し，それが代表的なロバスト推定であるM推定の1種となることを示す. 更にこの整数計画問題によるファジーノ\フ変換の定式化にアニーリングを導入して，データ分布のスケールや初期値に依存しない解を得る方法としてアニーリングファジーハフ変換を導く. ファジーハフ変換

[

³²

]

でのテンプレート抽出の基本的なステップは3 大域最適解すなわちパラメータ空間の分布の最大ピークを1つ

78

(3)

取り出すことである.複数個のパターンを抽出するには，取り出されたテンプレートに所属するデータを除去した後に次の大域最適解を取り出すということを繰り返す.ここでも同じようにして逐次にパターンを抽出する方法をとることにする.そうすると抽出の各段階では大域最適解を1つ求めればよい.

3章でも触れているが、この章でも基礎として可変形テンプレートマッチングの復習をしておく.データとしてm個の点di

(i

_{= 1γ・.，m)}

が与えられるとする.この点パターンからη個のテンプレートを抽出する.テンプレートのパラメータを釣(j = 1γ・1η)とする.例えばテンプレートが直線y=αx+bである場合にはめ=(αj，bj)である.点diと第j テンプレートとの距離を D(di，pj)と記す.このように定義するとテンプレートマッチングは

m n

mln 乞乞xijD(di， Pj)

1二1 j二l

subj.to

L

_{Xij = 1，} _Xijε{O，l} ^{，，，E店、、} ^にJU ^1Eょ ^、、EEFJ

という混合整数計画問題として定式化される.バイナリ変数Zりは点diが第3テンプレートに属すメンバーシツプを表す.式(5.1)で最適化すべき変数はZりとめである.式(5.1)は可変形( deformable)テンプレートマッチングと呼ばれ，近似最適解を求めるニューラルネットアルゴリズムが提案されている[33].しかし式(5.1)では各diは必ずどれか一つのテンプレートに属すことになるので，テンプレートから大きく外れたノイズデータがあると抽出されるテンプレートが正しい位置からずれてしまう.この問題点を解消して外れデータ(outliers)に対してロバストにするには式 (5.1)を

min L玄Xij・D(di，pj)+α玄Xi，n+1

i=1 j二1 ^ì=1

subj.to η+1 乞Xij= 1， Xijε{O，l} (5.2)

と変更すればよい.こうすればどのテンプレートからも距離α以上離れているような外れデータではXij =

0 u

₌1γ・1η)， Xiη+1 - 1となり，

そのような外れデータは無視される.

(4)

この方法では抽出するテンプレートの数ηを予め設定しなければならないが，この設定は一般には困難である. そこでいっそのことη= 1としてみる. すなわちテンプレート図形を1個抽出する場合を考える. すると式(5.2)は

luin

L

^XiD(di，^{p) +α}

乞

⁽¹^-^Xi) ^(5.3)

i=l 2=1

となり，定数項は取り除いてよいので結局

mln

乞

[D(di，p) -α]Xi (5.4)

i=l

α α

<一>

PA PA

，d，d DD

1i ハU

/llIt--K 一一

は小川

Z 解

の

Aせにυ

式るな

〉」

(5.5)

となる. 距離 D(di，p)の取り方にはいろいろあるが，特殊な場合として

1

⁰ ^DE(di，p)三α

D(dzJ )=

{ _l

^{(5 6)}

D E ( di， p) D E ( di， p) >α

というのを考える. ここで DE(di，p)はdiとテンプレートとのユークリツド距離である. D(di，p)がこのような距離であるときには式(5.4)は

mln α

L

^Xi (5. 7)

すなわち

m

max

L

Xi (5.8)

となり，式(5.5)は

{

^�_o

恥川DE(di似似川d仇t

DE(dιi，P刈) >α ^(5.9) となる. すなわちパラメータpの空間で式(5.9)に従ってXiを算出すれば，その累積値�Xiが最大になるpがテンプレートの位置を与えることになる. これは多数決による検出であり，ロバストハフ変換法の一種である[36].α↓Oの極限が狭い意味のハフ変換すなわちラドン変換になる [37]. 以上によりハフ変換が式(5.4)の整数計画問題として表せることが

導かれた.

80

(5)

5.2 ア二一リングファジ-ハフ変換

以上の方法すなわちハフ変換はねが 0か 1の整数値であるのでディジタルアルゴリズムであり3 コンビュータで効率的に実行できるが，テンプレートのパラメータの数が増えると探索空間が急速に増加して計算量が増加し，また量子化誤差などの問題がある[38]. 例えば式(5.3)のαが小さすぎると抽出結果がノイズに敏感になり，逆に大きすぎるとロバスト性が低下する. 適正なαの値の設定は難しい.

ディジタルハフ変換のこのような問題に対処する1方法としてファジーハフ変換が提案されている[32]. そこではファジ一理論に基づいてファジーハフ変換が導かれているが，ここでは上記の最適化問題のファジー化としての導出を与える.

ここで，アニーリングファジーハフ変換に入る前に基礎となるファイジイハフ変換に再度触れておく. 前節の整数計画問題をファジー化するには引が取る値を実数値[0，1]として3 式(5.4)にエントロビーに似たファジ一化関数ゆ(x)(具体的な関数形は後で導く)を付け加えて

mlll

乞

_D(di，p)_[ _-α仇+

乞

_ゆ(Xi) (5.10)

ì=l 2=1

とする. 以下ではD(di，p)はユークリツド距離の 2乗11 di -q 112とする.

ここでqは diに最も近いテンプレート上の点である. 関数ゆ(Xi)に対する条件について考える. 式(5.10)の解Xiは

D(di，p) -α + ァdゆ = 0 αXi

、、1E，，J11ム11ょに.υ〆'『t、、

を満たす. これからD(di，p) -α= -dゆ/d Xiとなるからこれを式(5.10) に代入すると式(5.10)は

mむ (zt)-dl

^(5.12)

となる. 従ってkをある正定数としてゆ(Xi)が

ゆ(Xi) - Xiア= -kXi αXi dゆ (5.13)

を満たせば式(5.10)は式(5.8)すなわちハフ変換と同じになる. ただしこの場合Xiは実数値を取るのでファジーハフ変換になる. 逆に式(5.10)が

81

44・rI，

(6)

ハフ変換をファジー化したものになるためにはゆ(Xi)は式(5.13)を満たさなければならない. 式(5.13)の解は

ゆ(Xi)= kXi(ln Xi -1)

となる. ゆ(Xi)が式(5.14)のとき式(5.10)の解 Xi は式(5.11)から

Xi二e k となり3 これを代入すると式(5.10)は

となり，これは

a ごL -whP) max ek � e k

と一D(川〕

max �e k i=l

(5.14)

(5.1 5)

(5.16)

(5.17)

としてもよい. 以上のことはファジーハフ変換ではα=0としてもよいことを意味する. 式(5.17)は既に提案されているファジーハフ変換[32]

の式の一つに一致する. 以上により，ファジーハフ変換の最適化問題による定式化が導かれた. ディジタルハフ変換が{ 0，1}投票による多数決であったのに対しファジーハフ変換は[0，1]投票によるファジー多数決である. ファジーハフ変換のメンバーシツプ関数 (式(5.17)の指数関数)はファジ一理論により経験的に設定されていた[32]が，ここでの導出により数理計画論的な根拠が与えられたことになる.

5.2.1

口バスト推定としての表式

Rothら[31]はディジタルハフ変換がロバスト推定の1種として表せることを示したが，ここではファジーハフ変換がM推定の1種として表せることを示す. M推定は最も代表的なロバスト推定の1つである. 1\11推定の基本は最小2乗法である:

min

L

^D(di，p) ^(5.18)

i=l

M推定は式(5.18)で距離のノルムを変えたものである[18]:

min

L

^{σ(D( di，}

^p))

^(5.19)

82

(7)

関数σとしては飽和する関数が使われる(ここではD(di，p)をユークリツド距離の 2乗としているのでσを導入した ). 特にσ(X)= _e-xjkとしたものが式(5.17)であり，従ってファジーハフ変換はM推定の1種であるといえる. 確率分布をガウス分布と仮定したときの最尤推定が最小2乗法であり， M推定はガウス分布以外の分布を仮定していることになる. 例えばラプラス分布に対する最尤推定値はメジアンである[17]. ファジーハフ変換の基となる分布を調べるために，まず式(5.10)のゆとしてニューラルネットなどで最もよく使われるシャノンエントロビー

ゆ二k[xi1nxi+ (1 -xi)ln(l - Xi)] (5.20)

の場合について調べよう. ゆが式(5.20)のときの式(5.10)の最適解Xiは X，; =^{一一一一一}l

t 1+eD(dup)/k (5.21)

となる. ただしα=0とした. これを式(5.10)に代入すると式(5.10)は max

玄

ln(l + eD(川)jk) (5.22)

i=l

となる. 式(5.22)はStephens[55]の確率的ハフ変換PHTに一致する. すなわちデータの分布を一様分布とガウス分布の和 1+ e-D(di，p)jたと仮定したときの対数尤度が式(5.22)である. しかし式(5.16)の導出で述べたように式(5.22)はmax �Xiとはならずディジタルハフ変換の式(5.8)には帰着されない. 式(5.8)に帰着されるのはゆが式(5.14)のときであり，このとき式(5.10)は式(5.17)となり，これはデータの分布を

p-D(di，P)jk

e- (5.23)

と仮定したときの対数尤度である. グラフを書いてみれば分かるように 1 + e-D(di，P)jkと式(5.23)はよく似た関数である. 以上によってファジーハフ変換(17)はデータの分布を式(5.23)と仮定したM推定であり，確率的ハフ変換 [55]とほとんど等価であることが分かった. 式(5.22)や(23) を微分すれば分かるようにこれらはば推定のなかの再減少(redescending) 型[18]に属する.

5.2.2 ア二一リング

ファジーハフ変換はディジタルハフ変換よりもノイズに対してロバストである[32]が，デ、イジタルハフ変換の問題点である量子化誤差は本質的には

(8)

解決されてはいない.ディジタルハフ変換の問題点であったαの設定の難しさはファジーハフ変換ではkの設定の難しさとして受け継がれている.このことを簡単な例で調べておく. データもテンプレートも1次元空間中の点であるとする.データは 9個としそれらの位置は0，0.25，0.5，0.75，1，2，3，4，5 とする.ハヌ変換解すなわちモード値は0.5 である.式(5.17)の解は最急降下法で求めることにする. 初期値はデータの重心11/6とする. このとき求まる解はkによって図5.1 の実線のように変化した.この理由は，k が大きいときにはファジーハフ変換は最小2乗法となり従って解はデータの重心11/6となる.kが次第に小さくなると解はモード値に近づくが，

更にkが小さくなると局所最適解が生じて最急降下法はそれに捕われるようになる.このような結果解は図5.1 のような変化をする.またデータを全て10倍したときと0.1倍したときの解も同図に示す.

この結果はkの設定の難しさを示している. すなわちデータ分布のスケールが異なる個々のデータについて最適なkの値を予め知ることは一般に困難である.このことはHanら[32]も示しており，kの設定法は課題として残されている.ここではアニーリング法[54]によるこの問題の解消法を提案する. まえがきでも述べたように，テンプレートの抽出は Hanら[32]のファジーハフ変換に従い逐次に行うので，各段階での抽出では大域最適解を1つ取り出せばよい. アニーリングは整数計画問題の大域最適解を取り出す1つの方法であるから，前に導いた整数計画問題の定式化にアニーリングを導入することにする.アニーリングはこの場合，十分にファジーな解から出発してファジ一度を徐々に減少させていき，最終的にディジタルハフ変換を得る方法である.すなわち式(5.14 )を代入した式(5.10)(α はOにする)においてkを最初大きな値にした解から出発してkを徐々に減少させながら式(5.10)の解を追跡し，十分小さなk でディジタルハフ変換を得る(k↓Oのときファジーハフ変換式(5.10) はディジタルハフ変換式(5.4) に収束する). こうすることによって大域最適解に近いディジタルハフ変換解を得ることができる. このことは次の性質によって間接的に示される.

[性質l]kを減少させながら式(5 .10)の解を追跡すると�D(di， P)Xi は単調に減少する.

([正明)Xi (i ⁼1，・•，m)とpとを合わせて一つの変数y = [ Xlγ・， Xm，p]

と記す.またf(y)= �D(di，P)Xi， g(y) = �xi(lnxi -1 )とおくと，α=0 であるので，式(5.10)は

luin f(y) ⁺kg(y) (5.24)

84

(9)

100

10

0.1

0.01

0.0001 0.01

K

図5.1: kによる解の変化

I ^/'

i _//

I ^/

I /

l_..- ...

100

(実線:スケール1，破線:スケール10，点、線:スケール0.1)

10000

(10)

である. 式(5.24)の解は

θf θ。

一一+k�乙二O

θu θy (5.25)

の解である. 式(5.25)を kで微分すると θ2f θ2g θu θg

(-+k-)-+一=0

θy2 θy2θk θu (5.2 6)

となる. これから

を得る. これを

に代入すると(28)は

θY 一二一fθ2f( 一一+k一一θ2g \-1δg )-1:.7

θk \θy2 θy2/ θu

df θfθu dk θuθk

(5.27)

(5.28)

df θffθ2f θ2g \ー1 θg

一=一一 (ーす +k-) i- (529) dk θY \ 8y θy2/ θu

となる.これに式(5.25)から求まる θf/θν=-kθg/θyを代入すると df θg/θ2f θ291 -1 θg

一=k一一(�τ +k-) ^一 (5.30)

dk θY \ 8y θy2/ θν

を得る.解は式(5.24)の極小解で、あるから目的関数のヘツセ行列 θ2f/θy2+

kθ2g/θy2は正定値行列であり， kは正であるから式(5.30) よりdf/ dkは正である. 従ってkが減少すれば fも単調に減少する. (証明終)

min 'ED(di1 P)Xiの解がディジタルハフ変換であるから，性質1はアニーリングによって大域最適解に近いディジタルハフ変換が得られることの一つの根拠となる. なお式(5.14)を代入した式(5.10)は式(5.17)になるのでアニーリングにおける各kでの解はファジーハフ変換式(5.17)で求

めればよい.アニーリングでは最初kは大きな値にするのでいつでも最小2乗解から出発することになり，初期値依存性はなくなる. すなわち

k↑∞のとき解はスケールによらず最小2乗解になる. また k↓Oのとき解はディジタルハフ変換解の一つに収束する. ディジタルハフ変換解は離散値をとるので有限の吸引域を持つ. 従ってkの初期値を十分大きくとればスケールによらず同じ(スケールは異なるが)解が得られる.このようにしてアニーリングによってファジーハフ変換の難点であるスケール依存性が解消される.

86

(11)

本節の冒頭であげた9個の1次元データについてアニーリングを行ったところデータのスケールによらずいつでも最適解O.5xスケールが得られた. 別の例として図5.2のような8個の 2次元データに直線を当てはめる例において回帰直線がkの減少とともに変化する様子を同図に示す. なお直線のパラメータ表現はxcos8+ ysin8 =ρを用いた. 図5.2は，3章で述べた通常のk固定のファジーハフ変換でkの値が充分小さくないと正しい直線が得られないことを示している. どのくらいkが小さければよいかというのは自明ではなく3 また図5.1でも示したようにkが小さいと式(5.17)の関数が平坦になるので最適解に収束しにくくなる. アニーリングは最適解を追跡することによってこのような収束の困難も解消している. 同様な事例を 3章で行った図 3.1のデータを使用して行った. 結果を図5.3に示す. 図5.3がアニーリングファジーハフ変換で得られた 2つの放物線であり，図5.4は比較のためにkを大きな値に設定してファジーハフ変換で得られたもので3 ノイズの影響により正しい曲線からずれている. このようにアニーリングファジーハフ変換によればノイズに影響されずにテンプレートを抽出することができる.

5.2.3

オフティ力ルフロー推定への応用

ここで提案したアニーリングファジーハフ変換法の有効性を検証するために画像強度の時空間微分によるオプテイカルフローの推定の例に応用してみる. 時刻tでの第(i，j)画素でのグレイレベルをI

L

^と記す. ^このグレ

イレベルの勾配

DX;j

二

1;+

^1，

j - 1L， D�� = 1f，j+1 - 1f，j' D

^Ti

�

^二

Ir

^l

-4

による第(i，j)画素での速度ベクトル切=(

均

^{， v}

Ïj

^{)に関する拘束は}

DX; 坊 +DK; υ む +D勾=

0 (5.31)

である. 2個の変数υ

ふ

^u

C

に対して式(5.31)1個だけでは式が足りないので，近傍の画素での勾配も用いてυ

5

⁷

坊

が推定される. このとき最小 2乗法だとノイズや物体境界などで推定値が歪むのでロバストな推定法が必要とされる. ここでは上記のアニーリングハフ変換を適用してみる. すなわちファジーハフ変換

max 乞乞e一(DX;jvtj+D小九+DTi})2

^jk

PEN(i) qεN(j)

(5.32) によってυ

ふ

^υ

む

を求め，kを小さくしながら解を追跡し，最終的な解を得る. これを各画素(i，j)で行う. 式(5.32)でN(i)，N(j)は'ì，Jの近傍すな

(12)

3 T T 丁寸寸

/ 一ノノ /1i / /

β / ハU /

ニ / LK ノ / / / / /

〆ノ

/

'・ノー 'I

F/'・

。 '

，mw'・，ノ。て

/ A

/・'hvy，・Jん.f

，/Av

， / dvノ

〆，ノ

， / ト

』r ハU FhJV |ur

2.5ト

2←

1.5ト一

k=O.6

1← . 。・. _{. ‘ ー}

- k=100

。

。 i

O 0.2 0.4 0.6 0.8

-0.8 ・0.6 -0.4 -0.2

図5.2: kによる回帰直線の変化

88

(13)

丁寸す

AV

AV AV -AV

AV 。。

0 0 0

。も o

O _{o 0 0} V₀ 6 0 09 0 ^v

^ 0 0 0

o 0 ^ 0 OV 0

80付。 ; 0 ⁰ _o0 、 o 0 ⁰

0 ^ 0 ^.00

%、P 9 0 0 ^0.0め ^宇^q

o υo ^w 0 宇，

マ。 o ^0"， ^{0 0}0 ^ó ⁰ ^，^Y

60トo 0や o ^V ^V 0⁰ 0 _{� 外}

o 'ò? 0 ⁰ 0 ⁰ 0 ^{^} ^Vi 0

。、ゆ o0 _(> 0 0 0 v (/ ⁰

o 0 "、o 0 ^{o^} ^Vo 00 00 00 _</

40卜 o '<ll ⁰⁰ ^s ⁰ ^(;) ⁰ 0 〆

「。、 o 0 o .，�込o 0 ⁰

iO ^ 0、 00 (> 0 0 (> タ。

I ^• ^V ^{、^} o' 仏 o 0 0，"

20トv、<(� _(> ^" _j{⁰

^ 0 G>'V，. ^ 0 ^}'

。冷奇o 0" __ÇJ (>

\ 00 4 90 JS ^V 0 0

0 、受企.<')-�.(>^__0.ò.'O一申�，�，O'O�o一合阜J

。かO'い杭己益金 o。ぞか令<s. 'O'O-�'O

\。向。o 、。九J+句ず F600 J

Ø-��O<Y g ^"o (;) ^{^} 0 v 0 v8�0... 0

'"・ov ^ 0 " 0 ⁰^V 0 v .�ト0

.20ト 90e 9 6 0 9 0 0 0

r "y " . 0 0 0 。 ^ v 0 ^{0 0}0 ^O.00 ⁰0⁰ 0 0 ^c

8 0 0 0 ..^ 0 ⁰ ^" ^

(> . <X>V 0 ^V

∞ ぐ九 ô ⁰ ⁰ô ₀ 0 0 000 v _^ ^{O �v}v Ô 0 0 v ^ 、0 。

VO 0 c品。 ∞'0 ^$ 0

，v 1 9 0

o 1

。 o 00 ^ o �

o 00 。。

。。

AV

AVAV

AV

00 9

ー60.3 .2

図5.3:放物線の抽出例(アニーリングファジーハフ変換)

(14)

丁 0

0 0 AV AV AV AV _o^o

0

。-r--oo o 00 ^

o �.

。も。

。 o 。。。。。。。

0 9 0 o

。 0 0 0 00

。。

、。0 0 09co 0

。。。。

。。。 o 0 0

。

o 0 0 0

8

。事

-⁴⁰� ⁰

Aιv AV

AV AV AV AV AV

。。

AV AVAV

AV AV -ny

ー60 。。

・3 -2

図5.4:放物線の抽出例(kが大きすぎるファジーハフ変換)

90

(15)

わちウインドウである.図5.5(a)は最小2乗法で得られたフローの例であり，一方本方法では図5.5(b)のように物体の境界付近での誤差が図5.5(a) よりも小さい結果が得られた. ウインドウは 5^x 5である.これまでも

オプテイカルフローの推定には種々のロバスト推定が用いられている[56]

が，最も多く用いられているM推定はここでのkのようなパラメータを含み，通常図5.5(a)と(b)の中間的な結果が得られる.k固定のファジーハフ変換も同様である. ディジタルハフ変換による方法[57]は量子化幅の設定が問題である.2章で提案したロバスト推定の 1種であるLTS法にアニーリングを用いてスケール不変にした手法も適用してみた[14]が，

LTS法での計算時間が 55秒であったのに対し，本方法では8秒であった.

5.3 ニューラルネットによるファジーハフ変換!

アニーリングはニューラルネットでよく使われる手法である.ファジーハフ変換をニューラルネットで実現するために，まずパラメータpの空間を離散化して各離散セルのpの代表値をめ(j ⁼ 1，. 川)とする. すると式(5.17)の解は

max 3 {乞e-Ð(仰j)/k，ji=l = 1， ...，η} (5.33)

の解をfとするとPj*である. 式(5.33)は次の整数計画問題に定式化できる.

mpx 乞XjYj j=l

subj.to 乞zj二1? ZJε{O，l} (5.34)

ここでYj二�ie-D(di)Pj)/たである. 式(5.34)の解は上記のfによりXj*⁼ 1， Xj二o (j # jつと表される.従って式(5.17)の解 Pj*は (5.34)の解zにより

Pj* ⁼

:L

_XjPj _(5.35)

3二1

と与えられる.これらの過程は図5.6のようなネットワークで表せる.

ランダムに動く点パターンからグローパルな運動を検出するニューラルネットとして図5.6と同じようなネットワークがモデル化されている

(16)

\.0 tv

\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ

\レ\レ\レ刈/ψいlζv-\J/ --v .:::J �叫--V-...v"レ\レ吋/'\)/

\レ\レ-...v\J/\V\ムビ弘、/_J �当'-V\J/\J/\J/'\)/'\)/

\レ\レ'-V'....vY "-1.:ζ ιし.J � -:去しL"-\V

ψ

^\レ

\レ\レ-l)ラプLえぐf守ラシfぞ(^L"レ\レ

、てベフペ171/トノト/トノト/ト冷Jて!てFてど

\レ\レノ， l' '\"レ

v

'\)/ '\)/.J寸明ポ小小小小小小

六

^六下L'\)/^'\)/

\レ\レゾ寸/へ/久/ト/ト/ト/トノトノトバ'r- (ν\レ\レ

\レ\レv)ぺ小、/ト/ト/ト/ト/ト/トパ'r-く\V"レ\レ

\レ\レ〉寸ペ/人/卜/ト小小小小パ\介、ぐ\V"レ\レ V A パ，/れノト小/ト/ト小小 /T'-AA.V

\レ\レ /"" ハ"''\)/'\)/

\レ\レvv-1ムム)')ペ「ぐくしYy"レ\レ

\レ\レ'\Vvザ��三J斗-JLι\t-\v \J/ '\v "レ\レ

\レ\レ-...v-...v--v剖�当ふlザレーIL�乙ψ\J/ '\j/"レ\レ

\レ\レ\レ\レJ斗/￥斗l.:_.j-..vv-"乙仏、ψ刈/"レ\レ\レ

\レ\レ\レ\レ'\)/'\)/ "レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ

\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ'\)/'\)/ "レ\レ\レ\レ\レ

(p) 棚よJN淵時

\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ�'\)/ '\)/ '\)/

'\)/

^{'\)/ '\)/}

vψψ'\)/'\)/料料ぷ淵�'\)/'\)/'\)/'\)/

'\)/'\)/'\)/ 、

同

小小小小小

小小小不利(

'\)/ '\)/ '\)/

\レ\レ\レ \レ\レ\レ

小小/ト小小小小/ト/ト/ト

\レ\レ\レ\レ \レ\レ\レ\レ

/ト/ト小小小/ト小小/ト小

\レ\レ'\)/

'\)/ � �

: : : : : : : : '\)/ '\)/ '\)/ '\)/

小小小小小小小小小小

\レ\レ\レ\レ \レ\レ\レ\レ

小 /ト小/ト/ト/ト小小小/ト

\レ\レ\レ-，，，，，，，，，， _' "レ\レ\レ\レ A 小/トノト小/ト/ト小/ト/ト/ト/ト

\レ\レ\レハ \レ\レ\レ

小/トノト小小小/ト/ト

\レ\レ\レ\レ\レ \レ'\)/'\)/ '\)/ "レ

寸/"レ\レ\レ\レ\レ\レ\レ\レ\レ\レ"-"レ\レ\レ\レ\レ\レ

\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ'\)/'\)/'\)/'\)/

\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ'\)/'\)/'\)/'\)/'\)/'\)/

'\)/ '\)/ '\)/ '\)/ '\)/ "レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ\レ σd

uuいl三℃山川，，リuuuいU久、/リー糊潜

図ωω一斗刈。中いよけ」ヤ刈口182

(17)

• • • •

- ・・ .

dl

^- ^・ ^・ ^.

dn

図5.6: ファジーハフ変換ニューラルネット

(18)

[58] . Zohary[59]らはランダムドットの運動方向の分布を変えて心理実験を行い，平均値とモード値の中間的なファジーな値が知覚されると報

告している. その実験状況をファジーハフ変換により

max

L

aie-[(cosBi-CosB)2+(Si叫-sinB)2l/k (5.36)

と表してみよう. 8iはドットの運動方向であり，度で表すと0，30，60，90のいずれかであり，。は知覚される運動方向である.αtは 8i方向に運動するドットの割合である.図5.7(a)はZoharyらの心理実験の結果の1例であり3 図5.7(b)は式(5.36)の結果の例(k ⁼0.5)である. これらの図で横軸は玄αi8iであり，縦軸はOである. 両図はよく似ており，知覚系のニューラルネットはファジーハフ変換でモデル化されると推測される.

5.4 むすび

テンプレートマッチングの最適化問題としての定式化からハフ変換の整数計画問題による表式を導き，それをファジー化してファジーハフ変換の混合整数計画問題による表式を導出した. その整数計画問題にアニーリングを導入して，データ分布のスケールや初期値によらないハフ変換の方法としてアニーリングファジーハフ変換を提案した. このアニーリングファジーハフ変換によるロバスト回帰法の有効性を曲線検出とオプテイカルフロー推定の簡単な例について検証した. また階層的ニューラルネットによるファジーハフ変換の実現についても触れた. 他の画像処理への応用や計算の高速化などが今後の課題である.

94

(19)

(Oω刀)CO一ちω」一刀刀ω〉一UU」ω止

。 20 40 60 80 /0(;

Calculated mean (deg)

(a)

ハUηζ

ハUa司，EE

nU ハu nU ハU ハu nU ハU ハU ハU nu 9 8 7 6 5 4 3 2 1

30 40

(b)

50 60 70 80

図5.7:知覚される運動方向のデータ分布による変化

(20)

第6章フアジハフ変換による運動検出

6.1 まえがき

この章では，フアジハフ変換を簡単な動画像からの運動検出に応用してみる. 6.2 節では，仮現運動の検出をフアジハフ変換でモデル化し，6.3

節では動画像から主要な動き領域を逐次抽出する方法を提案する[60].

6.2 運動知覚モデル

運動知覚のメカニズムの1つの論点は局所的な運動が空間的に統合される過程である. 計算論的なモデルの多くは正則化法による平滑化に基づく統合を基礎としている[41]. しかしながら正則化による平滑化では不連続も平滑化され，運動の境界がぼける. こうして，平滑化 (smoothing) と分割(segmentation)という相反する処理をどのようにして両立させているかに興味が持たれており [61]，最近パーパーポール錯視を使って多くの心理実験が行われている[62]. それらの実験結果は専ら端点に特異的に応答する(end-stopped)ニユーロンと正則化による伝播で説明されている[63]. しかしながらほとんどの運動検出ニユーロンは端点非特異

(non-end-stopped)である[64 ].

そこで本節ではロバスト推定の1種であるファジーハフ変換 [32]に基づく空間統合モデルを提案する. 本モデルは局所運動の検出に単純な相関だけを使っており，端点に応答するこユーロンと輪郭に応答するこユーロンという 2種類の運動検出器を用いるモデル [63， 65]よりも単純である. 本論文で用いる仮定は次のようなものである:1)2値画像を扱う . ただし濃淡画像への拡張は容易である. 2)時間を離散化して局所運動を相関で検出する. 3)運動情報は局所的なニューロン結合により空間的に伝播する. 4)窓枠による隠蔽の効果も取り入れる. この最後の仮定は心理

96

(21)

実験によって確認されており3 窓枠の裏側に線が延びていると認識されると，窓枠がないときと同じ運動が知覚される[66]. 2種類の運動検出器モデルではこのとき端点ニユーロンは無視されると説明される[66]. 本節ではその代わりに隠蔽に対応する重み付けを導入する. また3番めの仮定の空間伝播は心理学実験で、も確認されており[67]，ヒステリシスなどの原因と推測されている[68]. 本節で出てくるニユーロンはガウス関数を受容野とし，生理学的にも妥当なものである. 本モデルに最も近いものは Noest[69] によるものであるが，彼のモデルはアパーチャ問題のような唆昧なデータは扱っておらず，また空間伝播による統合も含まない.

6.2.1

局所運動の検出

まず最初に空間の各場所で局所的な動きが検出される. そのような運動検出器としてこれまでいくつか提案されてきている[70] が，ここでは

最も単純な相関によるものを考える. 図6.1のような 2フレームの画像

で説明する. これは長方形の固定窓の中で斜めの直線が水平に右に移動したものである. これを図6.2のようなデータでモデル化する. ここでは図6.1の枠を横4個，縦6個のセルに分割した(後述する実験では横15 個とした ). 第1フレームでは 2個の点、が，第2フレームでは3個の点が枠内に見えている. 枠の左に点、線で示している格子は，実際には隠蔽されていて見えないが直線が枠の外にも延びていると知覚されることを表している. 枠内で見えている直線を黒点で，枠外で見えない直線を灰色の点で表している. 直線の右下の端点は枠に達していないのでこのような延長はない. 図6.2のような画像データに対して次のような局所運動データが検出されるとする. 例えば第1フレームの(x，y) ⁼(0， 3) にある黒点は第2フレームでは(2ス)，(1，3)，(0，4)，(-1，5)，(-2， 6)のうちのどれかに動いた可能性がある. これらの動きのベクトルはそれぞれいdx， Vdy) ⁼

(2， -1)， (1， 0)， (0， 1)， (-1， 2)， (-2， 3)である. そこでこの5個(枠外にはこ

の2個の先にも点があるので実際にはもっと多い )を場所(0，3)のデータとする. ただし枠外への動き(-1， 2)と(-2，3)には重みω1を付ける(以下の実験ではω1 ⁼0.5とした ). また第2フレームの(0，4)の点は第1フレームの(1，2)，(0，3)，(-1，4)ぅ(-2，5)，(-3， 6)から来た可能性がある. これらの動きは(-1，2)，(0， 1)， (1 ，0)， (2，-1)， (3，-2)であるので，これらを場所(0，4)のデータ (枠外の点はもっとあることとそれらへの重み付けは前と同じ )とする. このようにして第1フレームと第2フレームで点が存在する場所に速度デー

(22)

-

^'

.

タが得られる. なおこれら全ての速度データに，速度の大きさに応じた重みω2 = e^-⁸1¹^均112を付ける (11日||2=dz+duである). 以下の実験では

ð = 0.02 とした. 従って枠外の点を始点あるいは終点、とする動きには重みω1ω2 (それ以外の動きには重みω2)が付くことになる.

6.2.2

ファジーハフ変換による最尤推定

前節で求めた動きデータは局所運動検出器によって観測される動きである. 場所Xd = (Xdl Yd)で観測される局所動きデータVdk = (υ�XlV�y)(各場所に複数個のデータがあるのでそれらに番号kを割り振る)は，場所 X = (丸Y)の真の速度ベクトルV= (υXl Vy)にノイズが加わって生成され

観測されたものとみて，このノイズの分布を p以(1りdク引cつIV川V川) =

1e川ω吋;〆e汁一

Z (6.1)

と仮定する.αとFは正定数，zは規格化定数，ωjはデータの重みである.この分布関数 ewe-x は図6.3に示すように1+ω(e-1)e-X2とほぼ等しく3 一様分布とガウス分布の和に近い. これはロバスト推定でよく使われる分布である[71]. このような分布の仮定の下で，観測データけから真の速度Vを最尤推定

ηx HF川IV)

^(6.2)

で推定することにする. 確率が積になるのは各観測データりが互いに独立と仮定しているためであり， TId TIkは全データにわたって積をとることを表している. 対数をとると式(6.2)は

ηx z z ^州りIV)

^(6.3)

となり，これに式(6.1)を代入すると

円与X

LLω〉一(αIIX-XdW+βIIV-り112) (6.4)

となる. 式(6.1)は1+ω(e-1)e-X・2でもよいのだが，このように対数尤度にしたときに簡単な式(ガウス関数)になるので ewe-X2にした.式(6.4) がファジーハフ変換によるロバスト推定である[29].

98

(23)

1st frame 2nd frame

図6.1:運動画像の例

(24)

E 圃T

• E.

oy-“ ・・ -L圃 • E -E

-

• ・E

-d ・・

• 1Ei

I

• 内〈υ

^"

• • • 凡ソ“ 4ttよハHHV 411ム n--“ η『U

Z

ハHU m nAu pl n41i i+EU 門、U 41Eよ

4

I I I

-

T

E

-

--

凡ソ“ ・・・』 • 1 -E

-

・d • ・・

4EEよ • ..

I

• qd

^"

• • • 凡ソ“ 4EEよハHU 4EEよ凡ソ“ 内〈υ

Z

2nd frame

図6.2:動きデータ

100

(25)

3

2.5

2

1 .5

1

0.5

O -3 -2 -1 。 1 2 3

図6.3:ee-22の関数形

(26)

式(6.4)の解Vは最急降下法などで求めることができるが3並列ネットワークでこれを行うためにハフ変換に倣ってVの空間を �(i=1，2，・・，n

)

と離散化して，それらの離散値の中から式(6.4)を最大にするものを出力することにする.以下の実験では離散値は町二(-2，-2)，九=(-2，-1)γ?九5二

(2，2)のように整数点だけにとった.このように離散化すると式(6.4)は

となる.ここで

�a/x f(�)

Z又1にn

(6.5)

f(V)

=乞乞吋e-(αIIX-XdI12+βIIV-り112)

_(6.6)

である.これを各場所Xで行えばその場所でのVが求まる.このようにして空間内の全ての場所で速度を求めることができるが，興味の対象は図6.2の各黒点、の動きであるから以下の実験では第1フレームで点がある場所だけでVを求めた.式(6.5)はη個の f(�)の中から最大のものを探すのであるからWTAネットで実行できる.そのために式(6.5)を次のように書き直す:

n

max

L

^f(�)qi

i=l

n

subj.to

乞

qi= 1， o ::; qi ::; 1 (6.7) i=l

これの解では， f(�)が最大となるtのqiが 1になり3その他のqiは 0となる.従って離散化誤差の範囲内で式(6.4)の解が

V=乞qi� (6.8) i=l

によって与えられる.式(6.7)の解は次のようにして求められる[72].

E 1 T

qi =ε?=leTJ (6.9)

とおけば式(6.7)の制約条件乞Llqt=1? 0三qi三1は自動的に満たされるから， riを最急上昇法:

dri θ n

E二死

霊

f(巧)qj二f(只) (6川 102

(27)

で変化させればよい. 以上の式からηを消去するには，式(6.9)から

dO-i ^，^dr ^η ^バ

ず

^=仏(

ず

^-

E

^q3

3f

⁾

となるので，これに式(6.10)を代入すれば

主

^{=仏 [f(Yi)}^ー

ト

^川l

、、自『，ノーtム11ム円hu〆''Et、、

(6.12)

となる.これが式(6.7)を解く微分方程式である.この式からd '�E.r:=l f (Yi)qd dt = ε�l f(Yi)qi[f(Yi)-L:J=l qjf(Vj)] 2:: 0 となるので， qiの初期値をε;Llqz=

1を満たすよう( 例えば全て1/η)にして式(6.12)で qiを変化させれば式 (6.7)の最適解に収束する.式(6.12)をニューラルネットで図示すると図 6.4のようになる. ただしXもVも実際には 2 次元であるが，1次元で表示した. また丸印で示したニユーロンはある1つの場所のものだけを示したが，実際にはこれがX方向に並ぶ.Yiと記したニユーロンは式(6.6) のf(Yi)を出力するRBF(radial basis function)ニユーロンであり，受容野の中心が(X， 1�)で， X方向の受容野の広さはfoに反比例する.v方向の受容野はゾ7Jに反比例する. なお以後単に受容野と言った場合X方向の受容野を指す. 2 段めのニユーロンは式(6.12)のダイナミックスに従うWTAニユーロンである. 式(6.12)から分かるようにこれらのニユーロン聞には抑制性の結合があり. これを図中の件で示している. 最上段のニユーロンの出力V二L:r=lqi yiがその場所での速度である. f(V)は式 (6.6)のようにその場所の近傍の観測データを統合したものであるから，V

は%を局所的に平滑化したものとなる. この平滑化は，正則化による平滑化とは違い，ファジーハフ変換のロバスト性により不連続を保存する.

このファジーハフ変換による局所平滑化の空間範囲( すなわち受容野) はVが連続な領域よりも狭くなくてはならない. その条件が満たされれば各連続領域内のノイズは平滑化され，かつ領域境界のエッジも保存される. しかしこの条件が満たされなければ受容野よりも狭い領域はノイズとみなされて平滑化されてしまう. このことが原因となってこの単純なファジーハフ変換ではアパーチャ問題を解決できないという問題が生じる. なぜならばアパーチャ問題を解決するためには各点での受容野が端点を含むように十分広くなくてはならないからである. このことを図 6.5の例で調べてみた.0が第1フレームの点， +が第 2 フレームの点である.左端と右端は固定枠上にあり，従ってこれらの左右に重み 0.5の点が延長されている( 図6.5では省略した).図6.5の矢印はα二1，ß = 2 で

(28)

図6.4:式(6.12)のニューラルネット

104

(29)

得られた速度ベクトルである. このαの値が正しい結果を与えるほぼ最大の値であり，それより大きくしてα=l.5，グ=2にすると図6.6のように知覚と合わない結果になる. これはα=l.5では受容野が狭くて端点の情報が全体には届かないためである. なお図6.6の上下が非対称なのは，

第1フレームの点で速度を求めているのでデータが上下非対称なためである. 第lフレームと第2フレームの中間の場所で速度を求めると図6.7 のように上下対称になる. 以上のことからこの例ではαは1以下でなければならない. そこで次に図6.8のように 3つの領域からなる例をやってみるとα=1， ß = 2では同図に示すように正しい結果が得られない. これは受容野が広すぎて領域聞の情報が混ざり合うためである. このようにこの単純な方法では図6.5ではα<1でなければならず，一方図6.8ではα三l.5でなければならず，両方で正しい結果を出すようなαは存在しない.

6.2.3

協調による統合

以上のように前節の単純な方法では全ての心理実験を説明するのは難しい. この方法で大域的な空間統合を行うには個々のニユーロンの受容野が大域的な広がりをもっ必要がある. しかしながら生理および心理実験での知見によればニューロンの受容野は局所的であり，ニユーロン聞の空間的な相互結合によって大域的な空間統合が行われているようである [73]. 前節のニューラルネットではニユーロンにはX方向の空間的な相互作用はなく，空間的な情報は受容野だけによって統合されていた. そこでニューロン聞に空間的な相互作用を導入することにする. ここでは最も簡単な結合様式として3 隣接するニユーロン間だけに結合を導入する.

前節ではVの場所を明示する必要はなかったので省略してきたが，ここからは場所Xでの qiを qiXと記す. なおXも離散化した場所だけを考え，簡単のため1次元として説明する( 実際の実験では2次元である ). 式 (6.6)のf(V)を， Xを明記して，fx (V)と書けば式(6.7)は

n1ax

LL

fx(只)qiX

X i=l

subj.to

L

qix = 1， 0 � qiX三1 (6.13)

(30)

木lu。\ 木JC 木ーーふ I

木llG 木十l冶 \ 木li恐木llc 木l込

一

15←

10←

一

5←

一

0トー一一一一;ー

i O

よ 5

」 10

斗- 15

図6.5:運動例1(α=1，ß二2)

106

(31)

15←

10←

5←

0ト…

i O

よ

5

...L

10 図6.6:運動例1(α= l.5， ß ₌2)

_l_

15

ー

一

(32)

T 15←

10←

5←

Oトーひ

i

O

よ 5

」 10

図6.7:中間点でのV(α二1.5うß = 2)

108

...L 15

一

(33)

となる. これを

max

2二 ^L

[!x(Vi)qiX +γqiXqi，X +1]

X i=l

subj.to

L

_qiX _二 _1， _{0三qiX 三 1} _(6.14)

i=l

に変更する. 新たに付けた項qiXqi，X+1は元々は隣接するqiXを互いに近づけるエネルギーすなわち-(qiX -qi，X +1)2なのであるが，qiX は0か1 でかっε;Llqzx=1なのでL�l(qiX -qリ+1)2二L�l(q;x -2qiXqi，X+1 +

《

x+l)=乞�1(qiX -2qiXqi，X +1 + qリ+1)= 2 -2 L�l qiXqi，X+1となり，

この積の項だけが残るのである(従って当然ながら2乗エネルギーを使っても以下の実験結果は同じである) . そこで式 (6.9) と同じく

とおいて

driX dt

eriX

qiX二..--..2--I二竹 1e^伊' ^ー

J.II.

=

-!:- L t

_[!州)qjY _{+川，Y+1 ]}

VljiX Y j=l

= !x(Vi)十γ(qi，X-1 + qば+1) でηxを変化させればよい.アiXを消去すると結局

一三=dq dt qix{!x(Vi) +γ(qi，X-l + qi，X+1)

- L

qjX[!X(Vj) +γ(qj，X-1 + qj，X+1) ]}

(6.15)

(6.16)

( 6.17)

を得る. この式は図6.4 のネットワークにおいて，第2段のニユーロンが空間的に( すなわちX方向に) 隣り合うニユーロンと興奮性の結合で相互作用することを表す. すなわちニユーロンはV方向にはWTA動作のために競合的に結合し，X方向にはviが同じになるように協調的に結合する. このような結合様式は生理学的にも確認されている[6 4].

このネットワークでシミュレーションしてみた結果，α=1.5，ß = 2でも図6.5の例では図6.5と同じ結果が，また図6.7の例では図6.9のように正しい結果が得られた. また直線の右端が固定枠に達していない図6.10 の例でも同図に示すように正しい[6 5]結果が得られた. これは固定枠から左に延長する点の重みが0.5であり 1より小さいためである. また図

(34)

6.11のように鈍角の窓枠のときも知覚されるのと同じ右向き( すなわち両端点の動きの平均)の速度が得られた. 最後にこのネットワークで図6.5 の例をシミュレーシヨンしたときの速度ベクトルの収束の時間経過を図

6.12に示す. 初期値はqiX= 1/ηにしているので最初はV = 0である. その後全ての点で右斜め上向きになり，それから端点からの情報が伝播して次第に上向きになっていく様子が分かる. ここで伝播が上下対称でないのは，図6.6で述べたように第lフレームの点で速度を求めているのでデータが上下非対称なためである. 第1フレームと第2フレームの中間の場所で速度を求めると図6.13のように上下対称になる.

6.2.4 むすび

ファジーハフ変換に基づく運動知覚のニューラルネットモデルを提案してパーパーポール錯視の例をシミュレーションして心理実験結果を再現できることを確認した. 本モデルと従来の正則化によるモデル[41]との違いは，正則化では変数は速度Vそのものであり，正則化項は(1ウピ

I公+1)2であるのに対し，本モデルでは正則化はニユーロンの出力に作用し，(qiX -qi，X+l)2である. 従来の正則化では不連続も平滑化されてなまってしまうのに対し，本方法では不連続が保存されるのは，まず第1段の f(V)による局所統合はロバスト性により不連続を保存し3 次段のニユーロン聞の相互作用では， WTAによりqiXは 1-out-of-nベクトルであるので(qiX -qi，X+l)2はOか 1であり，Viの不連続のジャンプ幅によらずエネルギー差は一定値 1であるので，不連続が保存され，こうして全体を通して不連続が保存されるためである. このようにして本方法では，ノイ

ズの平滑化3 不連続の保存，アパーチャ問題の解決を同時に行うような空間統合が実現されている. なおここではWTAは大域的すなわち大域最大値をlつ選択するとしたが，これを局所的なWTAとして複数の極大を検出するようにすれば透明視[74]も再現できる[75]. これはハフ変換において複数個のピークを抽出することにより複数個の図形を検出できることに対応している. またここでは空間的な統合だけを使ったが，フレームが 3個以上あれば時間的な統合(積分)も行え，実際心理実験や生理実験の根拠もある[76]. そのような時間軸での統合も取り入れるのは今後の課題である.

110

(35)

15

木ーーち木||冷木ーー冶 \ ↓小ーも \ + や + 冷

\ゑlψT ゑー中 \念ドlvf

、私||平木ー-c 木ー-c 木ーも木-ー冶 \ 木llG \

10

5

O ←一一一一一一一一:一一一一一一一一一

。 5 10 15

図6.8:運動例2(α=^1，ß = 2)

(36)

木ーーち木il冶 \ 木ーーも \ 木|Jゆ\ 木ーゆ\ \ゑ|心平泳ー中ゑー中、ー中 \arlvf l

木|IG \ 木ll冷木||冷木ーー。木ー-c

15←

一

10←

一

5←

一

0トー

i O

よ 5

」

10

i 15 図6.9:運動例2(α=1.5， ß

=

^2，γ二2)

112

(37)

15

10

。

。一→妹、ァーが

、一一今敬一一争時、殺一一歩

5

、食ー今、全一一決

、食一一決

、令ァー券

、一一決

10

図6.10:運動例3(α= l.5，グニ2，γ= 2)

15

(38)

t:;:

+

15ト

10ト

5ト

0卜 ^十

+

5 10 15 20

図6.11:運動例4(α= 1.5，グ= 2，γ= 2)

114

(39)

木ーーち木ーーも木ーーも木木11 4↑lφ 、

サ々、仲 J U明

7、，，v、

+ i JO + ? 枝、 i +， dw T +小/ @ 、

15ト

+

15 6、ぜm‘F フ⁺J、J

、〈ムヌ J

^ナ_、_ノ

_ー

10ト

ぐォ玖ー 'tl

^5ト

• 、

Oト

T 7 寸

5 10 15

t=75

15ト

{I _添U、f +、吋 � 1.1

→ 15

10ト

ltr

4 10

5ト

II

^、

;

⁴ ⁵

:、;

。 5 10 15

t=200

よ O

斗

5 10

_j_

15

t=150

i勺下七 ‘ 勺

i、111

1勺勺

• 、 .

。 5 10 15

t=225 図6.12: Vの収束の様子

(40)

r-1'

�

_ï

+折

、

_、九

百

。/' + ー刻

、、4tq百

� 〆 +司令

_/'

+ つ珂

。/'

+司

令

可争〆 +ー / 河 +折

、 fデ出

、，宅〉

1!、If少

。、よず+河

。、よ七九十河魚、 4 九九、久

勺 :! ?

15

『

_15ト

10

『

_10ト

5 5ト

Oト

よ

0

i 1 ム

15

10 5 10 15

t=150 t=175

小+lhv 小十lhw 小+l

h明、

小十l hv、

小↑吹か?φ

、

i伊/ 品円、

+/AK 伊/

魚、

か1 AM、

小+la 小ふ|、小+|。

小+lhu

小+|。小↓lnv

小T、小+l

hv、

小T hv、小↑

』守、

小TU玖- AlT L欲不↑

、鉄

ホ↑ 、企小+|

、由同小Ti、小+la

小+ー、

小+ー、〈明

15ト 15

10ト 10

5ト 5

Oト

。

₅ ₁₀ ₁₅

。

₁₀ ₁₅

t=200 t=250

図6.13:中間点でのVの収束の様子

116

(41)

6.3 動き検出

複数の動きを含む動画像から個々の動きを抽出するにはロバストな推定法が必要であり，代表的なロバスト推定法であるハフ変換もよく使われている.ハフ変換ではパラメータ空間での分布のモードを取り出すので，主要な動きから順に逐次に取り出すことができる. 混合分布モデルのように同時に複数の動きを取り出す方法では動きの個数をMDL法などの込み入った方法で決める必要がある[77] が，逐次抽出法では抽出の停止条件を与えるだけでよく，抽出された動きの主要順位も分かる. また動きを一つずつ求めていくので求解の困難度も軽減することができる.

通常は少数の動き領域を抽出するだけで十分な場合が多く，特に背景画像を連結して作られるモザイクとかスプライトなどと呼ばれるパノラマ画像は通常，最も面積が広い動き領域だけを抽出すればよく，ハフ変換が適している.

本節ではアフィン変換動きモデルによる大域的動き領域分割を考えるが，これにもハフ変換はよく用いられている[9].しかしハフ変換には3量子化幅の設定やパラメータ数による探索量の増大などの問題点がある.計算量については，しきい値処理による逐次動き抽出による簡略法が提案されている[78].一方，ハフ変換の種々の難点、を解消する一方法として，

ファジーハフ変換が提案されている[32， 75， 53].そこで本節では，ファジーハフ変換に基づいて動画像から主要な動き領域を逐次に抽出する方法を提案する.

6.3.1

ファジーハフ変換による運動検出

多くの動き検出法で用いられているように，本報告でも動きをアフィン変換として表すことにする.すなわち場所(x，y)の画素の動き(υx，vy

)

が

υx

=

(α-l)x + by + c

%二dx+

(e

^- ^1)ν+f ^(6.18)

で表されるとし，係数(α，b，c，dぅ久f)を動画像の二つのフレームから求める.これはl種の関数回帰問題であるので，まず最初にファジーハフ変

換による関数回帰法[75] について述べる.

4章で，ファジーハフ変換による関数回帰について説明しているが，

再度ここでも触れておく.独立変数zと従属変数uの組のデータがη組

ファジーハフ変換によるロバスト画像処理

九州大学学術情報リポジトリ

Kyushu University Institutional Repository