• 検索結果がありません。

、 鉄

6.3 動き検出

複数の動きを含む動画像から個々の動きを抽出するにはロバストな推 定法が必要であり, 代表的なロバスト推定法であるハフ変換もよく使わ れている.ハフ変換ではパラメータ空間での分布のモードを取り出すの で, 主要な動きから順に逐次に取り出すことができる. 混合分布モデル のように同時に複数の動きを取り出す方法では動きの個数をMDL法な どの込み入った方法で決める必要がある[77] が,逐次抽出法では抽出の 停止条件を与えるだけでよく, 抽出された動きの主要順位も分かる. ま た動きを一つずつ求めていくので求解の困難度も軽減することができる.

通常は少数の動き領域を抽出するだけで十分な場合が多く, 特に背景画 像を連結して作られるモザイクとかスプライトなどと呼ばれるパノラマ 画像は通常, 最も面積が広い動き領域だけを抽出すればよく, ハフ変換 が適している.

本節ではアフィン変換動きモデルによる大域的動き領域分割を考える が,これにもハフ変換はよく用いられている[9].しかしハフ変換には3量 子化幅の設定やパラメータ数による探索量の増大などの問題点がある.計 算量については, しきい値処理による逐次動き抽出による簡略法が提案 されている[78].一方,ハフ変換の種々の難点、を解消する一方法として,

ファジーハフ変換が提案されている[32, 75, 53].そこで本節では,ファ ジーハフ変換に基づいて動画像から主要な動き領域を逐次に抽出する方 法を提案する.

6.3.1

ファジーハフ変換による運動検出

多くの動き検出法で用いられているように, 本報告でも動きをアフィ ン変換として表すことにする.すなわち場所(x,y)の画素の動き(υx,vy

)

υx

=

(α-l)x + by + c

%二dx+

(e

- 1)ν+f (6.18)

で表されるとし,係数(α,b,c,dぅ久f)を動画像の二つのフレームから求め る.これはl種の関数回帰問題であるので, まず最初にファジーハフ変

換による関数回帰法[75] について述べる.

4章で, ファジーハフ変換による関数回帰について説明しているが,

再度ここでも触れておく.独立変数zと従属変数uの組のデータがη組

(Xi, vi ) (i = 1,…?η)与えられているとする. これに1次関数υ=αx+b を当てはめることにし, データからα,bを求める. あるα,bの値を仮に考 えるとこれはl本の直線を表す. データ(Xiグi )がこの直線に所属する度 合いを

di (α,b)

=ωie-P(αXi+トV,)2

( 6.19)

とする.pは適当な正定数である. 町はこのデータの重みであり, 今は ωz二1である. このdi を, データ(Xi,叫)がこのα,bの値に所属するメン )\,ーシツプ値と呼ぶ. すると自分に所属するデータの数が最も多いα,bの 値は

4

T E

4(α, b) (6.20)

で求まる. これをα 1,b1 とするとこれが, 与えられたη個のデータから抽 出される最も主要な直線を表す.

次に2 番めに主要な直線は, 1番めの直線に所属するデータを取り除い た残りで最も主要な直線である. データ(Xi,叫)が1番めの直線に所属し ない割合は1-di(α 1, b1 )であるから, 式(6.19)で叫=1 -di(α 1, b1 )とお いて再び式(6.20)でa,bを求めれば2 番めに主要な直線が求まる. 同様に 3番めではωi = [1 -di(α 1, b1 )][ 1 -di (α 2, b2 )]とおけばよい. 式(6.20)は

通常, 複数の局所最適解を持つのでアニーリングが必要である[53].

以上がファジーハフ変換による関数回帰法であるが, 同じことはデー タの表現法を少し変えても可能である. Xの変域をL区間に分割し, 同 様にυもM区間に分割して, (x,v)空間を格子状に分割し, 格子の各セ ルの中心点(Xj,竹)(j = 1,・・.,LM)全てをデータとする. そして各セルに ついて, そのセル内に上記のη個のデータが存在するかどうか調べ, セ ル内のデータの個数をそのセルの重み町とする. こうすると式(6.20)は

LM

mx EJtiJ3e -p(αXj+いj

)2

「W j=1 (6.21)

と等価(但し量子化の誤差が生じるが )である. 次節の運動抽出ではこの ようなデータ表現法を用いる. 式(6.19)では的は観測値でzの1価関数 であるが, 式(6.21)のυj は観測値ではなくzについて多価であるという 違いに注意されたい. 観測値は式(6.21)では重み町で表される.

式(6.21)の解α,bは3 式(6.21)のα による偏微分とbによる偏微分とが

118

ともに Oになる点であるから, 適当な初期値から出発して

α=乞ωj(Vj-b)xje-p(α勺+トVj)2 LωjxJe一仰Xj+b-Vj)2 b=町(Vj一α

Xj+

J)'"

L町e-;p\aXj十b-Vj)""

(6.22)

が収束するまで反復計算して求める. アニーリングではpを最初小さな 値にして式(6.22)で仏bを求め, pを徐々に大きくしながら仏bを追跡し,

α,bが変化しなくなったところでpを止め, そのときの仏bを式(6.21)の 解とする. 式(6.22)は一般に大域収束性は保証されないが, 局所的には 収束し, アニーリングでは一つ前のpでの収束値が次のステップでの初期 値になるので局所的に収束すればよく, ここでの実験では全て収束した.

6.3.2

逐次運動抽出

2枚のフレームから動きを求めるとし, 画素(x,y)のカラー値が第lフ レームではh(x,y), 第2 フレームでは12(x,y)であるとする. また画素 の幅(高さも同じとする)をhとすると九二仇,Vy =jh (i,j二-m,-m­

L…,m -1,m)を動きのデータとする. すなわち全ての画素(0三z三

Nx ,O三u三Ny )でこれら(2m+ 1)2個の動きデータがある. よってデー タの総数はNxNy(2m+ 1)2 である. これらの動きデータの重み(式(6.21) のωj)を

ω ーρ-qlII'(x+ih,y+jh)-I(x,y)112

xι2,Jーし (6.23)

とする. qは動きの確率分布の分散(の逆数)に対応する正定数であり, こ こでは適当に設定する. すると式(6.21)はこの場合

α,b,c,d,e,j max x

=O

y

=O2二

ω2,

J

i-

mJ=

-

m

'e-p[(α-l)x+by+c-ihj2-p[dx+(e-l)y+ f -jhj2 (6.24)

となる. これにより最も主要な動きのアフィンパラメータが求まる. 式 (6.24)は式(6.22)と同様な反復法で解く. また 2番め, 3番めの動きの求 め方も 6.3.1節と同じであるから省略する. アニーリングでは前記の説明 と同じくpを変化させる. これは文献[53]で説明したようにpがエント

ロビーの係数すなわち温度の逆数であるからである. 収束性についても 文献[53]を参照されたい. qを変化させても同様な効果を持たせられる可

能性もあるが, それは厳密にはアニーリングとは異なる. ここではqは 固定したままとする. このようにして何個かの動きを求めた後, 各画素 がどの動きに所属するかを求める. まず, 求まった各アフィンパラメー タについて各画素(x,y)での動き(υx,Vy)が式(6.18)で求まる. これを量 子化すると, 各画素での各動きの重みが式(6.23)で求まる. まず最初に この重みが全ての動きで, あるしきい値(ε< 1)よりも小さい画素はどの 動きにも属さないとする. 残りの画素については, 重みが最大の動きに 属すとする.

なお, 従来の動き抽出では文献[77]のように1,1'の確率分布に基づい て動きを推定しており, その評価式は本論文で言えば式(6.19)を代入し た式(6.20)に対応する. それに対し式(6.24)は式(6.21)に対応する.

6.3.3

実験

まず最初に図6.14 のような人工的な画像から動きを二つ抽出した.正し い動きは, 背景がα=1.0, b = 0.05, c = -1.0ぅd= -0.05, e = 1.0,1 = 0.0 で, 中央の四角がα=1.0, b = -0.1, c = 0.0, d = 0.1, e = 1.0,1 = -1.0 で ある. 図6.15 に1固め(左)と2固め(右)に取り出された動きを示す. ノイ ズが少し生じているがほぼ正しく領域分割できている. アフィンパラメー タはそれぞれα= 1.0, b = 0.05, c = -1.0, d = -0.05, e = 1.0,1 = 0.12 と α= 1.0, b二 0.1, c二一0.3, d = 0.11, e = 1.0,1 = -0.92 であり, ほぼ正 しい値が得られた. 式(6.23)のqは0.05 とし, 動きの範囲のmは5 とし た.pのアニーリングの最終値は0.1 とした.qは前にも述べたように動 きの分散の逆数に対応し, データによるがここでの実験ではどの例でも 0.05 あたりの値でほぼ正しい結果が得られた. なおqが小さすぎると領 域が融合しセグメンテーションがあいまいになり, 大き過ぎるとノイズ に敏感になり細かな誤り領域が生じてくる.pの最終値0.1 は前にも述べ たように仏…,1の変化が十分小さくなる値であり, これ以上大きくして も仏…,1は変化しない.

次に図6.16 に示す“Mobile and calendar"の中の2 つのフレームから3 つの動きを抽出した. 取り出された動きを図6.17 に示す. 所々ノイズが あり, また右方のカレンダーの下の部分の動きが1固めの背景の動きに組 込まれて抽出されているなと不完全な点もある( この例については同様な 傾向が他の方法でも見られる[79])が3 ほぼ良好に運動が抽出されている.

Sawhney[77]らの実験では逐次抽出法はいくつかの例で、誤ったので彼ら 120

は同時抽出法を採用したが3 本論文では彼らとは異なる評価関数を使っ て逐次抽出法でもある程度良好な結果を得ることができた. 文献[77]で は分散も求めているので信頼性の高い結果が得られているが, 逐次法で も評価法の改良によりある程度信頼性の高い結果を得ることができると 思われる.

6.3.4 むすび

ファジーハフ変換に基づいて動画像から主要な動き領域を逐次に抽出 する方法を提案して, ほぼ良好に動きが抽出できることを実験で確かめ た. 同時抽出法[77]との性能比較については更に多くの実験が必要であ る. 多くの運動抽出法と同様に本方法でもテクスチャの少ない一様な領 域では運動の推定があいまいになり, 正しい動き検出が難しい. 画素の 色による領域抽出も組合せれば運動の検出の性能が向上するものと思わ れる.

(a) 1st frame

(b) 2nd frame 図6.14:動画像例

122

60 50 40 30 20 10

10 20 30 40 50 60 70 80

(a) 1st motion

80 70 60 50 40 30 20

::Jミオ J三」ば

10 20 30 40 50 60 70 80 (b) 2nd motion

図6.15:抽出された動き

(a) 1st frame

(b) 2nd fram

図6.16: I\Iobile and calendar

124

160 140 120 100 80 60

ジ当じ

40 I

20

0 o 20 40 60 80 1 00 1 20 140 1 60 1 80

(a) 1st motion

160 140 120 100 80 60 40 20 0

オ寸1

o 20 40 60 80 100 120 140 160 180

(b) 2nd motion

126

160 140 120 100 80 60 40 20 0

ドキュメント内 ファジーハフ変換によるロバスト画像処理 (ページ 41-51)

関連したドキュメント