比較手法

第 4 章事例に基づく画像補完を用いた背景差分法 45

4.5 実験設定

4.5.2 比較手法

4.5 実験設定

表 4.2: 画像補完を用いた背景差分ニューラルネットワークのアーキテクチャ．畳み込み層をconv，全結合層をfcと略記する．(b)におけるconvのカーネルサイズは2×2，そのストライドは1×1である．また，(b)におけるmaxpoolingのカーネルサイズは2×2，

そのストライドは2×2である．

(a) 画像補完ニューラルネットワークのアーキテクチャ

層カーネルサイズストライド出力チャネル数

conv 3×3 2×2 32

conv 3×3 2×2 64

conv 3×3 1×1 128

2-dilated conv [53] 3×3 1×1 128

4-dilated conv [53] 3×3 1×1 128

conv 3×3 1×1 256

transposed conv 3×3 1/2×1/2 128

conv 3×3 1×1 64

conv 3×3 1×1 32

conv 3×3 1×1 3

(b)変化検出ニューラルネットワークのアーキテクチャ

層出力チャネル数 conv+maxpooling 64

conv+maxpooling 128 conv+maxpooling 256

fc 512

fc 256

fc 128

fc 1

4.5 実験設定サイン距離を用い，ハッシュ値は10bitとしている．また，LSHのための画像の特徴表現として，主成分分析を用い，画像特徴の次元数は各主成分の累積寄与率が99%を超える主成分の個数としている．実験に用いたPCのメモリ容量の制限により，100,000のパッチ画像をランダムに選択し，そのパッチ画像の主成分の求めた．LSHでは複数の背景パッチ画像が検索される可能性があるため，検索された複数の背景パッチ画像と観測パッチ画像のSum of Squared Diﬀerence (SSD) を計算し，もっともSSDが低かった背景パッチ画像を選択する．検索された背景パッチ画像と観測パッチ画像の画素ごとに画素値についてユークリッド距離を求め，得られたユークリッド距離を閾値処理することで前景を検出する．また，1枚も背景パッチ画像が検索されなかった場合，観測パッチ画像のすべての画素を前景と判定する．この比較手法をDATABASEと略記する．

1クラスサポートベクタマシン

フレームレベルの1クラスサポートベクタマシン(OCSVMと略記する)による変化検出手法が提案されている [37]．そこで，フレームレベルの変化検出処理をパッチ画像に適用することで，比較手法として利用する．OCSVMは背景パッチ画像から学習されているとし，観測パッチ画像が与えられたとき，以下の流れで前景検出を行う．まず，観測パッ

チ画像をOCSVMの識別空間上の特徴量に変換する．Smeureanuら [37]と同様に，観測

パッチ画像の特徴量として学習済みのVGG-f [58]の上位層の特徴ベクトルを用いる．その後，OCSVMによって学習された識別平面から識別空間上での観測パッチ画像までの符号付距離を計算し，得られた距離を閾値処理することで前景検出を行う．また，OCSVM のパラメータ設定は文献 [37]で報告されたものに従う．

本実験では100,000以上の背景パッチ画像を学習に利用する．しかし，通常のOCSVM の計算量は学習データ数の3乗に比例するため，計算量の観点から，そのままでは実現

できない [59]．そこで，大量の背景パッチ画像を学習するために，RANSAC-SVM [59]を

OCSVMに適用する．まず，学習データからランダムにデータをサンプリングし，学習

データのサブセットを作成する．このサブセットに対して，OCSVMを最適化し，学習データ全体をOCSVMで評価する．OCSVMによって前景と判定された学習データ数N_{f g} が|N_{f g}−νN|<0.01Nを満たす，つまり，N_{f g}がνNにある程度等しいとき学習を終了する．ここで，Nは学習データ数，νはOCSVMの正規化パラメータを意味するため，νNは

OCSVMが前景として許容する学習データの個数を表現している．学習の終了条件を満た

さないとき，学習サブセットを更新し，更新された学習サブセットに対して再びOCSVM を最適化する．上記の処理を事前に設定した回数に到達するまで繰り返す．学習サブセットに含まれるデータ数は学習データ全体に比べて十分に小さいため，実質的な計算量の削減が可能である．なお，学習サブセットに含まれるデータ数は1,000とした．

オートエンコーダ

提案手法の画像補完部で画像補完ニューラルネットワークを用いる代わりに，オートエンコーダ(AEと略記する)を用いる．AEは背景パッチ画像のみから学習されているとし，

観測パッチ画像が与えられたとき，観測パッチ画像をマスクせずにAEに入力し，AEによって復元された画像と観測パッチ画像を比較し，前景を検出する．

また，観測パッチ画像とその復元パッチ画像の比較のために，提案手法と同様にユークリッド距離による方法と変化検出ニューラルネットワークによる方法の2つの方法を用いる．簡単のため，それぞれの名称をAE-ED，AE-CDNETとする．実験で用いたAEのアーキテクチャを表4.3にまとめた．なお，AEの活性化関数はICNETと同様に，出力層以外ではReLUを用い，出力層ではシグモイド関数を用いた．

ドキュメント内峰松, 翼 (ページ 74-77)

第 4 章 事例に基づく画像補完を用いた背景差分法 45

4.5 実験設定

4.5.2 比較手法

第 4 章事例に基づく画像補完を用いた背景差分法 45