第 4 章 事例に基づく画像補完を用いた背景差分法 45
4.5 実験設定
4.5.2 比較手法
4.5 実験設定
表 4.2: 画像補完を用いた背景差分ニューラルネットワークのアーキテクチャ.畳み込み 層をconv,全結合層をfcと略記する.(b)におけるconvのカーネルサイズは2×2,そ のストライドは1×1である.また,(b)におけるmaxpoolingのカーネルサイズは2×2,
そのストライドは2×2である.
(a) 画像補完ニューラルネットワークのアーキテクチャ
層 カーネルサイズ ストライド 出力チャネル数
conv 3×3 2×2 32
conv 3×3 2×2 64
conv 3×3 1×1 128
2-dilated conv [53] 3×3 1×1 128
4-dilated conv [53] 3×3 1×1 128
conv 3×3 1×1 256
conv 3×3 1×1 256
transposed conv 3×3 1/2×1/2 128
conv 3×3 1×1 64
conv 3×3 1×1 32
conv 3×3 1×1 3
(b)変化検出ニューラルネットワークの アーキテクチャ
層 出力チャネル数 conv+maxpooling 64
conv+maxpooling 128 conv+maxpooling 256
fc 512
fc 256
fc 128
fc 1
4.5 実験設定 サイン距離を用い,ハッシュ値は10bitとしている.また,LSHのための画像の特徴表現 として,主成分分析を用い,画像特徴の次元数は各主成分の累積寄与率が99%を超える 主成分の個数としている.実験に用いたPCのメモリ容量の制限により,100,000のパッ チ画像をランダムに選択し,そのパッチ画像の主成分の求めた.LSHでは複数の背景パッ チ画像が検索される可能性があるため,検索された複数の背景パッチ画像と観測パッチ画 像のSum of Squared Difference (SSD) を計算し,もっともSSDが低かった背景パッチ画 像を選択する.検索された背景パッチ画像と観測パッチ画像の画素ごとに画素値について ユークリッド距離を求め,得られたユークリッド距離を閾値処理することで前景を検出す る.また,1枚も背景パッチ画像が検索されなかった場合,観測パッチ画像のすべての画 素を前景と判定する.この比較手法をDATABASEと略記する.
1クラスサポートベクタマシン
フレームレベルの1クラスサポートベクタマシン(OCSVMと略記する)による変化検 出手法が提案されている [37].そこで,フレームレベルの変化検出処理をパッチ画像に適 用することで,比較手法として利用する.OCSVMは背景パッチ画像から学習されている とし,観測パッチ画像が与えられたとき,以下の流れで前景検出を行う.まず,観測パッ
チ画像をOCSVMの識別空間上の特徴量に変換する.Smeureanuら [37]と同様に,観測
パッチ画像の特徴量として学習済みのVGG-f [58]の上位層の特徴ベクトルを用いる.そ の後,OCSVMによって学習された識別平面から識別空間上での観測パッチ画像までの符 号付距離を計算し,得られた距離を閾値処理することで前景検出を行う.また,OCSVM のパラメータ設定は文献 [37]で報告されたものに従う.
本実験では100,000以上の背景パッチ画像を学習に利用する.しかし,通常のOCSVM の計算量は学習データ数の3乗に比例するため,計算量の観点から,そのままでは実現
できない [59].そこで,大量の背景パッチ画像を学習するために,RANSAC-SVM [59]を
OCSVMに適用する.まず,学習データからランダムにデータをサンプリングし,学習
データのサブセットを作成する.このサブセットに対して,OCSVMを最適化し,学習 データ全体をOCSVMで評価する.OCSVMによって前景と判定された学習データ数Nf g が|Nf g−νN|<0.01Nを満たす,つまり,Nf gがνNにある程度等しいとき学習を終了す る.ここで,Nは学習データ数,νはOCSVMの正規化パラメータを意味するため,νNは
OCSVMが前景として許容する学習データの個数を表現している.学習の終了条件を満た
さないとき,学習サブセットを更新し,更新された学習サブセットに対して再びOCSVM を最適化する.上記の処理を事前に設定した回数に到達するまで繰り返す.学習サブセッ トに含まれるデータ数は学習データ全体に比べて十分に小さいため,実質的な計算量の削 減が可能である.なお,学習サブセットに含まれるデータ数は1,000とした.
オートエンコーダ
提案手法の画像補完部で画像補完ニューラルネットワークを用いる代わりに,オートエ ンコーダ(AEと略記する)を用いる.AEは背景パッチ画像のみから学習されているとし,
観測パッチ画像が与えられたとき,観測パッチ画像をマスクせずにAEに入力し,AEに よって復元された画像と観測パッチ画像を比較し,前景を検出する.
また,観測パッチ画像とその復元パッチ画像の比較のために,提案手法と同様にユーク リッド距離による方法と変化検出ニューラルネットワークによる方法の2つの方法を用い る.簡単のため,それぞれの名称をAE-ED,AE-CDNETとする.実験で用いたAEの アーキテクチャを表4.3にまとめた.なお,AEの活性化関数はICNETと同様に,出力層 以外ではReLUを用い,出力層ではシグモイド関数を用いた.