第 4 章 視差伝搬に基づくステレオマッチング 回路の自動構築回路の自動構築
4.3 視差算出実験
4.3.1 実験設定
5 inputs → 3 types of weight 2
3 1
2 3
図4.2:近傍入力Iiの結合荷重
RFCN RFCN
RFCN RFCN
RFCN RFCN
RFCN
RFCN RFCN
Connected Disconnected Reliable
cell
Unreliable cell
図4.3:信頼度に基づくセルの結合関係 遺伝子型
遺伝子型については,3.2.4節と同様である.ただし遷移回数については,表3.1に示すビット 列を既定の遷移回数にマッピングする.具体的には,遷移回数のビット列は3ビットであるため,
各ビット列パターンに対して8種類の遷移回数を既定する.
遺伝操作
遺伝操作については,3.2.4節と同様である.
適応度関数
GAの個体の適応度関数fitnessを以下のように定義する.
fitness=1 2
⎫⎝⎝⎝⎬
⎝⎝⎝⎭1 1 Np
⎞⎟⎟⎟⎟⎟
⎟⎠
Np
p
√do(p) dt(p)√ dmax ×Vmax
w(p) ×λ(p)
⎧ ⎜+ Cth⎩⎝⎝⎝⎪
⎝⎝⎝⎨ (4.16)
ここで,Npは画素数,do(p)とdt(p)はそれぞれ出力視差と理想視差,w(p)とVmaxは重みとそ の最大値で,255(256階調)である.w(p)の値が大きいほどdt(p)に対する適応度が重要視され る.つまり,各理想視差に対する処理の重要度を階調値で表したものである.算出不可能な領域の 理想視差値はゼロと定義し,適応度の計算から除外する.また,係数λを以下のように定義する.
λ=⎫⎝⎝⎬
⎝⎝⎭
1
3, ifdt(p) dmax
2 1, otherwise
(4.17)
この係数は背景の視差に対する適応度の重要度を下げるために用いる.背景に対する視差の精度 よりも,物体に対する視差の精度を重要視するためである.ここで,Cthは誤差がしきい値th(本 論文では1.0)以下である視差の割合である.適応度は[0.0, 1.0]の実数値であり,値が高いほど良 い.学習時には,全ての学習用画像に対するfitnessの平均値を最大にするように世代交代を行う.
(a)左画像 (b)右画像 (c) 理想視差画像 (d)重み画像
図4.4:学習画像セットと重み画像の例
テスト用を17セットとした.画像サイズは200÷185 [pixel]である.式(4.16)の適応度関数に用 いる重みは,理想視差画像に対してCannyEdgeフィルタ[44]とGaussianフィルタをかけた画像の 輝度値を用いた.学習画像セットと重み画像の一例を図4.4に示す.
CENに対する構造最適化で用いたパラメータを表4.1および表4.2に,GAに関するパラメー タを表4.3にそれぞれ示す.比較手法として一般的な3手法を選定し,提案手法5試行中の最良 個体と比較する.比較手法は,local法からblock matching (BM),global法からhierarchical belief propagation (BP)[37]とhierarchical graph cuts (GC)[33]を選定した.これら比較手法のパラメー タを表4.4に示す.BMは筆者らが作成したソースコードを用いた.BPは著者のウェブページ1の ソースコードを用いた.GCはウェブページ2のソースコードを基に筆者らが作成した.
評価指標としては,理想視差に対する出力視差の誤差率ERth (Error Rate)とRMS (Root Mean
Square)誤差を用いた.誤差率ERthは誤差がしきい値th以下である視差の割合を表す指標,RMS
は誤差のレンジを表す指標であり,どちらも値が小さいほど良い結果であることを示す.ERthと RMSは以下の式(4.18),式(4.19)で表される.
ERth = 1 Np
Np
p
√do(p) dt(p)√>th
(4.18)
RMS =
1
Np Np
p
√do(p) dt(p)√2 (4.19)
実験は全てDell Precision T3500(CPU: Xeon 2.53GHz,メモリ:4GB)上で行った.
1cs.brown.edu/pff/bp/
2pub.ist.ac.at/vnk/software.html
表4.1: CENのパラメータ
Parameter Value
Internal input units Ii 5 Output units O 1
Activation function See Table 4.2.
Gainα 0.25, 0.5, 1.0, 2.0 Threshold 0.0, ◦0.25, ◦0.5, ◦1.0 Weight 0.0, ◦0.25, ◦0.5, ◦1.0, ◦2.0 Iterations 6, 9, 12, 15, 18, 21, 24, 27
表4.2:出力関数の種類
Function Formula
Sigmoid f(x)= 1
1+exp( αx) Linear f(x)=αx
Piecewise linear f(x)=
⎫⎝⎝⎝⎝⎝⎝⎝⎬
⎝⎝⎝⎝⎝
⎝⎝⎭
0 (x≥0) αx (0<x≥1/α) 1 (1/α≥x) Threshold f(x)=⎫⎝⎝⎝⎬
⎝⎝⎝⎭αx (x>0) 0 (x≥0) Gaussian f(x)= ∇1
2πα2exp x2
2α2
⎛ Average f(x)= 1
N N
i xi
Max f(x)=x∈0 Min f(x)=x∈N
Range f(x)=max(x) min(x) Median f(x)=x∈N
2
(x∈is sortedxin descending order)
表4.3: GAのパラメータ
Parameter Value
Generations 5000
Generation alternation model MGG
Population size 100
Children 30
Crossover ratePc 0.7
Mutation ratePm 0.05
Mutation rate (number of hidden units)Phm 0.1
表4.4:比較手法のパラメータ
Method Parameter Value
BM Cost function NCC
Window size 5
BP Cost function STAD
Threshold of data cost 15.0 Threshold of smoothness cost 1.7 Weight of data cost 0.07 Window size for Gaussian filter 5 σof Gaussian filter 0.7
Layers 5
Iterations at each layer 10
GC Cost function SAD
Window size 7
Max Iterations 100