3.3.1 ロバスト推定
輪郭ボケ距離推定法において用いている最小二乗法とは,一般的には観測データの整理 に用いられる[51].最小二乗法の目的としては,観測されたデータを基に目的の関数を最 良な関数に近似するための方法である.具体的な原理は,観測データと目的関数の間に生 じる残差の二乗和が最小になる関数を求めることで最良近似を行う.例えば,残差をǫと した目的関数をy =f(x) +ǫとおくと,観測データがn個ある場合の残差の二乗和は式
(3.15)となる.式(3.15)におけるǫ2が最小になるような目的関数を求める.
ǫ2 =
n
X
i=1
(y−f(x))2 (3.15)
最小二乗法は,線形だけでなく非線形関数にも用いることができ,大量の観測データを 等しく扱い,最良な関数に近似できる.しかし,全ての観測データを等しく扱い,残差の 最小二乗和を求めているため,偏った誤差を含んだ観測値が存在する場合や大きな誤差を 含む観測値が存在する場合,誤差の影響を強く受けた関数に近似される.目的関数に影響 を与える大きな誤差を含んだ観測値は外れ値と呼ばれ,本来は他の観測値よりも残差が大 きくなる.そのため,外れ値の残差も含んだ全観測値の残差の二乗和を最小化すると,外 れ値に偏った関数が求められる.また,誤差が偏っていた場合,真値を基にした関数に比 べて偏った関数が求められる.そのため,外れ値を除いたり特別な重みを加えることによ り,外れ値に強く誤差の影響を軽減した最小二乗法として考案された方法がロバスト推定 である.
ロバスト推定は外れ値に重みを付ける方法と,外れ値を除く方法の二つの種類に分けら れる.重みを付ける方法としては,M推定が挙げることができ,重みの付け方によって さらに分類される.外れ値を除く方法には,RANSAC,LMedS(LeastMedianSquares),
LTS(LeastTrimmedSquares)が挙げられる.以下にそれぞれの方法の特徴と原理について
述べる.
○M推定 [52]
二乗誤差基準では誤差が大きいほど値が大きくなるが,閾値を超えた誤差の値の上昇 を重みを付けることで,外れ値による影響を小さくする方法である.M推定には重み の付け方にいくつかの方法があるが,主な型として,Huber型とTuckey’s biweight
Table 3.6 Result of GB301S in water
Error( Depth estimation formula of GB301S) [µm]
Data No.1 No.2 No.3 No.4 No.5
No. Ave. S.D. Ave. S.D. Ave. S.D. Ave. S.D. Ave. S.D.
No.1 -0.07 0.87 -2.31 1.18 -6.17 2.47 -5.77 2.63 -7.33 3.49 No.2 1.95 1.78 -0.19 1.23 -3.81 1.92 -3.41 1.89 -4.78 2.70 No.3 5.62 3.09 3.56 2.26 -0.14 1.35 0.30 1.52 -1.17 1.80 No.4 5.35 3.11 3.26 2.24 -0.50 1.43 -0.07 1.32 -1.47 1.55 No.5 6.70 3.48 4.64 2.60 0.98 1.86 1.37 1.68 0.08 1.54 No.6 2.51 2.34 0.41 1.69 -3.39 1.80 -2.91 1.67 -4.02 1.79 No.7 -1.43 1.94 -3.66 2.52 -7.49 3.58 -7.23 3.89 -8.76 4.24 No.8 0.23 1.33 -1.93 1.36 -5.76 2.65 -5.36 2.58 -6.34 3.13 No.9 -0.56 1.63 -3.02 1.70 -5.90 3.61 -5.66 3.38 -6.90 4.25 No.10 -0.13 1.63 -2.46 1.53 -5.43 3.34 -5.15 3.14 -6.41 4.11
Data No.6 No.7 No.8 No.9 No.10
No. Ave. S.D. Ave. S.D. Ave. S.D. Ave. S.D. Ave. S.D.
No.1 -2.79 2.23 0.80 2.33 -0.47 0.88 0.38 0.97 -0.13 0.89 No.2 -0.52 1.81 2.95 3.12 1.63 1.74 2.40 1.94 1.93 1.83 No.3 2.79 2.53 6.71 3.99 5.19 3.00 6.12 3.28 5.53 3.14 No.4 2.77 1.62 6.57 4.16 4.92 3.07 5.88 3.30 5.26 3.20 No.5 3.82 2.11 8.01 4.47 6.28 3.44 7.22 3.66 6.62 3.58 No.6 -0.09 1.34 4.02 3.52 2.03 2.31 3.08 2.51 2.38 2.43 No.7 -4.72 3.75 -0.10 1.45 -1.82 1.97 -0.91 1.83 -1.46 1.90 No.8 -2.59 1.93 1.49 2.66 -0.26 1.90 0.76 1.43 -0.31 2.25 No.9 -2.56 2.16 1.15 2.41 -1.15 1.83 -0.38 1.85 -0.95 1.83 No.10 -2.02 1.91 1.50 2.58 -0.44 1.90 0.12 1.75 -0.34 1.70
型が存在する.式(3.16)にHuber型,式(3.17)にTuckey’s biweight型の重みを w(y)として示す.どちらの型もある値cを閾値として,重みを付けている.どちら も閾値cを与えなくてはならないが,標準偏差などを基にcを決定することが多い.
w(y) =
−c(y <−c) y(|y| ≤c) c(y > c)
(3.16)
w(y) =
yn
1−y c
2o2
(|y| ≤c) c(|y|> c)
(3.17)
○RANSAC(RANdom SAmple Consensus) [53]
観測データの中からランダムにいくつかのサンプルを抽出し,最小二乗法に当ては めることを繰り返す.このとき,外れ値以外のサンプルを抽出することができれば,
最小二乗法によって最良な関数に近似できる.また,外れ値の数が全測定数に比べ て少なければ,推定される誤差範囲内により多くの測定値が含まれる.つまり,もっ とも多くの測定値が範囲内に含まれるときの推定を,最良な関数への推定とみなす.
○LMedS(Least Median Squares) [54]
一般的には,LMedSは最小メジアン法と呼ばれる.観測データの中からランダムに いくつかのサンプルを抽出し,最小二乗法に当てはめることを繰り返す.RANSAC と同様に,外れ値以外のサンプルを抽出することができれば,最小二乗法によって 最良な関数に近似できる.最良な関数を評価する際,RANSACと異なり,全測定値 における二乗誤差の中央値が最も小さいとき,最良な関数への推定とみなす.誤差 範囲が明らかなときはRANSACのほうが有効であるが,不明なときはLMedSのほ うが有効であり,誤差範囲によって使い分けることができる.
○LTS(Least Trimmed Squares) [55]
一般的には,LTSは最小刈り込み二乗法と呼ばれる.観測データを各サンプル毎誤差 を求め,誤差の昇順にソートし,大きいほうからいくつか除いて最小二乗法に当ては める.全観測値nから除く値の数qは,pを独立変数の次元として,q= (n+p+ 1)/2 がよく用いられる.式(3.18)は実際のLTSの式であり,観測値は誤差順にソート されている.
ǫ2 =
q
X
i=1
(y−f(x))2 (3.18)
3.3.2 輪郭ボケ距離推定法の問題点と予想される現象
輪郭ボケ距離推定法には,微小物体とエンドエフェクタの輪郭ボケ幅の差を用いて,光 学顕微鏡視野における奥行き距離を推定している.輪郭ボケ距離推定法によって近似され た推定式(3.10)は第3項までを用いるため,式(3.19)に変形する.
∆z(r) =c3r3+c2r2+c1r (3.19)
マクローリン展開により近似した際,各項の定数cnの符号は定められ,c3とc1は正の 値となり,c2は負の値とならなければならない.しかし,実際の観測値を基に式(3.19) に対して最小二乗法用いて推定式を導出した際,定数の符号の条件を全て満たさない場合 がある.現在は,定数の符号の条件を満たさない場合,推定式導出の失敗として再度輪郭 ボケの観測からやり直している.
定数の符号が条件を満たさない原因を究明するために,観測値について考察する.式
(3.10),式(3.19)の変数であるr,∆z(r)が観測値となる.観測値の測定方法は,焦点の 合っている微小物体に対して,エンドエフェクタを2µmずつ下げていき,その度に微小物 体とエンドエフェクタの輪郭ボケ幅を測定し,それぞれの輪郭ボケ幅が一致したときに奥 行き距離を0として逆算する.エンドエフェクタの移動する際の精度は1µmであるため,
観測値∆z(r)に誤差が現れることはない.そこで,輪郭ボケ幅に基づく観測値rに問題が
あると考えられる.実際の観測値の例を表3.7に示す.EBWをエンドエフェクタの輪郭 ボケ幅,微小物体の輪郭ボケ幅をPBWとして∆z(r)は簡易的にzとする.表3.7のEBW
Table 3.7 Blur-data
EBW(µm) PBW(µm) r(µm) z(µm)
12.35 0.65 0.84 83
12.48 0.65 0.86 81
11.79 0.65 0.80 79
12.46 0.65 0.85 77
11.42 0.65 0.77 75
の値がzが小さくなるのに対して,EBWは値が大きくなる変化が一部に見られる.この 現象は,ボケている物体が被写界深度に近づくほど,物体の輪郭ボケ幅が小さくなり焦点 一致に近づく理論に反する.常に焦点に一致して静止している微小物体の観測値には,変 化がないため誤差が含まれていないが,エンドエフェクタの観測値であるEBWには誤差 が含まれていることがわかる.この誤差が導出される推定式に影響を与えていると考える.
次に,推定式導出の成功時と失敗時の結果を比較する.実際の推定式導出成功時の結果が 図3.19,失敗時の結果が図3.20である.成功時の例の定数はc1 = 216.41,c2=−249.67, c3 = 124.75であり,失敗時はc1 =−38.78,c2 = 19.38,c3 = 62.79である.成功時に比 べて失敗時は,推定式のグラフから離れた観測値がいくつか見られる.これらは外れ値と 呼ぶには小さな誤差だが,観測値の総数が少ない輪郭ボケによる距離推定法では外れ値と 同じような大きな誤差を与える.グラフの形状においても,成功時に比べて失敗時の結果 にはr= 1の手前でzの値に極値を見ることができる.極値が存在するということは,観 測値におきた輪郭ボケ幅が大きくなる現象をあらわす.そこで,zの値が小さくなる変化 と同じように,rの値も小さくなれば極値ができることはなく,輪郭ボケの大きさが理論 に反する現象が起こらないと考えることができる.このことから,観測値のEBWを基に したrに問題があることが明らかである.推定式導出に失敗した際の結果は, 図3.20の 例以外にも同様の軌跡を描き,極値が存在しているため原因は観測値EBWの誤差にある ため同様のものであると考える.
Fig. 3.19 Success
3.3.3 対策
前節で述べた問題の対策として,観測される輪郭ボケ幅のばらつきを抑える方法と最小 二乗法を誤差に対して影響を受けにくくする二つの方法がある.前者の方法には,輪郭ボ ケ幅の観測する際の画像処理を改良する方法がある.現在,輪郭ボケ幅を観測する際は輪 郭ボケを含むエンドエフェクタと輪郭ボケを含まないエンドエフェクタに二値化の処理を 行い,それらの差分の画素数から算出している.そこで,二値化する際に輪郭ボケを抽出
Fig. 3.20 Failure
するための閾値を改良する方法を考えることができる.しかし,閾値は微小物体とエンド エフェクタの奥行き距離が一致した時,輪郭ボケ幅が一致するように設定されているため,
閾値を変更することはできない.後者の方法には,ロバスト推定のような誤差に強い最小 二乗法の応用が存在する.しかし,一回の推定で観測される値の数は40∼60個と非常に 少なく,外れ値として除く数や重みの付け方は限定され,それらを選定して用いなければ ならない.また,実際には目立った外れ値が存在するわけではないが,観測値の総数が少 ないため大きな影響を与えている.そのため,偏った誤差を持つ少数のサンプルに対して,
重み付けや取り除くだけでも有効である.そこで今回は推定式における定数が受ける誤差 の影響を軽減するために,輪郭ボケによる距離推定法に適したロバスト推定を選択して用 いる.
代表的なロバスト推定について,4種類例に挙げたそれぞれの方法について,特徴を基 に選別していく.はじめにM推定は,誤差に対して重みを付ける方法であり,重みには 標準偏差を用いることが多い.重みを付けるために用いる標準偏差は平均値を中心とした データの散らばりを表している.観測値と推定式から得られた値で標準偏差を求めるこ とは可能だが,観測値の総数が少ないため信頼できる重みを付けることができない.した がって,輪郭ボケ距離推定法にM推定は適していない.次にRANSACは,観測データの 中からランダムにサンプルを抽出し,許容誤差範囲に含まれる観測値の数で評価する方法 である.この方法では,許容誤差範囲の設定が問題となる.表3.7に示した輪郭ボケ幅に ついて,大きくなったときの値だけを取り除くための誤差範囲を設定することが難しい.
また,M推定と同様に標準偏差を用いた誤差範囲の設定が難しいため,許容誤差範囲が恣