ロバスト推定との比較による評価

3.3.1 ロバスト推定

輪郭ボケ距離推定法において用いている最小二乗法とは，一般的には観測データの整理に用いられる[51]．最小二乗法の目的としては，観測されたデータを基に目的の関数を最良な関数に近似するための方法である．具体的な原理は，観測データと目的関数の間に生じる残差の二乗和が最小になる関数を求めることで最良近似を行う．例えば，残差をǫ^とした目的関数をy =f(x) +ǫとおくと，観測データがn個ある場合の残差の二乗和は式

（3.15^{）となる．式（}3.15^{）における}ǫ²が最小になるような目的関数を求める．

ǫ² =

i=1

(y−f(x))² (3.15)

最小二乗法は，線形だけでなく非線形関数にも用いることができ，大量の観測データを等しく扱い，最良な関数に近似できる．しかし，全ての観測データを等しく扱い，残差の最小二乗和を求めているため，偏った誤差を含んだ観測値が存在する場合や大きな誤差を含む観測値が存在する場合，誤差の影響を強く受けた関数に近似される．目的関数に影響を与える大きな誤差を含んだ観測値は外れ値と呼ばれ，本来は他の観測値よりも残差が大きくなる．そのため，外れ値の残差も含んだ全観測値の残差の二乗和を最小化すると，外れ値に偏った関数が求められる．また，誤差が偏っていた場合，真値を基にした関数に比べて偏った関数が求められる．そのため，外れ値を除いたり特別な重みを加えることにより，外れ値に強く誤差の影響を軽減した最小二乗法として考案された方法がロバスト推定である．

ロバスト推定は外れ値に重みを付ける方法と，外れ値を除く方法の二つの種類に分けられる．重みを付ける方法としては，M推定が挙げることができ，重みの付け方によってさらに分類される．外れ値を除く方法には，RANSAC^，LMedS(LeastMedianSquares)^，

LTS(LeastTrimmedSquares)が挙げられる．以下にそれぞれの方法の特徴と原理について

述べる．

○M^推定 [52]

二乗誤差基準では誤差が大きいほど値が大きくなるが，閾値を超えた誤差の値の上昇を重みを付けることで，外れ値による影響を小さくする方法である．M^{推定には重み} の付け方にいくつかの方法があるが，主な型として，Huber^型とTuckey’s biweight

Table 3.6 Result of GB301S in water

Error( Depth estimation formula of GB301S) [^µm]

Data No.1 No.2 No.3 No.4 No.5

No. Ave. S.D. Ave. S.D. Ave. S.D. Ave. S.D. Ave. S.D.

No.1 -0.07 0.87 -2.31 1.18 -6.17 2.47 -5.77 2.63 -7.33 3.49 No.2 1.95 1.78 -0.19 1.23 -3.81 1.92 -3.41 1.89 -4.78 2.70 No.3 5.62 3.09 3.56 2.26 -0.14 1.35 0.30 1.52 -1.17 1.80 No.4 5.35 3.11 3.26 2.24 -0.50 1.43 -0.07 1.32 -1.47 1.55 No.5 6.70 3.48 4.64 2.60 0.98 1.86 1.37 1.68 0.08 1.54 No.6 2.51 2.34 0.41 1.69 -3.39 1.80 -2.91 1.67 -4.02 1.79 No.7 -1.43 1.94 -3.66 2.52 -7.49 3.58 -7.23 3.89 -8.76 4.24 No.8 0.23 1.33 -1.93 1.36 -5.76 2.65 -5.36 2.58 -6.34 3.13 No.9 -0.56 1.63 -3.02 1.70 -5.90 3.61 -5.66 3.38 -6.90 4.25 No.10 -0.13 1.63 -2.46 1.53 -5.43 3.34 -5.15 3.14 -6.41 4.11

Data No.6 No.7 No.8 No.9 No.10

No. Ave. S.D. Ave. S.D. Ave. S.D. Ave. S.D. Ave. S.D.

No.1 -2.79 2.23 0.80 2.33 -0.47 0.88 0.38 0.97 -0.13 0.89 No.2 -0.52 1.81 2.95 3.12 1.63 1.74 2.40 1.94 1.93 1.83 No.3 2.79 2.53 6.71 3.99 5.19 3.00 6.12 3.28 5.53 3.14 No.4 2.77 1.62 6.57 4.16 4.92 3.07 5.88 3.30 5.26 3.20 No.5 3.82 2.11 8.01 4.47 6.28 3.44 7.22 3.66 6.62 3.58 No.6 -0.09 1.34 4.02 3.52 2.03 2.31 3.08 2.51 2.38 2.43 No.7 -4.72 3.75 -0.10 1.45 -1.82 1.97 -0.91 1.83 -1.46 1.90 No.8 -2.59 1.93 1.49 2.66 -0.26 1.90 0.76 1.43 -0.31 2.25 No.9 -2.56 2.16 1.15 2.41 -1.15 1.83 -0.38 1.85 -0.95 1.83 No.10 -2.02 1.91 1.50 2.58 -0.44 1.90 0.12 1.75 -0.34 1.70

型が存在する．式（3.16^）にHuber^型，式（3.17^）にTuckey’s biweight^{型の重みを} w(y)として示す．どちらの型もある値cを閾値として，重みを付けている．どちらも閾値cを与えなくてはならないが，標準偏差などを基にcを決定することが多い．

w(y) =











−c(y <−c) y(|y| ≤c) c(y > c)

(3.16)

w(y) =









 yn

1−y c

²o²

(|y| ≤c) c(|y|> c)

(3.17)

○RANSAC(RANdom SAmple Consensus) [53]

観測データの中からランダムにいくつかのサンプルを抽出し，最小二乗法に当てはめることを繰り返す．このとき，外れ値以外のサンプルを抽出することができれば，

最小二乗法によって最良な関数に近似できる．また，外れ値の数が全測定数に比べて少なければ，推定される誤差範囲内により多くの測定値が含まれる．つまり，もっとも多くの測定値が範囲内に含まれるときの推定を，最良な関数への推定とみなす．

○LMedS(Least Median Squares) [54]

一般的には，LMedSは最小メジアン法と呼ばれる．観測データの中からランダムにいくつかのサンプルを抽出し，最小二乗法に当てはめることを繰り返す．RANSAC と同様に，外れ値以外のサンプルを抽出することができれば，最小二乗法によって最良な関数に近似できる．最良な関数を評価する際，RANSAC^{と異なり，全測定値} における二乗誤差の中央値が最も小さいとき，最良な関数への推定とみなす．誤差範囲が明らかなときはRANSACのほうが有効であるが，不明なときはLMedS^のほうが有効であり，誤差範囲によって使い分けることができる．

○LTS(Least Trimmed Squares) [55]

一般的には，LTSは最小刈り込み二乗法と呼ばれる．観測データを各サンプル毎誤差を求め，誤差の昇順にソートし，大きいほうからいくつか除いて最小二乗法に当てはめる．全観測値n^{から除く値の数}q^は，pを独立変数の次元として，q= (n+p+ 1)/2 がよく用いられる．式（3.18^{）は実際の}LTSの式であり，観測値は誤差順にソートされている．

ǫ² =

i=1

(y−f(x))² (3.18)

3.3.2 輪郭ボケ距離推定法の問題点と予想される現象

輪郭ボケ距離推定法には，微小物体とエンドエフェクタの輪郭ボケ幅の差を用いて，光学顕微鏡視野における奥行き距離を推定している．輪郭ボケ距離推定法によって近似された推定式（3.10）は第３項までを用いるため，式（3.19^{）に変形する．}

∆z(r) =c³r³+c²r²+c¹r (3.19)

マクローリン展開により近似した際，各項の定数cnの符号は定められ，c3とc1は正の値となり，c²は負の値とならなければならない．しかし，実際の観測値を基に式（3.19^）に対して最小二乗法用いて推定式を導出した際，定数の符号の条件を全て満たさない場合がある．現在は，定数の符号の条件を満たさない場合，推定式導出の失敗として再度輪郭ボケの観測からやり直している．

定数の符号が条件を満たさない原因を究明するために，観測値について考察する．式

（3.10^）^，式（3.19^{）の変数である}r^，∆z(r)が観測値となる．観測値の測定方法は，焦点の合っている微小物体に対して，エンドエフェクタを2^µmずつ下げていき，その度に微小物体とエンドエフェクタの輪郭ボケ幅を測定し，それぞれの輪郭ボケ幅が一致したときに奥行き距離を0として逆算する．エンドエフェクタの移動する際の精度は1^µm^{であるため，}

観測値∆z(r)に誤差が現れることはない．そこで，輪郭ボケ幅に基づく観測値r^に問題が

あると考えられる．実際の観測値の例を表3.7^に示す．EBWをエンドエフェクタの輪郭ボケ幅，微小物体の輪郭ボケ幅をPBW^として∆z(r)^{は簡易的に}z^{とする．表}3.7^のEBW

Table 3.7 Blur-data

EBW(^µm) PBW(^µm) r(^µm) z(^µm)

12.35 0.65 0.84 83

12.48 0.65 0.86 81

11.79 0.65 0.80 79

12.46 0.65 0.85 77

11.42 0.65 0.77 75

の値がzが小さくなるのに対して，EBWは値が大きくなる変化が一部に見られる．この現象は，ボケている物体が被写界深度に近づくほど，物体の輪郭ボケ幅が小さくなり焦点一致に近づく理論に反する．常に焦点に一致して静止している微小物体の観測値には，変化がないため誤差が含まれていないが，エンドエフェクタの観測値であるEBW^には誤差が含まれていることがわかる．この誤差が導出される推定式に影響を与えていると考える．

次に，推定式導出の成功時と失敗時の結果を比較する．実際の推定式導出成功時の結果が図3.19^{，失敗時の結果が}^図3.20である．成功時の例の定数はc1 = 216.41^，c2=−249.67^， c3 = 124.75^{であり，失敗時は}c1 =−38.78^，c2 = 19.38^，c3 = 62.79^{である．成功時に比} べて失敗時は，推定式のグラフから離れた観測値がいくつか見られる．これらは外れ値と呼ぶには小さな誤差だが，観測値の総数が少ない輪郭ボケによる距離推定法では外れ値と同じような大きな誤差を与える．グラフの形状においても，成功時に比べて失敗時の結果にはr= 1^の手前でzの値に極値を見ることができる．極値が存在するということは，観測値におきた輪郭ボケ幅が大きくなる現象をあらわす．そこで，z^{の値が小さくなる変化} と同じように，rの値も小さくなれば極値ができることはなく，輪郭ボケの大きさが理論に反する現象が起こらないと考えることができる．このことから，観測値のEBW^を基にしたrに問題があることが明らかである．推定式導出に失敗した際の結果は，図3.20^の例以外にも同様の軌跡を描き，極値が存在しているため原因は観測値EBW^{の誤差にある} ため同様のものであると考える．

Fig. 3.19 Success

3.3.3 対策

前節で述べた問題の対策として，観測される輪郭ボケ幅のばらつきを抑える方法と最小二乗法を誤差に対して影響を受けにくくする二つの方法がある．前者の方法には，輪郭ボケ幅の観測する際の画像処理を改良する方法がある．現在，輪郭ボケ幅を観測する際は輪郭ボケを含むエンドエフェクタと輪郭ボケを含まないエンドエフェクタに二値化の処理を行い，それらの差分の画素数から算出している．そこで，二値化する際に輪郭ボケを抽出

Fig. 3.20 Failure

するための閾値を改良する方法を考えることができる．しかし，閾値は微小物体とエンドエフェクタの奥行き距離が一致した時，輪郭ボケ幅が一致するように設定されているため，

閾値を変更することはできない．後者の方法には，ロバスト推定のような誤差に強い最小二乗法の応用が存在する．しかし，一回の推定で観測される値の数は40∼60^{個と非常に} 少なく，外れ値として除く数や重みの付け方は限定され，それらを選定して用いなければならない．また，実際には目立った外れ値が存在するわけではないが，観測値の総数が少ないため大きな影響を与えている．そのため，偏った誤差を持つ少数のサンプルに対して，

重み付けや取り除くだけでも有効である．そこで今回は推定式における定数が受ける誤差の影響を軽減するために，輪郭ボケによる距離推定法に適したロバスト推定を選択して用いる．

代表的なロバスト推定について，4種類例に挙げたそれぞれの方法について，特徴を基に選別していく．はじめにM推定は，誤差に対して重みを付ける方法であり，重みには標準偏差を用いることが多い．重みを付けるために用いる標準偏差は平均値を中心としたデータの散らばりを表している．観測値と推定式から得られた値で標準偏差を求めることは可能だが，観測値の総数が少ないため信頼できる重みを付けることができない．したがって，輪郭ボケ距離推定法にM推定は適していない．次にRANSAC^{は，観測データの} 中からランダムにサンプルを抽出し，許容誤差範囲に含まれる観測値の数で評価する方法である．この方法では，許容誤差範囲の設定が問題となる．表3.7^{に示した輪郭ボケ幅に} ついて，大きくなったときの値だけを取り除くための誤差範囲を設定することが難しい．

また，M推定と同様に標準偏差を用いた誤差範囲の設定が難しいため，許容誤差範囲が恣

ドキュメント内 DT ENG 000437 1 Full (ページ 60-69)