非線形最小化

第 6 章統合に向けて

A.4 非線形最小化

非線形の関数を用いて、多数の変数の組み合わせから最適な解を求める手法である。本研究では、２枚もしくは多数枚の画像を用いて、カメラの位置・姿勢や、点の３次元位置を補正する際に用いる。

条件として、別の視点から取得した２枚もしくは多数枚の画像があり、画像間で４つ以上の点が対応づいているとする。また、初期値が必要なため、真値に近いカメラの位置・姿勢と特徴点の３次元位置があらかじめわかっているものとする。本研究では、これらの初期値を、モーションステレオや、因子分解法を用いて取得しておく。

評価関数の算出

透視投影モデルのもとで、カメラの位置・姿勢、特徴点の画像上の位置と空間上の位置に関する関係式を導出する。基準座標系は、ロボットが走行する床面上のワールド座標系（ローカル座標系）とする。ある点Pをワールド座標系から見た場合と、カメラ座標系から見た場合の関係式は、以下の式で表される。

R₁^Tx₁ =X−T₁

R₂^Tx₂ =X−T₂ (A.18)

ここで、R_i(i= 1,2)はワールド座標系から見たカメラ姿勢の回転行列、T_iはワールド座標系から見たカメラ姿勢への平行移動ベクトル、Xはワールド座標系から見た点P の３次元位置、x_iはカメラ座標系から見た点Pの３次元位置を表す。

一方、透視投影の式では、点の画像上の位置(u, v)^{と空間上の位置}(X, Y, Z)^{は、以下} の式で結びつく。



 u v 1



=A(R| −RT)





 X Y Z 1







ここで、wはスカラーの係数、Aはカメラの内部行列である。カメラの内部行列はあらかじめ求めておく。

まず、カメラ座標から見た点Pの座標を(x_c, y_c, z_c)と置き、透視投影の式を表す。この時、基準座標系はカメラ座標系となるので、そのカメラの位置・姿勢は、回転行列が単位行列、平行移動ベクトルがゼロベクトルとなる。



 u v 1



=





f₁ 0 0 0 f₂ 0 0 0 1









1 0 0 0 0 1 0 0 0 0 1 0









 x_c y_c z_c 1







これよりwを消去すると、以下の関係式が導かれる。



 x_c y_c z_c



=







z_c f₁u

z_c f₂v

z_c





 (A.19)

この式（A.19）を、式（A.18）にそれぞれ代入しz_cを消去すると、以下の評価関数が導かれる。

C =²

j=0

P i=0

r^T_xjm_ij

r^T_zjm_ij −X_i+t_xj Z_i+t_zj

₂

+²

j=0

P i=0

r^T_yjm_ij

r^T_zjm_ij − Y_i+t_yj Z_i+t_zj

₂

(A.20)

具体的には、以下のような４つの式から成る。

C₁=

v₁sinθ₁−f₂cosθ₁

v₁cosθ₁+f₂sinθ₁ − X Z−h

₂

C₂ =

f₂u₁

v₁cosθ₁+f₂sinθ₁ −f₁ Y Z−h

₂

C₃ =

−f₂u₂sinφ+f₁v₂sinθ₂sinφ−f₁f₂cosθ₂cosφ

v₂cosθ₂+f₂sinθ₂ −f₁X−d_x Z−h

₂

C₄=

f₂u₂cosφ+f₁v₂sinθ₂cosφ−f₁f₂cosθ₂sinφ

v₂cosθ₂+f₂sinθ₂ −f₁Y −d_y Z−h

₂

f₁、f₂はカメラの焦点距離に関する係数であり、既知とする。また、hはカメラの床面からの高さであり、全体を通して一定である。

この式より、カメラの角度ψ、θ、ロボットの並進成分d_x、d_y、点の空間上での位置座標 X、Y、Zのうち、未知のパラメータを変数とし、勾配法による最小化計算をおこなう。

勾配法による最適化

求めた評価関数にパラメータを入力し、最適化計算をおこなう。本研究では、ニュートン法と呼ばれる関数の二次微分を利用した最適化手法を用いる。ニュートン法の更新式は、以下のようになる。

n_i₊₁ =n_i−H⁻¹dC(n_i)

dn (A.21)

ここで、nは変数を並べたベクトルであり、Hはヘッセ行列と呼ばれる、関数の二次微分を対象に並べた行列である。







∂²C

∂n₁²

∂²C

∂n₁∂n₂ · · ·

∂²C

∂n₁∂n₂

∂²C

∂n₂² · · · ... ... . ..







ニュートン法は、初期値が真値に近い場合、収束が早いという性質を持つ。本研究においては、線形解法などの他の手法から求める初期値が相応に正確であると判断し、この手法を採用した。

非線形最小化は、周囲に極値が存在しなければ、入力されたパラメータの初期値に対し、反復計算をおこない最適なパラメータを求めることができる。本研究においてカメラの位置・

姿勢を補正する際には、少なくとも４つの特徴点の対応が与えられていれば、その３次元位置が既知でなくても、解を精度よく求めることができる。問題点としては、最小化をおこなうパラメータの数に比例し、処理時間が増加することがあげられる。これは主に、ヘッセ行列が大きくなることにより、逆行列算出の計算コストがかかることに起因する。カメラの位置・姿勢と特徴点の３次元位置を最適化する問題では、ヘッセ行列が特殊な形をしていることを利用し、高速化する手法が提案されている[16]が、本研究では実装していない。また、多くの特徴点をまとめて処理するため、一部の特徴点に追跡ミスがあった場合、最小化処理が収束せず、精度の良い解が求まらないおそれがある。本研究では、RANSACの枠組みを利用し、これに対処している。

ドキュメント内 Mthesis_yamazaki.dvi (ページ 85-88)

第 6 章 統合に向けて

A.4 非線形最小化

第 6 章統合に向けて