空間知能化における現実物体と仮想情報間での隠蔽表現

(1)

修士論文要旨 (2013 年度 )

空間知能化における現実物体と仮想情報間での隠蔽表現

− AR の適用

A Representation of Occlusion between Real Objects and Virtual Information in Intelligent Room - for AR

12N5100002E _{新井雅海} 電気電子情報通信工学専攻橋本研究室

1. 研究目的

AR(Augmented Reality)

とは，現実には存在しない仮想の情報を，視覚や聴覚を通じて取得出来る実際に存在する情報に付加しユーザーに提示する技術である．特に，視覚的

AR

システムには実現方法が二種類あり，自然特徴点や幾何学パターンといった視覚的特徴に仮想情報を対応付ける方法および，GPSや地磁気センサによって設定される絶対座標に基づき仮想情報を付加する方法が存在する

[1, 2]．

一方，空間知能化が近年注目されている．空間知能化とは，様々なセンサや機能を空間に実装し，空間内の事象を捉え，部分的な知能や機能を持ったシステムに対して知能や機能を補完することで，ユーザーに適切なサービスを提供するものであり，空間知能化が適用された空間を知能化空間と呼ぶ

[3]．そこで著者は，空間

知能化の考え方に基づいた新しい

AR

システムを提案した．提案システムでは，前述の二つの仮想情報を表示するための手法が両者とも実現可能であり，それぞれの手法が持つ

•

カメラが必須

•

ディスプレイデバイスの計算負荷が高い

•

環境の変化に弱い

といった問題点を改善することが出来る．

その上で，ARシステムにおいて実用上非常に重要である，隠蔽表現問題に注目する．隠蔽表現問題とは，現実物体と仮想情報の位置関係に応じて適切な隠蔽表現を行う為の，ARシステム上での幾何学的整合性に関する問題である．既存の手法では，ディスプレイデバイスにカメラが必須な上に，ディスプレイデバイスの計算負荷が非常に高く，ディスプレイデバイスで取得した情報を加工して表示する事を前提とするため，カメラレスディスプレイデバイスでは使用できないという問題点が存在する．この事から，空間知能化の考え方に基づいた

AR

システムのメリットを著しく損なってしまう．

そこで，空間知能化の考え方に基づいた

AR

システムにおいて，提案した

AR

システムのメリットを損なう事無く，ディスプレイデバイス側の計算負荷を大幅に減少させ，カメラレスディスプレイデバイスでも動作可能な現実物体と仮想情報間での隠蔽表現を実現することを本研究の目的とする．

2. 提案手法

本研究では，知能化空間によって設定された絶対座標系に基づいた

AR

システムにおいて，

システムを使用するユーザのディスプレイデバイスの位置姿勢及び，空間の三次元情報を計測するビジョンセンサの位置姿勢を推定し，この

(2)

図

1:

エピポーラ幾何概要

推定値に基づいて現実物体と仮想情報間での隠蔽表現を行う．これらの値が既知である場合，

ユーザのディスプレイデバイスから，ディスプレイデバイス上に表示されている仮想情報のある画素を現実空間に射影した点へのベクトルと，

知能化空間内に分散配置されたビジョンセンサの投影面上に投影されている現実物体間の距離推定を行うことによって，隠蔽表現が可能となる．このとき，仮想情報の位置・姿勢が知能化空間上の絶対座標に基づき管理されているため，

ディスプレイデバイスの位置姿勢から仮想情報の見え方を逆算可能であり，ユーザのディスプレイデバイスのカメラから取得される映像を使用することなく隠蔽表現が可能となる．そのため，ユーザ側のディスプレイデバイスでは，現実物体と仮想物体間の隠蔽判定を行うための計算負荷を非常に軽減する事が可能である．以下に，隠蔽判定を高速で行う為のエピポーラ幾何の応用方法及び隠蔽判定手法に付いて述べる。

2.1

エピポーラ幾何

エピポーラ幾何とは，二台以上のビジョンセンサを用いて，三次元空間上のある注目する点までの三次元座標を求めるためのステレオビジョンに関する幾何のことである

[4]．図 1

に示すように，Cl及び

C

_rが左右それぞれのビジョンセンサの投影中心，ビジョンセンサの投影面上の点

X

_l及び

X

_rを注目する点が投影面上に投影された点とする．このとき，二つのビジョンセンサはそれぞれ違う位置に存在するため，

図

2:

隠蔽判定手法概要

一方のビジョンセンサから他方のビジョンセンサを投影面上，もしくは投影面を拡張した同一平面上から見る事が出来る．この点をエピポールと呼び，左側のビジョンセンサの投影面と同一の平面上のエピポールを

e

l

,

右側のビジョンセンサの投影面と同一の平面上のエピポールを

e

_rとおく．また，点

e

_l及び

X

_lまたは点

e

_r及び

X

_rを通る直線をエピポーラ線と呼ぶ．

このとき，図

1

の幾何学関係から明らかなように，二つのビジョンセンサが同一の点に注目している場合，その点はお互いのエピポーラ線上に投影される．以上の事から，対応する点を求める上で幾何学的な制約を加える事ができ，

探索範囲を一次元まで絞り込む事ができ，その上で精度を向上させる事が出来る．本研究では，

仮想情報を擬似的に現実空間に射影する事により，仮想情報に対してエピポーラ幾何の考え方を適用する．

2.2

隠蔽判定手法

仮想物体と現実物体間の隠蔽表現は，仮想情報が表示される画素を知能化空間によって設定された三次元座標系上に射影し、ディスプレイデバイスからその点までのベクトル及び、知能化空間内のビジョンセンサの投影面上のエピポーラ線上の点を同様の座標系上に射影した点までのベクトルを計算し，これらのベクトル間の距離を計算することによって隠蔽判定を行うことが出来る。いま，図

2

に示すように，ビジョ

(3)

ンセンサ上のエピポーラ線上の点を絶対座標系に射影した点

p

を

(p

_x

, p

_y

, p

_z

)，ディスプレイデ

バイスの絶対座標系上での座標を

l(l

_x

, l

_y

, l

_z

)，l

を通り，ディスプレイデバイス上に表示されている仮想情報を同様の座標系上に射影した点までのベクトルを

v

とおく．このとき，pから

v

上の任意の点までのベクトル

u

は，以下のようにして求める事が出来る．

u =



 l

_x

+ v

_x

t − p

_x

l

_y

+ v

_y

t − p

_y

l

_z

+ v

_z

t − p

_z



 (1)

v

と

p

間の距離を求めるには，pから

v

へ降ろした垂線の長さを計れば良い．uが

p

から

v

への垂線となるためには，uと

v

の内積が

0

となる点を求めればいいので，式

1

を以下のように変形する．

v

x

{ (l

x

+ v

x

t) − p

x

}

+ v

_y

{ (l

_y

+ v

_y

t) − p

_y

} (2) + v

_z

{ (l

_z

+ v

_z

t) − p

_z

} = 0

以上のことから，uが

p

から

v

への垂線の足の座標となる時の

t

は

t = v

x

(p

x

− l

x

) + v

y

(p

y

− l

y

) + v

z

(p

z

− l

z

) v

²_x

+ v

²_y

+ v

²_z

(3)

となり，このときの

u

の大きさを調べる事により，pと

v

の距離を求める事が出来る．

この距離が各ビジョンセンサやアルゴリズムの誤差，ビジョンセンサの配置に基づき決定されるしきい値以下の場合には，外界ビジョンセンサ側のエピポーラ線上に投影されている現実物体のほうが仮想情報よりもディスプレイデバイスに対して近い事を意味する．従って，この場合には仮想情報を非表示にすることによって適切な隠蔽表現を実現する事が出来る．

図

3:

開いた手を仮想情報の前に置いた場合

図

4:

閉じた手を仮想情報の前に置いた場合

3. _実験

提案手法の基本的な性質を評価するための実験として，ディスプレイデバイスの光軸方向から

1m

の位置に仮想物体を配置し，現実物体をディスプレイデバイスから

0.5m〜1.5m

の間で動かした場合の精度や処理速度を計測し，正しく隠蔽表現が実現出来ているかを確認する．

ハードウェアの構成としては，モーションキャプチャシステム及び

Kinect

を利用する．モーションキャプチャシステムは，空間内に絶対座標系を設定し，その座標系内での物体の位置・

姿勢を推定するために使用される．

Kinect

は深度センサを外界ビジョンセンサとして，光学カメラをディスプレイデバイスのための映像取得用カメラとして用いる．

3.1

実験結果

現実物体として，仮想情報よりも小さい成人男性の手を用いた場合の実験結果を図

3,

図

4,

図

5

に示す．図

3

及び図

4

では腕を仮想情報の

(4)

図

5:

仮想情報の後ろに腕が移動した場合前へ，図

5

では腕を仮想情報の後ろへ動かした場合の結果を表している．

実験結果が示す通り，仮想物体と現実物体の位置関係に応じて適切な隠蔽表現が出来ていることが確認できる．また，隠蔽表現の誤差は現実物体が外界センサから

0.9m

のときに最大で，

5pixel

生じており，リアルタイムで隠蔽表現の

ための計算を行った場合には，1分間平均の描画速度は

10f ps

だった．

誤差の原因としては，

Kinect

の深度センサは物体の境界線付近で誤差が生じることが知られており，この誤差によって生じる計測誤差のほか，深度センサのキャリブレーション精度が考えられる．深度センサを高精度でキャリブレーションする事は一般的に難しく，今回の実験では高精度のキャリブレーションを行っていないため，内部パラメータが含む誤差によってエピポーラ線のパラメータが正しく推定できていないために誤差が生じていると考えられる．

Kinect

の誤差特性に基づき誤差の理論値を

計算すると，

1m

前後の場合に発生する誤差は，

出力される画像の解像度を

VGA

とした際に，

2pixel

となるので，高精度のキャリブレーショ

ンを行う事により，隠蔽表現時によって生じる誤差を理論値に十分近づける事が可能であると考えられる．

4. むすび

本研究では，空間知能化の考え方に基づき，

既存の視覚的情報に基づいた

AR

システムの問題点を解消する事の出来る

AR

システムを提案し，その上で，ディスプレイデバイスの負荷を軽減し，カメラレスディスプレイデバイスでも実現可能な隠蔽表現手法を提案した．また，実験を通じて，適切な隠蔽表現が可能であることを確認した．

今後の課題としては，知能化空間内のビジョンセンサの最適配置問題や，他の空間知能化の技術と密に連携し，空間知能化をより発展させる事や，プログラムとアルゴリズムを改善する事によって，処理速度を向上するが挙げられる。

参考文献

[1] Hanyang, Jong-Il Park:Interactive Mo- bile Augmented Reality system using a vibro-tactile pad, VR Inno- vation (ISVRI), 2011 IEEE International Sympo- sium, 329/330(2011)

[2]

中林拓馬, 加戸啓太, 平沢岳人:GPS と三軸角度センサを用いた屋外向け拡張現実感の研究, 社団法人日本建築学会,

481/482(2010)

[3]

橋本秀紀，新妻実保子，佐々木毅：空間知能化

-

インテリジェント・スペース，日本ロボット学会誌，23-6，674/677 (2005)

[4] Zhang Ruling, Sun Hanxu, Jia Qingxuan,

Yao Fusheng：Research on Fast and Ac-

curate Occlusion Detection Technology of

Augmented Reality System, Industrial In-

formatics, 111/116(2008)

空間知能化における現実物体と仮想情報間での隠蔽表現

修士論文要旨 (2013 年度 )