愛知工業大学研究報告 第31号B 平成8年
視線検知による
3
次元画像処理
T
h
r
e
e
-
d
i
m
e
n
s
i
o
n
a
l
c
o
m
p
u
t
e
r
g
r
a
p
h
i
c
p
r
o
c
e
s
s
r
e
a
c
t
t
o
p
o
i
n
t
o
f
v
i
e
w
山梨貴弘
ttT
a
k
a
h
i
r
o
Y
a
m
a
n
a
s
h
i
加藤厚生
TA
t
s
u
o
Ka
t
o
A
b
s
t
r
a
c
t
To r
e
a
l
i
z
e
t
h
e
v
i
r
t
u
a
l
r
e
a
l
i
t
y
s
y
s
t
e
m
n
e
e
d
s
h
i
g
h
s
p
e
e
d
c
o
m
p
u
t
e
r
g
r
a
p
h
i
c
p
r
o
c
e
s
s
i
n
g
t
e
c
h
n
o
l
o
g
y
.
I
n
a
v
i
r
t
u
a
l
r
e
a
l
i
t
y
s
y
s
t
e
m
,
g
r
a
p
h
i
c
c
o
m
p
u
t
e
r
s
h
a
v
e
t
o
c
o
m
p
u
t
e
t
w
e
n
t
y
f
o
u
r
h
u
n
d
r
e
d
r
n
i
l
l
i
o
n
p
o
l
y
g
o
n
s
p
e
r
s
e
c
o
n
d
t
o
show t
e
l
e
v
i
s
i
o
n
l
i
k
e
a
n
i
m
a
t
i
o
n
.
I
t
i
s
i
m
p
o
s
s
i
b
l
e
f
o
r
a
p
r
e
s
e
n
t
c
o
m
p
u
t
e
r
s
y
s
t
e
m
.
百l
i
sp
a
p
e
r
p
r
o
p
o
s
e
s
a
i
m
p
r
o
v
e
m
e
n
t
m
e
t
h
o
d
f
o
r
a
t
h
r
e
e
-
d
i
m
e
n
s
i
o
n
a
l
c
o
m
p
u
t
e
r
g
r
a
p
h
i
c
p
r
o
c
e
s
s
加gs
p
e
e
d
b
y
s
e
p
a
r
a
t
e
s
t
w
o
c
o
n
d
i
t
i
o
n
s
o
f
c
1
e
a
r
a
n
d
un
c
1
e
a
r
r
e
g
i
o
n
o
f
s
i
g
h
t
.
I
n
un
c
1
e
a
r
r
e
g
i
o
n
we h
a
v
e
p
o
o
r
e
y
e
-
s
i
g
h
t
.
百l
a
ti
s
a
b
l
e
t
o
make r
e
d
u
c
e
p
o
l
y
g
o
n
d
a
t
a
.
By some e
x
p
e
r
i
m
e
n
t
s
we g
o
t
a
r
e
s
u
l
t
t
h
a
t
t
h
e
p
r
o
c
e
s
s
s
p
e
e
d
was i
m
p
r
o
v
e
d
t
w
i
c
e
.
1 . は じ め に の話になるであろう。 本報は画像処理速度向上のため、人間の視線を検 7 Virt凶 RealityれTR)はマン・マシン・インターフエ 知し、見ていない部分の情報量、すなわちポリゴン数 ースに関する新しい技術として、各分野での応用が期 を減らし、画像処理速度の向上を目的としている。人 待されている 1). しかしながら、最新の技術をもって の限の特性を調べ、明視できない条件について特定し、 しでも、十分な成果をあげているとは言えない.たと 実験を行った。 えば、 ComputerGraphics (CG)を写真並みの画像にする には、約8000
万個のポリゴンで構成する必要があ2
.
眼の特性 る九しかも、動画とするには、少なくとも毎秒10 コマは必要である。ちなみに、映画は毎秒24
コマ、 テレビは毎秒30コマである。そのため、 V Rシステ ムでテレビ並みの画像を描画するには毎秒24
億個 のポリゴンを計算し、表示しなければならない。現在、 スーパーコンビュータを使用しでも、毎秒たかだか1000
万ポリゴンまでしか表示できない。毎秒24
億 個ものポリゴンを計算できるようになるのは数年先 ? 電子工学科 t t 大 学 院 電 気 電 子 工 学 専 攻 2. 1視力 図1は眼球固定時の視角に対する視力を示す。周辺 視では極端に視力が低下する。 3) 図lのグラフを最小 2乗法によりY=e
(0・ 19 -O. 8 lLog (X) ) (1) ただしx=o
の時Y=l
と近似できる。さらに、眼球全体の視力を求める。8 愛知工業大学研究報告,第
3
1
号B
,平成8
年,Vo
.13
1
-B
,Ma
r.1
9
9
6
Vl = :rr:((Exp(旦旦二王笠立
2
))2 dy +.nx2 y (2) J ' • . 0081 VO=J政Zσ
)
Vlは式①に基づいた視力、 VOは眼球の視力がすべ て1.0である場合の視力である。 Vl/VOにより、網膜に映る像の情報量減少率を求め ることができる。図2は提示視野角における情報量減 少率を示す。人の水平方向の視野角は200
度であり、 ディスプレイ装置の提示視野角が200
度まで保証 されているならば、網膜に映る像の情報量は約 95% 減少することになる。この場合の情報量とは視力のこ とであり、視力とは分解能の逆数により定義されてい る。表1は視力と分解能を示す。視力O. 03とは視 角100度の視力であり、 5 m先の識別可能な幅は 4. 4cmまで拡大する。よって、周辺視野ではの像はモ ザイク画となる。図3に網膜イメージ像を示す。 1.0 Q.9 0.81 -0.7 視。圃6 力 0.5‘ 0.4 0.3 0.2 0.1 ooò~! 中心からの角度 図1 視角による視力の変化(文献 4より)震
2
0
情豊
少 率 ~ 10 100 200 表示視野角(度) 図2 視野範囲に対する像情報量減少率 図 3のモザイク画では全体の函素数が減少する。画 素数を削減することが可能であれば、計算量も削減す ることが可能となる。また、分解能が減少したことに より像内の物体の形は大まかなものとなる。よって、 物体を形成するデータであるポリゴンデータも削減 することが可能となり、その結果として処理速度は向 上する。 5 m先の識l
l
'
J
幅 1.5mm 2.9αn 4.4αn 図3 モザイク処理による像の変化 2. 2授 野 図4は視野を示す。両側の半月形の部分は単眼視を 示している。見えない範囲は表示する必要がなく、見 えない範囲を削除する分、処理速度は向上する。 視野は色により変化する。図5は色に対する視野を 示す。緑、赤、青の順に視野の範囲が広がる。 色についても情報量を削減することが可能となる。視線検知による3次元画像処理 9 周辺視野では視力は低下し、色の知覚も不可能となる。 しかしながら、周辺視野は時間的に変化する刺激、例 えば点滅する光や運動物体を検出する能力は優れて いる。 4)また、周辺視野は物を知覚する役割も果たし ている。仮に周辺視野を失うと我々人間は物を知覚す る能力を失う。画像情報には削減可能と不可能なもの があり、可能なものとは、視線の動きと物体の知覚に 影響を与えないものである。 図4 眼球固定時の視野(文献 5より) 図5色に関する右巨単眼の視野(文献5より) 2圃 3有効視野 読み慣れた母国語の文章を読むときの視線の動き を観察すると、 1文字づっ読むのではなく、数文字ご とに視線が跳躍していることがわかる3)。この持の有 効視野角が約10度であり、文字数で言えば 12文字 である。有効視野角10度のなかに 12文字以上の文 字を配置したとすると、有効視野角は小さくなる。こ の場合、有効視野角が網膜の能力を示すのではなく、 脳の認識能力を示していると言える。また、文章を読 むとき、 2行にわたって同時に読むことはできない。 つまり、脳の認識能力と目標物により有効視野の大き さと形状は変化するのである。有効視野内のオブジェ クトは簡略表示するべきではない。 2. 4眼球運動 限球運動には数種類あるが、本報では衝動性運動と 焦点調節運動について注目している。 2. 4. 1 衝動性運動 視点を移動させる運動には追従性運動と衝動性運 動がある6)。前者は低速で移動する目標物体をスムー ズに追従する運動であり、限界速度は低く 30度/秒 程度である。目標物体が限界速度を超えると追従でき なくなり衝動性運動となる。衝動性運動とは視点があ る点から別の点に跳躍する運動であり移動時聞が 10msec~ 100ms巴c、眼球を固定し像の認識に 200ms巴c ~400msec 費やしている。平均すると跳躍は 1 秒間に 約3回行われている。 図6は視線跳躍中の光点知覚確率を示す。視線がA 点から B点に移動する前後は光点の知覚確率が低下 しており、像の認識が不可能となる3)。周辺視野での モザイク処理を行い視線を移動させると、モザイクの 範囲が変化することになり画像のちらつきが気にな る。しかし、跳躍運動中に画像を切り替えることによ りちらつきが軽減される。 2. 4. 2 焦点調節運動 図7は物体聞の距離と被験者との距離による焦点ず れの関係を示す。実験は紙に書いた‘あ'という文字 を縦に 2等分し、板A、Bに貼りその板を遠近方向に 間隔をあけて配置し、文字を明視できる距離を測定し て行った。被験者は3人である。実験結果から最小二 乗法で推定した一次関数式は、
L=
土
X
1
4
である。 Xは被験者と物体Aとの距離、 Lは物体Aと 物体 Bとの距離である。 この式を有効視野内での焦点ずれオブジェクトのMar. 1996 ル1とする。 ・シェーディング処理はフラットシェーディングと 平成8年, Vo1.31-B, 愛知工業大学研究報告,第31号B, する。 。テクスチャマッピングは使用しない。 -視線検知装置が無いため、視点はマウスカーソルで 代用する。 ・視線検知は1秒間に約3固とする。 。視野固定とする。
.
z
バッファ時の高速化は行わない。 -視線検知しない場合、総ポリゴン数760
、フレー ムレート約13 (fps)、1秒間の計算ポリゴン数988o
(polys/sec)である。 情報量削減の基準とする。 10 光点目知覚確立 (frl~) !f)O 1) 肌 自の動きの時間経過 t . '0!J 図6衝動性運動中の光点知覚確率(文献 3より)400
n u n u q L 観察者と物体の距離 ( c m レベル l 3. 2 実験潔境 コンビュータ: A T互換機ペンティアム133MHz グラフィックボード: Fire Bord (SPEA Co.) グラフイツクライブラリ: World Tool Ki t (SENSE 8 Co.) 図 9 レベルO 図8 物体問の距離 (cm) 図7 焦点ずれによる物体聞の距離 3. 3 実験結果 表2は視線検知による 3次元画像処理速度を測定し た結果である。測定は約25秒間行った。 polysは画 面上のポリゴン数、 frernerateは一秒間の描画枚数、 perforrnanceは一秒間に計算できるポリゴン数を示し、 polys perforrnance、frernerateperforrnanc~ polys frerne perforrnanceはそれぞれ視線を検知しない場合 の値で割った値を示す。 実験においてフレームレートは平均1.5倍のスピー ドアップになり、目的である視線検知によるパフォー マンスの向上は達成した。ポリゴンの数を削減するほ どフレームレートは向上し、複雑な形の物体ほどポリ 実験 3. ,実験条件 ・ポリゴンデータは各オブジェクトで2種類用意し、 レベル1オブジェクトはレベル 0のポリゴン数に比 べ1I2~l/10 のポリゴン数に設定しである。ここで、 オリジナルデータ=レベルO、簡略化済みデータ=レ ベル 1とする。 -バーチャル空間には、机、テレビ、ラックなどのオ ブジェクトがある。 -有効視野を 10度に固定し、その中に入ったオブジ ヱクトはレベルOとし、それ以外はレベル1にする。 ただし、体験者からの視点と有効視野範囲のオブジェ クトの距離を計算し焦点が合っていないものは、レベ 3.11 われている為である。視点にオブジェクトが存在する 場合と存在しない場合など、ケースにより処理が大き く異なり、 po!yslsecの値が激しく変動している。現 在、レベル操作のアルゴリズムは最適化できておらず、 最適化によりパフォーマンスは向上し、 po!yslsec値 も安定する。 視線検知による3次元画像処理 ゴン数を削減しやすく、高いパフォーマンスを発揮す る。本実験ではグラフィックボードの性能を考慮し、 複雑な物体は使用していない。 画面上のオブジェクトのポリゴン数は約 50%まで 削減したのだが、 l秒間に計算できるポリゴン数は約 70%に減少している。ジオメトリ演算はC P Uが負担 しており、視線検知、レベル操作の処理にC P Uが奪 同﹃開国四﹃曲丹市川 25 5 n H M H U の H V 伊 h J U 10 800 750 700 650 600 550 500 450 400十 一 一 350十 一 一 一 一 二 一 -UO} 一 司 臼 450 400 200 250 300 freme count freme rate 350 150 100 50
•
po!YS•
圃 -a・ 噌 ・ ・ ・
・ 司 ︾ 一 帽-•
晶•
d同・
・
4・
ー
.
・
"
-
.
‘
・
・ .
.
.
.
-
・
.
.
.
.
・
±
.
.
-
.
-
.
•
•
-
•
-
" . ..
.
・
闘
,
,
-_
.
.
.
t-".ー
・
・
圃
・
・
a
•
・
図10フレームレートと画面内ポリゴン数の変化a
d
-.•
・ ・ ﹄ 同 ・
・
,
.
M
.
'
t・ ・
H .・
T m e -a. 4
, , ・ ・
L I-S
J
L
I
M
-一
a- 噌 ' ・ ・ ・
1・ ' 一
ト ・ . ・
.•.
一
.
,
,
・
・
一
・
・
・
・
一
n H u n H V A H u n H V 内 H u n H v n H v n H v n H u n H U A H U A H u n H U A H u n H u v n H U A H u n H U n H V A H U 内 H u n H V A H u p k υ 向 日 υ p h u n H U F h υ n H U F h u 内 H U p h d n H u n u n u n 3 0 0 0 0 マ a n , t a U 氏 υ 民 U F O-
•
ー
.
.
唱。-一﹃臼¥臼司口 500 450 図11 1秒間に表示できるポリゴン数の変化 表2 視線検知による速度向上の結果 polys 合ernerate perforrnance polys f民rnerate polys合巴rne (polys)血
s)_
c
p
口lys/型。I
perf,型塑塑ce p巴.rforrnanceI
perforrnance averege 373.96 19.39 7247.81 0.49 1.49 0.73 rnumrnun 347.00 14.42 5104.37 0.46 1.11 0.52 rnaxunurn 509.00 22.90 9915.32 0.67 1.76 1.0012 愛知工業大学研究報告,第31号 B,平成 8年, V 01.31-B, Mar. 1996 4 結論 本研究では、視線感知による3次元画像の描画速度 向上法を提案した。人の眼の特性を調べ、何が見え、 何が見えないのか議論した。眼の最大の特徴は中心部 のみ視力が優れており、周辺視では極端に視力が低下 する。この特徴を最大限に利用し計算量の大幅削減が 可能であることが解った。 実験において1.5倍ではあるが、高速化に成功した。 理論的にはオブジェクトが複雑になり、多数のポリゴ ンを使うほど処理速度は向上する。実験では1000 ポリゴン程度しか使用していなため、1.5倍は最低の 基準とも言える。現時点でポリゴンデータは 2段階で あり、視野角に対し連続的なデータを作成し、描画す る課題が残っている。また、実際に視線入力装置に対 応させ実験する必要がある。 オブジェクトのテクスチャへの置き換えについて は、ハードウェアの仕様により大きく変わる。テクス チャを使用することにより、逆に遅くなる場合がある。 Fire bordでのテクスチャマッピングの使用は遅くな る。しかしながら、最近高速にマッピングできるボー ドも開発されており、有効な技術となり、更なる高速 化が可能となる。 現時点で、この視線検知による3次元画像の描画速 度向上については、 2通りの考え方がある。 1つは、 ポリゴン数変換時の画像のちらつきを無くし普通の 3 次元C Gに見せること、もう lつは低レベル情報から 高レベル情報へのリンクとすること、と考えられる。 前者はもっと詳しく日の動きについて調べる必要が ある。ポリゴンレベル変換時のちらつきが気になり、 なるべく目立たなくする努力が必要である。仮に、視 点の移動先が予測できるのであれば、ちらつきは軽減 できる。 後者はハイパーテキスト的な(この場合はグラフ イック)考え方である。見たい情報をより詳しく見る ために高レベルへリンクする。近年では、アポロ13 ジュラシックパークなどの映画にもC Gが採用され ており、レイトレーシング法、ラジオシティ法を適用 することにより、より鮮明な画像を描画できる。これ らの処理は時間がかかり現在の技術ではリアルタイ ム処理は不可能である。しかし、有効視野の限られた 範囲に使用することにより、リアルタイム処理するこ とが可能となる。 我々の実験では、オブジェクトの切り替えが目立っ てしまい、後者の部類に属する。人の日については明 らかになっていないことがあり、今後の追求により高 速化とスムーズ化に期待が持てる。 参考文献 1)庚瀬通孝.バーチャル固リアリティ,産業図書 (1993) 2) W. Wayt Gi bbs原文:バーチャルリアリティと現実 のギャップ,日経サイエンス 2月号, 111-112(1995) 3) 池田光男:目は何を見ているか,平凡社 (1988) 4)斎藤進:人の感覚とそのしくみ,人間工学,朝倉 書庖(1993) 5) 真島英信:生理学,文光堂, 41-263(1987) 6)田崎京三,大山正,樋渡泊二編集:視覚情報処 朝倉書店(1982) 7)佐藤方彦監修:人間工学基準数値数式便覧,技報 堂出版,79-80(1992) 8) 野呂影勇:人間工学入門,日刊工業新聞, 23-30 (1983) 9)池田光男,芦沢昌子:どうして色は見えるのか, 平凡社(1994) 10) World tool kit Hard Guide:SENSE8 Corporation (1993) ( 受 理 平 成8年 3月19日〕