Title
複数局所特徴量による一般物体認識に基づく情報提示シ
ステムの提案
Author(s)
小渡, 悟
Citation
沖縄大学マルチメディア教育研究センター紀要 = The
Bulletin of Multimedia Education and Research Center,
University of Okinawa(10): 1-5
Issue Date
2010-03-31
URL
http://hdl.handle.net/20.500.12001/6419
研究ノー ト
複数局所特徴量 による一般物体認識 に
基づ く情報提示システムの提案
小波
悟
沖縄大学人文学部
あらまし 記憶補償、言語 リハビリテーションなどの福祉分野への適応を目的とした情報提示システムを提案する。 本 システムではノー トPCに設置されたUSBカメラにより対象物体 を撮像 し、画像か ら抽出した複数の局所特徴量を 統合することで識別を行 う。従来、失語症患者に対する言語療法が、言語療法士か らの問いかけに答える受動的なも のだったのが、本システムを用いることで失語症患者 自身がUSBカメラを対象物体 に向けることで名前の手掛か り 情報を得ることができリハビリを能動的なものに変えることが期待できる。Ge
ne
r
i
cOb
j
e
c
tRe
c
o
gni
t
i
o
nwi
t
hmul
t
i
p
l
eLo
c
a
lf
e
a
t
ur
e
s
f
o
rI
nf
o
r
ma
t
i
o
nPr
e
s
e
nt
a
t
i
o
ns
ys
t
e
m
Sa
t
or
uOdo
Fa
c
ul
t
yofHuma
ni
t
i
e
s
,
Oki
na
waUni
ve
r
s
i
t
y
Abstract Thisistopmposetheinformationdisplysystem aimedatapplicationstothewelfarefield ●
suchasmemorycompensationandlanguagerehabilitation.Inthissystem,theUSBcamerainstalledin
anoteb
o
o
kPCtakestheimageofanわbject.Thenmultiplelocalfeaturesextractedfrom theimageare piecedtogethertoidentifytheobject.Localfeatureshavebeenobtainedsofarinapassivewaythatthe aphasicanswerthequestionsaskedbyaspeechtherapistinspeechtherapy.Thissystem wouldallow theaphasicthemselvestogetsituationalinformationaboutthenameoftheobjectatwhichtheypoint theUSBcamera ltisexpectedtobeabletochangerehabilitationintosomethingmoreactive.1-1はじめに 近年、拡張現実感(AR:AugmentedReality)技術は』情報提示における新しい技術として様々な分野で 研究が行われている。拡張現実感技術で用いられるディスプレイは光学シースルーやビデオシースルーを用 いた透過型HMD(HeadMountedDisplay)、臨場感の高い仮想空間を提示できる没入型プロジェクショ ンディスプレイなど、さまざまな研究がおこなわれている、。しかし、HMD型ではディスプレイの重量や サイズによるユーザの行動に対する制限があり、没入型ではユーザの周囲を大画面スクリーンを用いて覆う ため、周りの現実環境を隠してしまうという問題がある。またぐコンピュータの処理能力の飛躍的向上によ り特殊な機材を使わずに可搬性の高いノートPC、PDAにてディスプレイ上の実環境映像に対して注釈情報 を重畳させて』情報提示することも行われている[2][3]。これらではユーザの状況に応じた`情報提示を可能とし ている。 本稿では、記憶補償、言語リハビリテーションなどの福祉分野への適応を目的としてAR技術を用いた情 報提示システムを提案する。図1に示すようにシステム構成はノートPCのディスプレイ上部にUSBカメ ラを実環境撮影用に1台配置し、カメラにて撮影した映像に情報を付加してディスプレイへの提示と音声に よる提示を行う。このシステムにより、ユーザはUSBカメラを対象に向けるだけで情報を得ることができ 提示された,情報に対する操作もその場で行えるなどの利点が得られる。従来、失語症患者に対する言語療法 が、言語聴覚士からの問いかけに答える受動的なものだったのが、本システムを用いることで失語症患者自 身が実環境撮影用カメラを対象物体に向けることで名前の手がかり情報を得る能動的なものに変えることが 可能となる。
ディスプレイへの表示と
音声I、!;iiiii;ii類I
SIFT+BCF SVM識別結果
入力画像
HOG SVM特徴抽出
Fig.1:システムの流れ 2特徴量 本稿では実環境中の物体認識にSIFT(Scale-InvariantFeatureTransfor、)特徴量[4]と特徴量HOG (HistogramsoforientedGradients)特徴量[6]を用いる。どちらも局所領域における輝度の勾配方向をヒ ストグラム化した特徴量であるが、SIFT特徴量が特徴点に対して特徴量を記述するのに対し、HOG特徴 量は一定領域に対する特徴量の記述を行う。 2.1SlFT特徴量 SIFTは物体の拡大・縮小・回転・照明変化に不変の特徴量で、特徴点の検出(detection)と記述(descrip-tion)の2段階からなる。 第1段階の特徴点の検出を行う。特徴点候補は、スケールの異なるガウス関数GCM/,o)と入力画像 I(j,/)を畳み込んだ平滑化画像L(zW,o)の差分であるDifference-of-Gaussian(DOG)画像から求める。 それぞれ以下の式により求められる。 -2-LCM/,。)=G(jM/,O)*I(j,j) 1_筵2+"2
G(Z,Z/,o)=ファFe,。2
(1) (2) DOG画像G(z,ZM)は式(3)となる。 G(z,z/,o)=(G(5M,ノto)-G(jM,o))*I(j,j) =L(j,j,/CO)-L(Mo) (3)竺乏臺臺ミ〉
逼塞薑l雲鈩
二三鬘臺臺==
≦毫篝篝〉
霞毫篝臺霊〉
蓬霊夢〉
DOG画像
スケール平滑化画像
Fig.2:DOGピラミッドの概念図 この処理をCOからk倍ずつ大きくした異なるスケール間で行い、図2に示すような複数のDOG画像を得る。 次にDOG画像から極値を検出し、特徴点とスケールを決定する。図3に示すように極値の検出にはDOG 画像3枚1組で行う。対象DOG画像の注目画素と近傍、ならびに隣接するスケール画像の注目画素と近傍 の合計26近傍を比較し、極値であった場合に特徴点候補点として検出する。曰近傍画素
鰯注目画素
0哩二三雲臺三〉
S枚1組!<毫臺臺三≧
0 スケールDOG画像 Fig.3:極値検出の流れ -3-検出された特徴点候補から主曲率とコントラストにより安定した特徴点を絞り込む。主曲率は式(4)の 特徴点候補位置での2次元へツセ行列Hから求める。
H=[髄 錨]
(4) ここで、ヘッセ行列から求められる第1固有値をα、第2固有値をβとすると、対角成分の和か(H)と行 式Der(H)は次のように計算できる。Tγ(H)=Dzz+、w=α+β(5)
比t(H)=Dzpw-(Dz‘)2=αβ(6)
さらに、α=11βとすると次の式のようになる。Tγ(H)2(α+β)2(718+β)2(γ+l)2
(7)比t(H)cUl8 ̄7182 ̄γ
この値は固有値そのものではなく、固有値α、βの比率のみで決まる。従って、固有値を求めずに主曲率を 得ることができる。この値を閾値処理を行うことで不要な特徴点を削除する。 検出した特徴点に対して第2段階の処理である特徴量の記述を行う。まず、検出された特徴点の輝度勾配 方向を求める。輝度勾配は特徴点における方向を表しており、特徴量記述の際に正規化を行うことで回転に 不変となる。特徴点の輝度勾配方向を求めるには、まず特徴点が抽出された平滑画像L(〃)の勾配強度 加(j`)と勾配方向0(〃)を以下の式により求める。”(j,j)=V77TZフアキフ7TZファ(8)
,(ガル伽-1潟(9)
棚)二全(測二全(糊(、)
求めた勾配強度m(j,j)と勾配方向0(j,j)から、重み付方向ヒストグラムを作成する。作成したヒストグ ラムから最大値となる方向を特徴点の輝度勾配方向として割り当てる。 カテゴリ分類にはSIFT特徴量をそのまま用いるのは困難なため、SIFT特徴量をベクトル量子化するこ によってkeypointをvisualwordとして捉えるBag-of-Feature[5]を求める。 2.2特徴量 画像から輝度勾配を算出し、算出された勾配強度と勾配方向をヒストグラム化する特徴量である。以下に HOG特徴量の算出方法について述べる。 次式より各ピクセルの勾配強度m(z,g)と勾配方向0(j,j)を求める。、CM)=,/7iFT玉~ファ千7;て玉-つ7丁
`CM)-伽訓幾器
脇)二fj(測二腺{)
(11) (12) (13)算出された輝度勾配画像は、セルと呼ばれるC"×C胸画素からなる小領域に分割する。それぞれの領域に
おいて輝度の勾配方向ヒストグラムを作成する。OCM/)の角をCD方向になるように量子化し、各方向に
腕(jM/)を重みとして与える。すなわち、1セルあたりc6方向の勾配方向ヒストグラムができる。最後に、
b"×6Aセルで構成されるブロックと呼ばれる領域を設定する。1セルずつ移動させながら正規化する。1セルあたりc6方向の特徴を持っているため、1ブロックあたりの特徴次元数はCJD=b"×6h×CDとなる。
あるブロックの特徴ベクトルをU、ブロック内の位置(j,〃{l≦j≦ん1≦j≦bノi}にあるセルのヒスト
グラムを/z〃としたとき、次式により正規化を行う。この処理を1セルずつ移動させながら実行する。
-4-〃が