照明変化をともなう物体認識へのサポートベクターマシンの適用
全文
(2) Vol. 44. No. SIG 5(CVIM 6). 照明変化をともなう物体認識へのサポートベクターマシンの適用. 23. には,任意の 2 つの照明錐が原点を通る線形識別面に. リック固有空間法13) ,照明変化にともなう画像の変化. より分離されること,および,画像を表すベクトルの. をフィッシャーの線形判別法で得られる部分空間で表. ノルムを正規化することで明るさの変化の影響を吸収. 現する Fisherfaces 2) などが知られている.. できることから,(D − 1) 次元正規化画像空間. 21). に. ところが,従来の見え方に基づく手法では,照明変. おいて,線形識別面を用いた 2 クラス判別を組み合わ. 化にともなう画像の変化が照明錐に拘束されることは. せて認識を行う.. 十分に考慮されていなかった.また,学習画像撮影時. 提案手法の有効性を確認するために,顔画像データ. と異なる照明条件下の画像を認識しようとする試みも. ベース Yale Face Database B 8) を用いた認識実験を. 提案されているが 21) ,見え方に基づく手法には,一般. 行った.その際に,照明錐を分離する線形識別面を求. に,学習時と同様の照明条件でなければ機能しないと. める方法として 2 つの手法を比較した.1 つはフィッ. いう欠点がある.. シャーの線形判別法. 2),6),7),11). で,パターンの分布全. 最近に なって ,反射モデ ル を 仮定し て 少数の 学. 体を考慮して識別面を決定する代表的な手法である.. 習画像から 照明錐を 生成し て 認識を 行 う,生成的. もう 1 つは,識別境界付近のパターンに着目するサ. 手法( generative methods )と呼ばれるアプ ローチ. 5),24). ポートベクターマシン( SVM ). である.SVM に. が 提案され た .線形部分空間法( linear subspace. ついては,姿勢変化をともなう物体認識の問題に有効. 14),22) method ) や照明錐モデル( illumination cone. であることが報告されている17) . 物体認識においては,一般に,本論文で議論する照 明条件以外の変化も考慮しなくてはならない.照明変 化に着目した提案手法の適用範囲を明確にするために,. 3),8),9) model ) に代表される認識手法は,照明条件が 学習画像撮影時と大きく異なる場合でも有効であるこ. とが示されている. しかしながら,生成的手法にもいくつかの問題点. 照明変化だけでなく姿勢変化もともなう場合について. がある.光源からの 1 次反射のみを考えると,画像. の実験も行った.. は,内部反射成分,表面反射成分,attached shadow,. 本論文の構成は以下のとおりである.まず,2 章で. cast shadow の 4 つの成分で構成される22) .ところ. 関連研究についてまとめ,本研究の特色を明示する.. が,生成的手法は Lambert モデルを仮定しているた. 次に,3 章で照明変化にともなう画像の変化について. めに,表面反射成分を生成することができない.また,. 述べ,照明錐を考慮した認識手法を提案する.4 章で. cast shadow の取扱いに原理的な問題があることも指. は,線形識別面を決定するのに用いたフィッシャーの線. 摘されており15) ,これらの成分が支配的な画像には適. 形判別法と SVM について述べる.5 章で顔画像デー. 用できないという欠点がある.. タベースを用いた実験結果を示してその考察を行い,. 6 章でまとめと今後の課題を述べる.. 2. 関 連 研 究 従来,物体認識における照明変化の問題に対しては,. 本論文では,見え方に基づく手法の枠組みで,照明 錐を考慮した認識手法を提案する.提案手法は,特徴 空間におけるパターンの分布に関する情報をあらかじ め利用する点で,従来の見え方に基づく手法と異なっ ており,認識性能の向上が期待される.さらに,副次. 特徴に基づく手法( feature-based methods )と見え. 的な効果として,学習画像撮影時と大きく異なる照明. 方に基づく手法の 2 つのアプローチがとられてきた.. 条件下での認識性能の向上も期待される.また,提案. 前者の特徴に基づく手法では,照明変化の影響を比. 手法は,反射モデルを仮定していない点で,生成的手. 較的受けにくいエッジやコーナーなどの特徴の抽出と. 法と異なっている.したがって,提案手法は,原理的. 照合により認識を行う.しかし,特徴がつねに安定し. には,Lambert モデルの仮定が成り立たないような. て抽出できるとは限らないうえに,ローカルな情報を. 物体にも適用できるという利点がある.. 利用するため,識別に有効な情報を損失する可能性も ある4) .. 3. 提 案 手 法. 全体のグローバルな情報,つまり,画像の全画素値を. 3.1 照 明 錐 物体姿勢および視点位置一定の条件下で,照明のみ. 入力としてパターン認識の手法を適用する.代表的な. が変化する場合の画像の変化について述べる.D 個の. これに対して後者の見え方に基づく手法では,画像. ものとして,主成分分析により画像を圧縮する固有顔 23) ( eigenfaces ) ,照明や姿勢の変化にともなう画像の. 変化を固有空間内の低次元多様体で表現するパラメト. 画素からなる画像を,全画素値をラスタースキャンし て並べた D 次元ベクトル. で表現する.ある物体. が任意照明下でとり得る画像集合を C とし ,その物.
(3) 24. Apr. 2003. 情報処理学会論文誌:コンピュータビジョンとイメージ メデ ィア. 体を任意の 2 つの照明下で撮影した画像を各々. (∈ C) とすると,重ね合せの原理は, + ∈C. ,. 2. (1) が成り立つことを意味する.式 (1) より,任意の s ≥ 0 について 1. . s. 2. 1. ∈C. discriminant hyperplane. 1. normalized image space. (2). IC1. P. かつ,任意の 0 ≤ t ≤ 1 について. . . IC2. t 1 + (1 − t) 2 ∈ C (3) が成り立つことから,C は画像空間において原点を頂 点とする凸錐になり,これは照明錐と呼ばれている3) . 反射特性が Lambert モデルで記述される凸物体の 照明錐の次元は,物体表面の互いに異なる法線ベクト. O. image space. 図 1 提案手法の概念図 Fig. 1 A sketch of the proposed method.. ルの数に等しいことが知られているが 3) ,実画像を用 いた実験から,その体積の大部分は低次元部分空間に. わりを持たないことを仮定すると,照明錐が原点を. 集中していることが示唆されていた10) .最近になっ. 頂点とする凸錐であることから,任意の 2 つの照明錐. て,球面調和関数を用いた周波数空間での理論的解析. IC1,IC2 は,画像空間の原点を通る超平面により分離. からも,4 次元から 9 次元程度の低次元部分空間で. .一方,個々の照明錐が交わりを持たな される(図 1 ). 照明錐を近似できることが示されている1),19) .また,. いとしても,ある照明錐と他のすべての照明錐が線形. Torrance-Sparrow モデルなどで表現される表面反射. 分離可能である保証はない.したがって,重ね合せの. 成分についても,物体表面が粗い場合には,比較的低. 原理および照明錐が交わりを持たないことを仮定した. 次元の部分空間で照明錐を近似できることが示されて. 場合の照明変化をともなう物体認識問題は,D 次元画. いる. 18). .したがって,各物体に対応する照明錐が,た. 像空間において原点を通る線形識別面(図 1 では直線. を持たないことが期待され,仮に交わりを持ったとし. OP )を用いた 2 クラス判別問題の組合せに帰着する. これを正規化画像空間で見ると,照明錐の正規化画 像空間(超平面)による断面が凸集合になることから,. ても,その体積はきわめて小さいことが期待される.. 任意の 2 つの照明錐の断面は正規化画像空間における. とえば数千次元の画像空間内の低次元部分空間に独立 に分布していると仮定すると,個々の照明錐は交わり. 3.2 輝度の正規化. 線形識別面(図 1 では点 P )により分離される.した. 式 (1) は,すべての光源の輝度が定数倍になったと. がって,照明変化をともなう物体認識問題は,(D − 1). きに,画像を表すベクトルのノルムもまた定数倍にな. 次元正規化画像空間において線形識別面を用いた 2 ク. ることを意味している.このベクトルのノルムは照明. ラス判別問題の組合せに帰着する.. の明るさと物体表面の反射率の積で決まるため,たと. 3.1 節で述べたように,低次元部分空間で表現され. えば,照明の明るさが一定で方向のみが変化する場合. る照明錐は交わりを持たないことが期待される.そこ. の物体認識では,ノルムの持つ反射率の情報が有効に. で本論文では,各物体に対応する照明錐が交わりを持. なる可能性がある.しかしながら,任意照明下の物体. たないと仮定し,(D − 1) 次元正規化画像空間におい. 認識,つまり,照明の明るさもまた変化するような場. て線形識別面を用いた 2 クラス判別を組み合わせて認. 合には,画像を正規化して明るさの変化の影響を吸収. 識を行う. 一方,低次元部分空間で表現できない照明錐は交. することが考えられる. 本論文では,L1 ノルムによる正規化. ˜ = 1 . T. わりを持つ場合がある.反射特性が鏡面反射( mirror. (4). を採用する.ここで 1 はすべての要素が 1 の D 次元. reflection )モデルで記述される凸物体の照明錐は,低 次元部分空間で表現できないことが示されている18) . このとき,各画素に対応する物体表面について視線方. ベクトルである.この正規化で定義される (D − 1) 次. 向が正反射方向となるような方向に任意の光源を置く. 元超平面は正規化画像空間と呼ばれ,平均操作に関し. ことで,任意の画像を生成できることから,この物体. て閉じているという特長がある21) .. 3.3 照明錐を考慮した認識手法 重ね合せの原理および各物体に対応する照明錐が交. の照明錐と他の物体の照明錐が交わりを持つことが分 かる.したがって,反射特性が鏡面反射モデルで記述 されるような物体は,提案手法の適用対象外である..
(4) Vol. 44. No. SIG 5(CVIM 6). 25. 照明変化をともなう物体認識へのサポートベクターマシンの適用. なお,照明錐が交わりを持つ場合の物体認識では,同 一の画像を作る照明条件の尤もらしさを反映した非線 形識別面が有効になる可能性がある.. 4. 2 クラス判別法 i. 前章で述べたように,重ね合せの原理および照明錐 が交わりを持たないことを仮定した場合の照明変化を. discriminant hyperplane. ともなう物体認識問題は,(D − 1) 次元正規化画像空 間において線形識別面を用いた 2 クラス判別問題の組 feature space. 合せに帰着する.本論文では,2 クラス判別法として,. 図 2 マージンと識別面 Fig. 2 The margin and the discriminant hyperplane.. パターンの分布全体を考慮するフィッシャーの線形判 別法と識別境界付近のパターンに着目する SVM を比. は,パターンがど のように分布していても 1/2 以上. 較する.. 4.1 準 備 2 つのクラス A,B のいずれかに属するパターンを. で表現し,線形識別関数を (5) とする.ここで は重みベクトル,b はバイアス項 d 次元特徴空間内の点 f( ) = T + b. の確率で線形識別面が得られることが知られている. 次章の実験で用いる学習パターンの数は,画像空間の 次元数と比べてはるかに小さい.そこで実験では,主 成分分析により d 次元の特徴空間を d 次元に圧縮し たのち,フィッシャーの線形判別法を適用した.圧縮. と呼ばれるパラメータである.各パターンは,f が正. 後の次元は,予備実験から,d = ([l/2 − 1] − 1) と. ならば A,負ならば B に識別されるものとする.し. した☆ .また,バイアス項は b = −. たがって,f ( ) = 0 の超平面が識別面となる.また,. とした.. 学習パターン . (i = 1, 2, · · ·, l) の属するクラスをラ. i. ベル yi (i = 1, 2, · · ·, l) で表現し,その値は A に属す る場合は 1,B に属する場合は −1 とする.. 4.2 フィッシャーの線形判別法. ,. 各クラスの学習パターンの平均を. A. B. . . − )( − . (. i ∈A. i. A. i. A). . i. +b T. = 0 に対する各学習パターン (i = 1, 2, · · ·, l) のマージンを γi =. + b) ||||. yi (. T. i. (10). と定義する.超平面により i 番目の学習パターンが. (. i. B. i. B. T. た,γi のうち最小のものを γ とし,学習パターン集 合に対する超平面のマージンと呼ぶ.SVM は,学習. (6). i ∈B. SB. B )/2. 値はパターンを表す点と超平面との距離に等しい.ま. T. − )( − ) , = ( − )( − ) .. +. A. 正しく識別されている場合には γi > 0 となり,その. 定義する.. SW =. T. 4.3 サポート ベクターマシン 超平面. とし,. クラス内変動 SW ,クラス間変動 SB を以下のように. ( + . A. B. A. B. T. (7). フィッシャーの線形判別法は,クラス内変動・クラ ス間変動比. パターンを完全に分離する超平面のうち,学習パター ン集合に対するマージン γ を最大にする超平面を識 . 別面とする( 図 2 ) パラメータ. ,b を定数倍しても表現する超平面は. 同じであるという冗長性を取り除くために,. SS (8) を最大にする方向 にパターンを射影し,この 1 次. という制約条件を加えると,マージン γ の最大化は. 元軸上でバイアス項 b により識別を行う.評価関数. 以下のように定式化される.. T. J( ) =. . T. min |. B. i=1,···,l. W. + b| = 1 T. i. , . T minimize subject to yi (. J( ) の最大化は固有値問題に帰着し,その解は −1 = SW ( A − B) (9). . T. i. (11). + b) ≥ 1, (i = 1, 2, · · ·, l). (12). となることが知られている. ところが,d ≥ l,つまり,特徴空間の次元数が学習 パターンの数以上の場合,SW は正則ではないため解 は一意に決まらない.また,d ≥ (l/2 − 1) のときに. ☆. [ ] はガウスの記号で,x を実数,n を整数とするとき,n ≤ x < n + 1 ならば [x] = n である..
(5) 26. Apr. 2003. 情報処理学会論文誌:コンピュータビジョンとイメージ メデ ィア. この制約条件付きの最適化問題は,ラグランジュ乗 数 αi (≥ 0) を用いて,以下に示すラグランジアンの 鞍点を求める問題に置き換えることができる.. . L( , b, ) =. 1 2. l . − T. +b)−1}.. αi {yi (. i=1. T. i. (13) 鞍点において L の勾配が 0 になることから,. −. ∂L = ∂. l . yi αi. i=1. . i. = 0,. 図 3 10 名の正面顔画像 Fig. 3 Cropped images of ten individuals with frontal pose.. (14). ∂L yi αi = 0, =− ∂b l. (15). i=1. が得られる.これらを式 (13) に代入して整理すると,. Lが. に関して鞍点で最大値をとることから,SVM. Subset1 12. Subset2 25. Subset3 50. Subset4 77. Subset5 77. 図 4 照明変化にともなう画像の変化 Fig. 4 Variability due to illumination.. の学習は二次計画問題 l . maximize. i=1 l . subject to. αi −. l 1 yi yj αi αj 2 i,j=1. , T i. j. であることが知られている12) .. 5.1 顔画像データベース. yi αi = 0,. 利用したデータベースは,10 名の顔を,9 つの姿勢. i=1. αi ≥ 0, (i = 1, 2, · · ·, l). (16). に帰着する.したがって,局所解の問題は存在せずに, 最適化計算によって識別面が決定される. また,最適解は相補性条件. . αi {yi (. T. i. 違いによる画像の変化よりも大きくなる場合が多いた めに,照明変化をともなう認識はきわめて困難な問題. + b) − 1} = 0, (i = 1, 2, · · · , l) (17). を満たさなくてはならないことが知られている.これ は,式 (11) より,識別面に最も近い学習パターンに対. で,64 方向の光源および環境光の下で撮影した 5,850 枚の画像からなり,正面方向を向いている画像につい ては両目と口の 2 次元座標が,それ以外の姿勢の画像 についてはおおまかな顔中心の 2 次元座標が与えられ ている.また,各画像は,光源方向とカメラの光軸の なす角度 θ に基づいて,5 つの部分集合のいずれかに 分類されている.. 5.2 節および 5.3 節の実験では,正面方向を向いて. してのみ αi = 0 となることを示している.式 (14) よ. いる 650 枚の画像を用い,5.4 節の実験では,カメラ. り,識別面は,サポートベクトルと呼ばれる識別面に. の光軸から約 12 度の方向を向いた 5 つの姿勢の画像. 最も近い学習パターンのみで決定されることが分かる.. 3,250 枚を用いた.実験では,顔の位置などの違いが. SVM では,識別器の性能はサポートベクトルの数. 認識結果に与える影響を避けるために,両目の座標ま. によって特徴づけられる.その結果,学習パターン数. たは顔中心の座標が等しくなるように顔付近を切り出. に比べて特徴空間の次元数が大きい場合でも高い汎化. した 64 × 64 の解像度の画像を用いた.その際に,環. 能力を持つことが期待される.SVM が高次元特徴空. 境光の影響を取り除くために,環境光の下で撮影した. 間においても有効であることを予備実験で確認し,次. 画像との差分をとった.図 3 に,実験に用いた 10 名. 章の実験では次元の削減を行わずに SVM を適用した.. の正面顔画像の例を示す.また,図 4 に示す各部分集. 5. 実 験 結 果 照明錐を考慮し た認識手法の有効性,および ,照 明錐を分離する線形識別面を求める手法としてフィッ. 合に属する画像の例から,光源方向に依存して画像が 大きく変化しているのを確認することができる.. 5.2 光源方向の外挿 以下に示す 4 つの手法を用いた認識実験を行った.. るかを確認するために,顔画像データベース Yale Face. • 最近傍決定則( NN ) • 固有顔( EF ). Database B 8) を利用した認識実験を行った.顔画像 については,照明変化にともなう画像の変化が個人の. • フィッシャーの線形判別法( FLD ) • サポートベクターマシン( SVM ). シャーの線形判別法と SVM のどちらがより有効であ.
(6) Vol. 44. No. SIG 5(CVIM 6). 表 1 誤識別率( % ) :光源方向の外挿 Table 1 Error rates (%): extrapolation of illumination direction.. Method NN-1 NN-2 EF-1 EF-2 FLD-1 FLD-2 SVM-1 SVM-2. Dimension 4096 4095 4096 → 5 4095 → 5 4096 → 5 4095 → 5 4096 4095. 2 5.1 0 25.4 7.6 4.2 0 2.5 0. 27. 照明変化をともなう物体認識へのサポートベクターマシンの適用. 3 50.8 7.6 72.9 47.5 37.3 13.6 22.9 0. 4 81.2 56.5 84.8 73.2 71.7 60.9 75.4 36.2. 5 85.2 77.2 86.2 78.8 85.7 88.9 87.3 88.4. 表 2 誤識別率( % ) :光源方向の内挿 Table 2 Error rates (%): interpolation of illumination direction.. Method NN-1 NN-2 EF-1 EF-2 FLD-1 FLD-2 SVM-1 SVM-2. Dimension 4096 4095 4096 → 24 4095 → 24 4096 → 24 4095 → 24 4096 4095. 2 5.1 0 6.8 18.6 1.7 5.1 0.8 0. 3 44.9 8.5 55.1 67.8 15.3 23.7 11.0 0. 4 16.7 13.8 32.6 51.4 17.4 40.6 8.0 4.3. 固有顔では,([l/2 − 1] − 1) 次元に圧縮した特徴空 間において,最近傍決定則を用いて識別した.フィッ シャーの線形判別法と SVM における 2 クラス判別 の組合せ方法としては,トーナメント方式でテストパ. Pose1. Pose2. Pose3. Pose4. Pose5. 図 5 姿勢変化にともなう画像の変化 Fig. 5 Variability due to pose.. ターンの属するクラスを決定する one against one と 呼ばれる手法を採用した.また,SVM についてはラ イブラリ20) を利用した.以上の 4 つの手法について,. 画像をテスト画像とした,光源方向の内挿に関する実. 4,096 (= 64 × 64) 個の全画素値を特徴とした場合と 正規化画像の全画素値を特徴とした場合の 2 通り,合. た SVM が有効であることを確認することができる.. 計 8 通りの実験を行った.. しかしながら,光源方向の外挿の場合と異なり,EF. .この場合にも,照明錐を考慮し 験結果を示す(表 2 ). 表 1 に,各人物の学習画像として部分集合 1 に属. と FLD において,正規化画像を特徴とすることで誤. する 7 枚を用い,部分集合 2 から 5 までの画像をテ. 識別率が上昇している.実験で用いた画像は明るさが. スト画像とした,光源方向の外挿に関する実験結果を. ほぼ一定で方向のみが異なる光源下で撮影されている. 示す.ここで各手法に付けられた番号は,1 が画像の. ため,画像を表すベクトルのノルムは顔表面の反射率. 全画素値を特徴とし,2 が正規化画像の全画素値を特. を反映している.したがって,次元の圧縮によりノル. 徴として用いたことを示す.したがって,FLD-2 と. ムの差が強調され,認識に有効に働いた可能性がある.. SVM-2 が,照明錐を考慮した認識手法である. まず,全体的な傾向として,部分集合 5 に対する誤. 5.4 姿勢変化をともなう認識 前節までは,物体姿勢および視点位置一定の条件下. 識別率は,いずれの手法でもランダムに識別したとき. で,照明のみが変化する場合の物体認識について議. の誤識別率( 90% )に近く,見え方に基づくこれらの. 論してきた.本節では,照明変化だけでなく姿勢変化. 手法が破綻していることが分かる.次に,FLD-1 と. もともなう場合についての実験を行い考察する.具体. FLD-2 および SVM-1 と SVM-2 を比較すると,正. 的には,各人物の学習画像およびテスト画像として,. 規化画像を特徴とすることで,認識性能が大幅に改. 図 5 に示す 5 つの姿勢の画像を用い,光源方向の外. 善されていることを確認することができる.これは,. 挿および内挿に関する実験を行った.. FLD-2 と SVM-2 が照明錐を考慮しているのに対し て,FLD-1 と SVM-1 では,照明錐を反映した画像空. 各姿勢についての照明変化が照明錐で表現されること. 照明と姿勢の両方の変化により生じる画像集合は,. 間の原点を通る線形識別面が得られるとは限らないた. から,複数の照明錐の和集合で表現される.したがっ. めであると考えられる.また,SVM-2 は,FLD-2 や. て,この画像集合は画像空間において原点を頂点とす. 他の手法よりも優れている.以上のことから,照明方. る錐になるが,凸であるとは限らない.また,姿勢一. 向の外挿に関して,照明錐を考慮した認識手法が有効. 定の場合と比較して,各物体に対応する画像集合が交. であり,照明錐を分離するような線形識別面を求める. わりを持つ確率が高くなる.ゆえに,正規化画像空間. 手法として,SVM がより効果的であるといえる.. において線形識別面を用いる認識手法が有効である保. 5.3 光源方向の内挿 次に,各人物の学習画像として部分集合 1 と部分集 合 5 に属する 26 枚を用い,部分集合 2 から 4 までの. 証はない. 光源方向の外挿および内挿に関する実験結果を表 3, 表 4 に示す.FLD-1 と FLD-2 および SVM-1 と SVM-.
(7) 28. Apr. 2003. 情報処理学会論文誌:コンピュータビジョンとイメージ メデ ィア. 表 3 誤識別率( % ) :5 姿勢,光源方向の外挿 Table 3 Error rates (%): 5 poses, extrapolation of illumination direction.. の有効性,および,照明錐を分離するような線形識別. Method NN-1 NN-2 EF-1 EF-2 FLD-1 FLD-2 SVM-1 SVM-2. 変化だけでなく姿勢変化もともなう場合についての実. Dimension 4096 4095 4096 → 33 4095 → 33 4096 → 33 4095 → 33 4096 4095. 2 3.5 0 4.0 0 0 0 0.7 0. 3 34.3 11.2 39.5 20.0 14.8 7.3 19.5 3.3. 4 74.8 60.1 76.8 64.1 61.0 53.2 63.3 41.2. 5 87.7 75.9 88.5 81.5 80.7 81.9 89.5 71.7. 面を求める手法として,フィッシャーの線形判別法よ りも SVM が有効であることを示した.さらに,照明 験も行い,照明錐を考慮した SVM による認識が優れ ているという結果を得た. 本論文では顔画像データベースを用いた評価実験を 行ったが,顔のように Lambert モデルの仮定が比較 的よくあてはまる場合には,生成的手法がより有効で あることが報告されている16) .一方,Lambert モデ ルの仮定が成り立たないような物体の認識には,生成. 表 4 誤識別率( % ) :5 姿勢,光源方向の内挿 Table 4 Error rates (%): 5 poses, interpolation of illumination direction.. Method NN-1 NN-2 EF-1 EF-2 FLD-1 FLD-2 SVM-1 SVM-2. Dimension 4096 4095 4096 → 128 4095 → 128 4096 → 128 4095 → 128 4096 4095. 2 3.5 0 3.8 0.2 3.0 0.5 2.3 0. 3 32.2 14.5 34.5 27.8 21.5 2.5 15.7 0.5. 4 13.2 15.1 17.4 22.0 12.8 8.7 14.5 4.2. 的手法を適用することはできない.提案手法は,反射 モデルを仮定していないため,原理的には,Lambert モデルの仮定が成り立たない場合にも適用できる.今 後,Lambert モデルの仮定が成り立たない物体に対 する提案手法の有効性を検証したい. 謝辞 本研究では,顔画像データベース Yale Face. Database B 8) ,および,SVM のライブラリ20) を利 用した.本研究の一部は,文部科学省科学研究費補助 ( 2) 「人間の意図・行動解析に基 金特定領域研究( C ) づく柔軟なヒューマン・マシン・インタラクションの 実現」 (課題番号:13224051 )の助成により行われた.. 2 を比較すると,線形識別面を仮定した場合には,画 像空間の原点を通るとは限らない線形識別面を用いる よりも,照明変化と姿勢変化により生じる画像集合が 錐であることを考慮して,正規化画像空間において線 形識別面を求めた方が効果的であることを確認するこ とができる.さらに,SVM-2 が最も優れており,予 想に反して,照明のみが変化する場合に匹敵する認識 性能を示していることが分かる.これは,顔の反射特 性が Lambert モデルで近似できることに起因してい ると考えられる.すなわち,照明錐が低次元部分空間 で表現されるために,複数の照明錐の和集合で表現さ れる照明変化と姿勢変化により生じる画像集合もまた 比較的低次元の部分空間で表現され,高次元の画像空 間において線形分離可能であることが期待されるから であると考えられる.. 6. む す び 照明変化をともなう物体認識の問題に対して,見え 方に基づく手法の枠組みで,照明錐を考慮した認識手 法を提案した.提案手法では,重ね合せの原理および 照明錐が交わりを持たないことを仮定して,正規化画 像空間において線形識別面を用いた 2 クラス判別を組 み合わせて認識を行った.また,顔画像データベース を用いた認識実験を行い,照明錐を考慮した提案手法. 最後に,有益なご意見をいただいた査読者の方々に感 謝いたします.. 参 考. 文. 献. 1) Basri, R. and Jacobs, D.: Lambertian reflectance and linear subspaces, Proc. IEEE ICCV 2001, pp.383–390 (2001). 2) Belhumeur, P.N., Hespanha, J.P. and Kriegman, D.J.: Eigenfaces vs. Fisherfaces: recognition using class specific linear projection, IEEE Trans. PAMI, Vol.19, No.7, pp.711– 720 (1997). 3) Belhumeur, P.N. and Kriegman, D.J.: What is the set of images of an object under all possible lighting conditions?, Int. J. Computer Vision, Vol.28, No.3, pp.245–260 (1998). 4) Brunelli, R. and Poggio, T.: Face recognition: features versus templates, IEEE Trans. PAMI, Vol.15, No.10, pp.1042–1052 (1993). 5) Cristianini, N. and Shawe-Taylor, J.: An introduction to support vector machine and other kernel-based learning methods, Cambridge University Press (2000). 6) Duda, R.O., Hart, P.E. and Stork, D.G.: Pattern Classification 2nd edition, John Wiley & Sons, New York (2001). 7) Fisher, R.A.: The use of multiple measure-.
(8) Vol. 44. No. SIG 5(CVIM 6). 照明変化をともなう物体認識へのサポートベクターマシンの適用. ments in taxonomic problems, Ann. Eugenics, 7, pp.179–188 (1936). 8) Georghiades, A.S., Belhumeur, P.N. and Kriegman, D.J.: From few to many: illumination cone models for face recognition under variable lighting and pose, IEEE Trans. PAMI, Vol.23, No.6, pp.643–660 (2001). 9) Georghiades, A.S., Kriegman, D.J. and Belhumeur, P.N.: Illumination cones for recognition under variable lighting: faces, Proc. IEEE CVPR ’98, pp.52–58 (1998). 10) Hallinan, P.W.: A low-dimensional representation of human faces for arbitrary lighting conditions, Proc. IEEE CVPR ’94, pp.995–999 (1994). 11) 石井健一郎,上田修功,前田英作,村瀬 洋: わかりやすいパターン認識,オーム社 (1998). 12) Moses, Y., Adini, Y. and Ullman, S.: Face recognition: the problem of compensating for changes in illumination direction, Proc. ECCV ’94, pp.286–296 (1994). 13) Murase, H. and Nayar, S.K.: Visual learning and recognition of 3-D objects from appearance, Int. J. Computer Vision, 14, pp.5–24 (1995). 14) Nayar, S.K. and Murase, H.: Dimensionality of illumination manifolds in eigenspace, CUCS021-94, Technical Report, Department of Computer Science, Columbia University, New York (1994). 15) 岡部孝弘,佐藤洋一:キャストシャド ウ存在下 の照明錐モデルに関する考察,情報処理学会研究 報告,CVIM 2002-131-20, pp.141–148 (2002). 16) 岡部孝弘,佐藤洋一:画像の線形化に基づく物 体認識,画像の認識・理解シンポジウム( MIRU ) 論文集,I, pp.453–460 (2002). 17) Pontil, M. and Verri, A.: Support vector machines for 3D object recognition, IEEE Trans. PAMI, Vol.20, No.6, pp.637–646 (1998). 18) Ramamoorthi, R. and Hanrahan, P.: A signalprocessing framework for inverse rendering, Proc. ACM SIGGRAPH 2001, pp.117–128 (2001). 19) Ramamoorthi, R. and Hanrahan, P.: On the relationship between radiance and irradiance: determining the illumination from images of a convex Lambertian object, J. Opt. Soc. Am. A, Vol.18, No.10, pp.2448–2459 (2001). 20) Saunders, C., Stitson, M.O., Weston, J., Bottou, L., Schoelkopf, B. and Smola, A.: Support vector machine reference manual, Technical Report CSD-TR-98-03, Department of. 29. Computer Science, Royal Holloway, University of London, Egham, UK (1998). 21) Shakunaga, T. and Shigenari, K.: Decomposed eigenface for face recognition under various lighting conditions, Proc. IEEE CVPR 2001, 1, pp.864–871 (2001). 22) Shashua, A.: Geometry and photometry in 3D visual recognition, Ph.D. thesis, MIT (1992). 23) Turk, M.A. and Pentland, A.P.: Face recognition using eigenfaces, Proc. IEEE CVPR ’91, pp.586–591 (1991). 24) Vapnik, V.: Statistical learning theory, John Wiley & Sons, New York (1998). (平成 14 年 7 月 10 日受付) (平成 15 年 1 月 16 日採録) ( 担当編集委員. 鷲見 和彦) 岡部 孝弘( 正会員). 1997 年東京大学理学部物理学科卒 業.1999 年同大学院理学系研究科物 理学専攻修士課程修了.2000 年同大 学院理学系研究科物理学専攻博士課 程中退.2001 年より東京大学生産 技術研究所技官.コンピュータビジョン,コンピュー タグラフィックスに関する研究に従事.電子情報通信 学会会員. 佐藤 洋一( 正会員). 1990 年東京大学工学部機械工学 科卒業.同大学院情報工学専攻を経 て,1991 年よりカーネギーメロン 大学計算機科学部ロボティクス学科 博士課程に在籍.1997 年 Ph.D. in Robotics 修了.同年より東京大学生産技術研究所研究 機関研究員,講師を経て,現在同研究所助教授.コン ピュータビジョン,ヒューマン・コンピュータ・インタ ラクション,およびコンピュータグラフィックスに関す る研究に従事.平成 11 年山下記念研究賞,Int’l Conf.. Shape Modeling and Applications ’97 最優秀論文賞, MIRU2000 最優秀論文賞,平成 11 年度日本バーチャ ルリアリティ学会論文誌論文賞,IEEE VR2001 Hon-. orable Mention for the Outstanding Paper Award 受賞.電子情報通信学会,日本バーチャルリアリティ 学会,ACM,IEEE 各会員..
(9)
図
関連したドキュメント
We proposed an additive Schwarz method based on an overlapping domain decomposition for total variation minimization.. Contrary to the existing work [10], we showed that our method
In section 3 all mathematical notations are stated and global in time existence results are established in the two following cases: the confined case with sharp-diffuse
Keywords: continuous time random walk, Brownian motion, collision time, skew Young tableaux, tandem queue.. AMS 2000 Subject Classification: Primary:
To derive a weak formulation of (1.1)–(1.8), we first assume that the functions v, p, θ and c are a classical solution of our problem. 33]) and substitute the Neumann boundary
After briefly summarizing basic notation, we present the convergence analysis of the modified Levenberg-Marquardt method in Section 2: Section 2.1 is devoted to its well-posedness
We use operator-valued Fourier multipliers to obtain character- izations for well-posedness of a large class of degenerate integro-differential equations of second order in time
We study the classical invariant theory of the B´ ezoutiant R(A, B) of a pair of binary forms A, B.. We also describe a ‘generic reduc- tion formula’ which recovers B from R(A, B)
We study the theory of representations of a 2-group G in Baez-Crans 2- vector spaces over a field k of arbitrary characteristic, and the corresponding 2-vector spaces of