照明変化をともなう物体認識へのサポートベクターマシンの適用

全文

(1)Vol. 44. No. SIG 5(CVIM 6). 情報処理学会論文誌：コンピュータビジョンとイメージメディア. Apr. 2003. 照明変化をともなう物体認識へのサポートベクターマシンの適用岡. 部. 孝. 弘†. 佐. 藤. 洋. 一†. 照明変化にともなう画像の変化は，照明錐（ illumination cone ）と呼ばれる，画像空間の原点を頂点とする凸錐に拘束されることが知られている．本論文では，照明変化をともなう物体認識の問題に対して，見え方に基づく手法（ appearance-based methods ）の枠組みで，照明錐を考慮した認識手法を提案する．提案手法では，交わりを持たない 2 つの照明錐が原点を通る超平面により分離されること，および，画像を正規化することで明るさの変化の影響を吸収できることから，正規化画像空間において線形識別面を用いた 2 クラス判別法を組み合わせて認識を行う．顔画像データベースを用いた評価実験を行い，提案手法の有効性，および，照明錐を分離するような線形識別面を求める 2 クラス判別法としてサポートベクターマシンが有効であることを示した．. Support Vector Machines for Object Recognition under Varying Illumination Takahiro Okabe† and Yoichi Sato† In this paper, we propose an appearance-based method for object recognition under varying illumination. It has been shown that images of an object under varying illumination lie in a convex cone formed in the image space. Accordingly, cones of two objects are separated by a hyperplane passing through the origin of the image space, provided that there is no intersection between those two cones. In addition, variations due to changes in light intensities can be canceled by normalizing images. Based on these observations, our proposed method combines two-class discriminations using a hyperplane in the normalized image space. To demonstrate the eﬀectiveness of the proposed method, we have conducted a number of experiments using the Yale Face Database B and shown that support vector machines are well suited for obtaining discriminant hyperplanes for object recognition under varying illumination.. 徴空間としてパターン認識の手法を適用するアプロー. 1. まえがき. チは，見え方に基づく手法と呼ばれる．. 物体認識には，物体姿勢，視点位置の変化と照明変. 物体姿勢および視点位置一定の条件下で照明のみが. 化の問題があるが，前者が主に幾何学的特性に依存す. 変化する場合の画像の変化は，重ね合せの原理☆が成. るのに対して，後者は主に光学的特性に依存するため，. り立つことを仮定すると，画像空間において原点を通. これらを分けて考えることができる．本論文では，照. る凸錐（ convex cone ）に拘束されることが知られて. 明変化の問題に着目し，物体姿勢および視点位置一定. おり，この凸錐は照明錐と呼ばれている3) ．ところが，. の条件下で照明のみが変化する場合の物体認識につい. 従来の見え方に基づく手法では，照明変化にともなう画像の変化が照明錐に拘束されることは十分に考慮さ. て議論する．. D 個の画素からなる画像は，全画素値を並べたベク. れていなかった．. トル，つまり，D 次元空間内の点で表現することがで. そこで本論文では，各物体に対応する照明錐が交わ. きる．本論文では，この D 次元空間を画像空間と呼. りを持たないと仮定して，見え方に基づく手法の枠組. ぶ．照明変化，姿勢変化，あるいは両方の変化をとも. みで，照明錐を考慮した認識手法を提案する．具体的. なう物体認識の問題に対して，画像空間そのものを特 ☆. † 東京大学生産技術研究所 Institute of Industrial Science, The University of Tokyo. 22. ここでいう重ね合せの原理とは，2 つの光源下で撮影された画像が，個々の光源下で撮影された画像の和で表現されるとするものである．したがって，カメラの感度特性が非線形の場合には，この仮定は成り立たない．.

(2) Vol. 44. No. SIG 5(CVIM 6). 照明変化をともなう物体認識へのサポートベクターマシンの適用. 23. には，任意の 2 つの照明錐が原点を通る線形識別面に. リック固有空間法13) ，照明変化にともなう画像の変化. より分離されること，および，画像を表すベクトルの. をフィッシャーの線形判別法で得られる部分空間で表. ノルムを正規化することで明るさの変化の影響を吸収. 現する Fisherfaces 2) などが知られている．. できることから，(D − 1) 次元正規化画像空間. 21). に. ところが，従来の見え方に基づく手法では，照明変. おいて，線形識別面を用いた 2 クラス判別を組み合わ. 化にともなう画像の変化が照明錐に拘束されることは. せて認識を行う．. 十分に考慮されていなかった．また，学習画像撮影時. 提案手法の有効性を確認するために，顔画像データ. と異なる照明条件下の画像を認識しようとする試みも. ベース Yale Face Database B 8) を用いた認識実験を. 提案されているが 21) ，見え方に基づく手法には，一般. 行った．その際に，照明錐を分離する線形識別面を求. に，学習時と同様の照明条件でなければ機能しないと. める方法として 2 つの手法を比較した．1 つはフィッ. いう欠点がある．. シャーの線形判別法. 2),6),7),11). で，パターンの分布全. 最近になって，反射モデルを仮定して少数の学. 体を考慮して識別面を決定する代表的な手法である．. 習画像から照明錐を生成して認識を行う，生成的. もう 1 つは，識別境界付近のパターンに着目するサ. 手法（ generative methods ）と呼ばれるアプローチ. 5),24). ポートベクターマシン（ SVM ）. である．SVM に. が提案された．線形部分空間法（ linear subspace. ついては，姿勢変化をともなう物体認識の問題に有効. 14),22) method ）や照明錐モデル（ illumination cone. であることが報告されている17) ．物体認識においては，一般に，本論文で議論する照明条件以外の変化も考慮しなくてはならない．照明変化に着目した提案手法の適用範囲を明確にするために，. 3),8),9) model ）に代表される認識手法は，照明条件が学習画像撮影時と大きく異なる場合でも有効であるこ. とが示されている．しかしながら，生成的手法にもいくつかの問題点. 照明変化だけでなく姿勢変化もともなう場合について. がある．光源からの 1 次反射のみを考えると，画像. の実験も行った．. は，内部反射成分，表面反射成分，attached shadow，. 本論文の構成は以下のとおりである．まず，2 章で. cast shadow の 4 つの成分で構成される22) ．ところ. 関連研究についてまとめ，本研究の特色を明示する．. が，生成的手法は Lambert モデルを仮定しているた. 次に，3 章で照明変化にともなう画像の変化について. めに，表面反射成分を生成することができない．また，. 述べ，照明錐を考慮した認識手法を提案する．4 章で. cast shadow の取扱いに原理的な問題があることも指. は，線形識別面を決定するのに用いたフィッシャーの線. 摘されており15) ，これらの成分が支配的な画像には適. 形判別法と SVM について述べる．5 章で顔画像デー. 用できないという欠点がある．. タベースを用いた実験結果を示してその考察を行い，. 6 章でまとめと今後の課題を述べる．. 2. 関連研究従来，物体認識における照明変化の問題に対しては，. 本論文では，見え方に基づく手法の枠組みで，照明錐を考慮した認識手法を提案する．提案手法は，特徴空間におけるパターンの分布に関する情報をあらかじめ利用する点で，従来の見え方に基づく手法と異なっており，認識性能の向上が期待される．さらに，副次. 特徴に基づく手法（ feature-based methods ）と見え. 的な効果として，学習画像撮影時と大きく異なる照明. 方に基づく手法の 2 つのアプローチがとられてきた．. 条件下での認識性能の向上も期待される．また，提案. 前者の特徴に基づく手法では，照明変化の影響を比. 手法は，反射モデルを仮定していない点で，生成的手. 較的受けにくいエッジやコーナーなどの特徴の抽出と. 法と異なっている．したがって，提案手法は，原理的. 照合により認識を行う．しかし，特徴がつねに安定し. には，Lambert モデルの仮定が成り立たないような. て抽出できるとは限らないうえに，ローカルな情報を. 物体にも適用できるという利点がある．. 利用するため，識別に有効な情報を損失する可能性もある4) ．. 3. 提案手法. 全体のグローバルな情報，つまり，画像の全画素値を. 3.1 照明錐物体姿勢および視点位置一定の条件下で，照明のみ. 入力としてパターン認識の手法を適用する．代表的な. が変化する場合の画像の変化について述べる．D 個の. これに対して後者の見え方に基づく手法では，画像. ものとして，主成分分析により画像を圧縮する固有顔 23) （ eigenfaces ），照明や姿勢の変化にともなう画像の. 変化を固有空間内の低次元多様体で表現するパラメト. 画素からなる画像を，全画素値をラスタースキャンして並べた D 次元ベクトル. で表現する．ある物体. が任意照明下でとり得る画像集合を C とし，その物.

(3) 24. Apr. 2003. 情報処理学会論文誌：コンピュータビジョンとイメージメディア. 体を任意の 2 つの照明下で撮影した画像を各々. (∈ C) とすると，重ね合せの原理は， + ∈C. ，. 2. (1) が成り立つことを意味する．式 (1) より，任意の s ≥ 0 について 1. . s. 2. 1. ∈C. discriminant hyperplane. 1. normalized image space. (2). IC1. P. かつ，任意の 0 ≤ t ≤ 1 について. . . IC2. t 1 + (1 − t) 2 ∈ C (3) が成り立つことから，C は画像空間において原点を頂点とする凸錐になり，これは照明錐と呼ばれている3) ．反射特性が Lambert モデルで記述される凸物体の照明錐の次元は，物体表面の互いに異なる法線ベクト. O. image space. 図 1 提案手法の概念図 Fig. 1 A sketch of the proposed method.. ルの数に等しいことが知られているが 3) ，実画像を用いた実験から，その体積の大部分は低次元部分空間に. わりを持たないことを仮定すると，照明錐が原点を. 集中していることが示唆されていた10) ．最近になっ. 頂点とする凸錐であることから，任意の 2 つの照明錐. て，球面調和関数を用いた周波数空間での理論的解析. IC1，IC2 は，画像空間の原点を通る超平面により分離. からも，4 次元から 9 次元程度の低次元部分空間で. ．一方，個々の照明錐が交わりを持たなされる（図 1 ）. 照明錐を近似できることが示されている1),19) ．また，. いとしても，ある照明錐と他のすべての照明錐が線形. Torrance-Sparrow モデルなどで表現される表面反射. 分離可能である保証はない．したがって，重ね合せの. 成分についても，物体表面が粗い場合には，比較的低. 原理および照明錐が交わりを持たないことを仮定した. 次元の部分空間で照明錐を近似できることが示されて. 場合の照明変化をともなう物体認識問題は，D 次元画. いる. 18). ．したがって，各物体に対応する照明錐が，た. 像空間において原点を通る線形識別面（図 1 では直線. を持たないことが期待され，仮に交わりを持ったとし. OP ）を用いた 2 クラス判別問題の組合せに帰着する．これを正規化画像空間で見ると，照明錐の正規化画像空間（超平面）による断面が凸集合になることから，. ても，その体積はきわめて小さいことが期待される．. 任意の 2 つの照明錐の断面は正規化画像空間における. とえば数千次元の画像空間内の低次元部分空間に独立に分布していると仮定すると，個々の照明錐は交わり. 3.2 輝度の正規化. 線形識別面（図 1 では点 P ）により分離される．した. 式 (1) は，すべての光源の輝度が定数倍になったと. がって，照明変化をともなう物体認識問題は，(D − 1). きに，画像を表すベクトルのノルムもまた定数倍にな. 次元正規化画像空間において線形識別面を用いた 2 ク. ることを意味している．このベクトルのノルムは照明. ラス判別問題の組合せに帰着する．. の明るさと物体表面の反射率の積で決まるため，たと. 3.1 節で述べたように，低次元部分空間で表現され. えば，照明の明るさが一定で方向のみが変化する場合. る照明錐は交わりを持たないことが期待される．そこ. の物体認識では，ノルムの持つ反射率の情報が有効に. で本論文では，各物体に対応する照明錐が交わりを持. なる可能性がある．しかしながら，任意照明下の物体. たないと仮定し，(D − 1) 次元正規化画像空間におい. 認識，つまり，照明の明るさもまた変化するような場. て線形識別面を用いた 2 クラス判別を組み合わせて認. 合には，画像を正規化して明るさの変化の影響を吸収. 識を行う．一方，低次元部分空間で表現できない照明錐は交. することが考えられる．本論文では，L1 ノルムによる正規化. ˜ = 1 . T. わりを持つ場合がある．反射特性が鏡面反射（ mirror. (4). を採用する．ここで 1 はすべての要素が 1 の D 次元. reflection ）モデルで記述される凸物体の照明錐は，低次元部分空間で表現できないことが示されている18) ．このとき，各画素に対応する物体表面について視線方. ベクトルである．この正規化で定義される (D − 1) 次. 向が正反射方向となるような方向に任意の光源を置く. 元超平面は正規化画像空間と呼ばれ，平均操作に関し. ことで，任意の画像を生成できることから，この物体. て閉じているという特長がある21) ．. 3.3 照明錐を考慮した認識手法重ね合せの原理および各物体に対応する照明錐が交. の照明錐と他の物体の照明錐が交わりを持つことが分かる．したがって，反射特性が鏡面反射モデルで記述されるような物体は，提案手法の適用対象外である．.

(4) Vol. 44. No. SIG 5(CVIM 6). 25. 照明変化をともなう物体認識へのサポートベクターマシンの適用. なお，照明錐が交わりを持つ場合の物体認識では，同一の画像を作る照明条件の尤もらしさを反映した非線形識別面が有効になる可能性がある．. 4. 2 クラス判別法 i. 前章で述べたように，重ね合せの原理および照明錐が交わりを持たないことを仮定した場合の照明変化を. discriminant hyperplane. ともなう物体認識問題は，(D − 1) 次元正規化画像空間において線形識別面を用いた 2 クラス判別問題の組 feature space. 合せに帰着する．本論文では，2 クラス判別法として，. 図 2 マージンと識別面 Fig. 2 The margin and the discriminant hyperplane.. パターンの分布全体を考慮するフィッシャーの線形判別法と識別境界付近のパターンに着目する SVM を比. は，パターンがどのように分布していても 1/2 以上. 較する．. 4.1 準備 2 つのクラス A，B のいずれかに属するパターンを. で表現し，線形識別関数を (5) とする．ここでは重みベクトル，b はバイアス項 d 次元特徴空間内の点 f( ) = T + b. の確率で線形識別面が得られることが知られている．次章の実験で用いる学習パターンの数は，画像空間の次元数と比べてはるかに小さい．そこで実験では，主成分分析により d 次元の特徴空間を d 次元に圧縮したのち，フィッシャーの線形判別法を適用した．圧縮. と呼ばれるパラメータである．各パターンは，f が正. 後の次元は，予備実験から，d = ([l/2 − 1] − 1) と. ならば A，負ならば B に識別されるものとする．し. した☆ ．また，バイアス項は b = −. たがって，f ( ) = 0 の超平面が識別面となる．また，. とした．. 学習パターン . (i = 1, 2, · · ·, l) の属するクラスをラ. i. ベル yi (i = 1, 2, · · ·, l) で表現し，その値は A に属する場合は 1，B に属する場合は −1 とする．. 4.2 フィッシャーの線形判別法. ，. 各クラスの学習パターンの平均を. A. B. . . − )( − . (. i ∈A. i. A. i. A). . i. +b T. = 0 に対する各学習パターン (i = 1, 2, · · ·, l) のマージンを γi =. + b) ||||. yi (. T. i. (10). と定義する．超平面により i 番目の学習パターンが. (. i. B. i. B. T. た，γi のうち最小のものを γ とし，学習パターン集合に対する超平面のマージンと呼ぶ．SVM は，学習. (6). i ∈B. SB. B )/2. 値はパターンを表す点と超平面との距離に等しい．ま. T. − )( − ) , = ( − )( − ) .. +. A. 正しく識別されている場合には γi > 0 となり，その. 定義する．. SW =. T. 4.3 サポートベクターマシン超平面. とし，. クラス内変動 SW ，クラス間変動 SB を以下のように. ( + . A. B. A. B. T. (7). フィッシャーの線形判別法は，クラス内変動・クラス間変動比. パターンを完全に分離する超平面のうち，学習パターン集合に対するマージン γ を最大にする超平面を識．別面とする（図 2 ）パラメータ. ，b を定数倍しても表現する超平面は. 同じであるという冗長性を取り除くために，. SS (8) を最大にする方向にパターンを射影し，この 1 次. という制約条件を加えると，マージン γ の最大化は. 元軸上でバイアス項 b により識別を行う．評価関数. 以下のように定式化される．. T. J( ) =. . T. min |. B. i=1,···,l. W. + b| = 1 T. i. , . T minimize subject to yi (. J( ) の最大化は固有値問題に帰着し，その解は −1 = SW ( A − B) (9). . T. i. (11). + b) ≥ 1, (i = 1, 2, · · ·, l). (12). となることが知られている．ところが，d ≥ l，つまり，特徴空間の次元数が学習パターンの数以上の場合，SW は正則ではないため解は一意に決まらない．また，d ≥ (l/2 − 1) のときに. ☆. [ ] はガウスの記号で，x を実数，n を整数とするとき，n ≤ x < n + 1 ならば [x] = n である．.

(5) 26. Apr. 2003. 情報処理学会論文誌：コンピュータビジョンとイメージメディア. この制約条件付きの最適化問題は，ラグランジュ乗数 αi (≥ 0) を用いて，以下に示すラグランジアンの鞍点を求める問題に置き換えることができる．. . L( , b, ) =. 1 2. l . − T. +b)−1}.. αi {yi (. i=1. T. i. (13) 鞍点において L の勾配が 0 になることから，. −. ∂L = ∂. l . yi αi. i=1. . i. = 0,. 図 3 10 名の正面顔画像 Fig. 3 Cropped images of ten individuals with frontal pose.. (14). ∂L yi αi = 0, =− ∂b l. (15). i=1. が得られる．これらを式 (13) に代入して整理すると，. Lが. に関して鞍点で最大値をとることから，SVM. Subset1 12. Subset2 25. Subset3 50. Subset4 77. Subset5 77. 図 4 照明変化にともなう画像の変化 Fig. 4 Variability due to illumination.. の学習は二次計画問題 l . maximize. i=1 l . subject to. αi −. l 1 yi yj αi αj 2 i,j=1. , T i. j. であることが知られている12) ．. 5.1 顔画像データベース. yi αi = 0,. 利用したデータベースは，10 名の顔を，9 つの姿勢. i=1. αi ≥ 0, (i = 1, 2, · · ·, l). (16). に帰着する．したがって，局所解の問題は存在せずに，最適化計算によって識別面が決定される．また，最適解は相補性条件. . αi {yi (. T. i. 違いによる画像の変化よりも大きくなる場合が多いために，照明変化をともなう認識はきわめて困難な問題. + b) − 1} = 0, (i = 1, 2, · · · , l) (17). を満たさなくてはならないことが知られている．これは，式 (11) より，識別面に最も近い学習パターンに対. で，64 方向の光源および環境光の下で撮影した 5,850 枚の画像からなり，正面方向を向いている画像については両目と口の 2 次元座標が，それ以外の姿勢の画像についてはおおまかな顔中心の 2 次元座標が与えられている．また，各画像は，光源方向とカメラの光軸のなす角度 θ に基づいて，5 つの部分集合のいずれかに分類されている．. 5.2 節および 5.3 節の実験では，正面方向を向いて. してのみ αi = 0 となることを示している．式 (14) よ. いる 650 枚の画像を用い，5.4 節の実験では，カメラ. り，識別面は，サポートベクトルと呼ばれる識別面に. の光軸から約 12 度の方向を向いた 5 つの姿勢の画像. 最も近い学習パターンのみで決定されることが分かる．. 3,250 枚を用いた．実験では，顔の位置などの違いが. SVM では，識別器の性能はサポートベクトルの数. 認識結果に与える影響を避けるために，両目の座標ま. によって特徴づけられる．その結果，学習パターン数. たは顔中心の座標が等しくなるように顔付近を切り出. に比べて特徴空間の次元数が大きい場合でも高い汎化. した 64 × 64 の解像度の画像を用いた．その際に，環. 能力を持つことが期待される．SVM が高次元特徴空. 境光の影響を取り除くために，環境光の下で撮影した. 間においても有効であることを予備実験で確認し，次. 画像との差分をとった．図 3 に，実験に用いた 10 名. 章の実験では次元の削減を行わずに SVM を適用した．. の正面顔画像の例を示す．また，図 4 に示す各部分集. 5. 実験結果照明錐を考慮した認識手法の有効性，および，照明錐を分離する線形識別面を求める手法としてフィッ. 合に属する画像の例から，光源方向に依存して画像が大きく変化しているのを確認することができる．. 5.2 光源方向の外挿以下に示す 4 つの手法を用いた認識実験を行った．. るかを確認するために，顔画像データベース Yale Face. • 最近傍決定則（ NN ） • 固有顔（ EF ）. Database B 8) を利用した認識実験を行った．顔画像については，照明変化にともなう画像の変化が個人の. • フィッシャーの線形判別法（ FLD ） • サポートベクターマシン（ SVM ）. シャーの線形判別法と SVM のどちらがより有効であ.

(6) Vol. 44. No. SIG 5(CVIM 6). 表 1 誤識別率（ % ）：光源方向の外挿 Table 1 Error rates (%): extrapolation of illumination direction.. Method NN-1 NN-2 EF-1 EF-2 FLD-1 FLD-2 SVM-1 SVM-2. Dimension 4096 4095 4096 → 5 4095 → 5 4096 → 5 4095 → 5 4096 4095. 2 5.1 0 25.4 7.6 4.2 0 2.5 0. 27. 照明変化をともなう物体認識へのサポートベクターマシンの適用. 3 50.8 7.6 72.9 47.5 37.3 13.6 22.9 0. 4 81.2 56.5 84.8 73.2 71.7 60.9 75.4 36.2. 5 85.2 77.2 86.2 78.8 85.7 88.9 87.3 88.4. 表 2 誤識別率（ % ）：光源方向の内挿 Table 2 Error rates (%): interpolation of illumination direction.. Method NN-1 NN-2 EF-1 EF-2 FLD-1 FLD-2 SVM-1 SVM-2. Dimension 4096 4095 4096 → 24 4095 → 24 4096 → 24 4095 → 24 4096 4095. 2 5.1 0 6.8 18.6 1.7 5.1 0.8 0. 3 44.9 8.5 55.1 67.8 15.3 23.7 11.0 0. 4 16.7 13.8 32.6 51.4 17.4 40.6 8.0 4.3. 固有顔では，([l/2 − 1] − 1) 次元に圧縮した特徴空間において，最近傍決定則を用いて識別した．フィッシャーの線形判別法と SVM における 2 クラス判別の組合せ方法としては，トーナメント方式でテストパ. Pose1. Pose2. Pose3. Pose4. Pose5. 図 5 姿勢変化にともなう画像の変化 Fig. 5 Variability due to pose.. ターンの属するクラスを決定する one against one と呼ばれる手法を採用した．また，SVM についてはライブラリ20) を利用した．以上の 4 つの手法について，. 画像をテスト画像とした，光源方向の内挿に関する実. 4,096 (= 64 × 64) 個の全画素値を特徴とした場合と正規化画像の全画素値を特徴とした場合の 2 通り，合. た SVM が有効であることを確認することができる．. 計 8 通りの実験を行った．. しかしながら，光源方向の外挿の場合と異なり，EF. ．この場合にも，照明錐を考慮し験結果を示す（表 2 ）. 表 1 に，各人物の学習画像として部分集合 1 に属. と FLD において，正規化画像を特徴とすることで誤. する 7 枚を用い，部分集合 2 から 5 までの画像をテ. 識別率が上昇している．実験で用いた画像は明るさが. スト画像とした，光源方向の外挿に関する実験結果を. ほぼ一定で方向のみが異なる光源下で撮影されている. 示す．ここで各手法に付けられた番号は，1 が画像の. ため，画像を表すベクトルのノルムは顔表面の反射率. 全画素値を特徴とし，2 が正規化画像の全画素値を特. を反映している．したがって，次元の圧縮によりノル. 徴として用いたことを示す．したがって，FLD-2 と. ムの差が強調され，認識に有効に働いた可能性がある．. SVM-2 が，照明錐を考慮した認識手法である．まず，全体的な傾向として，部分集合 5 に対する誤. 5.4 姿勢変化をともなう認識前節までは，物体姿勢および視点位置一定の条件下. 識別率は，いずれの手法でもランダムに識別したとき. で，照明のみが変化する場合の物体認識について議. の誤識別率（ 90% ）に近く，見え方に基づくこれらの. 論してきた．本節では，照明変化だけでなく姿勢変化. 手法が破綻していることが分かる．次に，FLD-1 と. もともなう場合についての実験を行い考察する．具体. FLD-2 および SVM-1 と SVM-2 を比較すると，正. 的には，各人物の学習画像およびテスト画像として，. 規化画像を特徴とすることで，認識性能が大幅に改. 図 5 に示す 5 つの姿勢の画像を用い，光源方向の外. 善されていることを確認することができる．これは，. 挿および内挿に関する実験を行った．. FLD-2 と SVM-2 が照明錐を考慮しているのに対して，FLD-1 と SVM-1 では，照明錐を反映した画像空. 各姿勢についての照明変化が照明錐で表現されること. 照明と姿勢の両方の変化により生じる画像集合は，. 間の原点を通る線形識別面が得られるとは限らないた. から，複数の照明錐の和集合で表現される．したがっ. めであると考えられる．また，SVM-2 は，FLD-2 や. て，この画像集合は画像空間において原点を頂点とす. 他の手法よりも優れている．以上のことから，照明方. る錐になるが，凸であるとは限らない．また，姿勢一. 向の外挿に関して，照明錐を考慮した認識手法が有効. 定の場合と比較して，各物体に対応する画像集合が交. であり，照明錐を分離するような線形識別面を求める. わりを持つ確率が高くなる．ゆえに，正規化画像空間. 手法として，SVM がより効果的であるといえる．. において線形識別面を用いる認識手法が有効である保. 5.3 光源方向の内挿次に，各人物の学習画像として部分集合 1 と部分集合 5 に属する 26 枚を用い，部分集合 2 から 4 までの. 証はない．光源方向の外挿および内挿に関する実験結果を表 3，表 4 に示す．FLD-1 と FLD-2 および SVM-1 と SVM-.

(7) 28. Apr. 2003. 情報処理学会論文誌：コンピュータビジョンとイメージメディア. 表 3 誤識別率（ % ）：5 姿勢，光源方向の外挿 Table 3 Error rates (%): 5 poses, extrapolation of illumination direction.. の有効性，および，照明錐を分離するような線形識別. Method NN-1 NN-2 EF-1 EF-2 FLD-1 FLD-2 SVM-1 SVM-2. 変化だけでなく姿勢変化もともなう場合についての実. Dimension 4096 4095 4096 → 33 4095 → 33 4096 → 33 4095 → 33 4096 4095. 2 3.5 0 4.0 0 0 0 0.7 0. 3 34.3 11.2 39.5 20.0 14.8 7.3 19.5 3.3. 4 74.8 60.1 76.8 64.1 61.0 53.2 63.3 41.2. 5 87.7 75.9 88.5 81.5 80.7 81.9 89.5 71.7. 面を求める手法として，フィッシャーの線形判別法よりも SVM が有効であることを示した．さらに，照明験も行い，照明錐を考慮した SVM による認識が優れているという結果を得た．本論文では顔画像データベースを用いた評価実験を行ったが，顔のように Lambert モデルの仮定が比較的よくあてはまる場合には，生成的手法がより有効であることが報告されている16) ．一方，Lambert モデルの仮定が成り立たないような物体の認識には，生成. 表 4 誤識別率（ % ）：5 姿勢，光源方向の内挿 Table 4 Error rates (%): 5 poses, interpolation of illumination direction.. Method NN-1 NN-2 EF-1 EF-2 FLD-1 FLD-2 SVM-1 SVM-2. Dimension 4096 4095 4096 → 128 4095 → 128 4096 → 128 4095 → 128 4096 4095. 2 3.5 0 3.8 0.2 3.0 0.5 2.3 0. 3 32.2 14.5 34.5 27.8 21.5 2.5 15.7 0.5. 4 13.2 15.1 17.4 22.0 12.8 8.7 14.5 4.2. 的手法を適用することはできない．提案手法は，反射モデルを仮定していないため，原理的には，Lambert モデルの仮定が成り立たない場合にも適用できる．今後，Lambert モデルの仮定が成り立たない物体に対する提案手法の有効性を検証したい．謝辞本研究では，顔画像データベース Yale Face. Database B 8) ，および，SVM のライブラリ20) を利用した．本研究の一部は，文部科学省科学研究費補助（ 2）「人間の意図・行動解析に基金特定領域研究（ C ）づく柔軟なヒューマン・マシン・インタラクションの実現」（課題番号：13224051 ）の助成により行われた．. 2 を比較すると，線形識別面を仮定した場合には，画像空間の原点を通るとは限らない線形識別面を用いるよりも，照明変化と姿勢変化により生じる画像集合が錐であることを考慮して，正規化画像空間において線形識別面を求めた方が効果的であることを確認することができる．さらに，SVM-2 が最も優れており，予想に反して，照明のみが変化する場合に匹敵する認識性能を示していることが分かる．これは，顔の反射特性が Lambert モデルで近似できることに起因していると考えられる．すなわち，照明錐が低次元部分空間で表現されるために，複数の照明錐の和集合で表現される照明変化と姿勢変化により生じる画像集合もまた比較的低次元の部分空間で表現され，高次元の画像空間において線形分離可能であることが期待されるからであると考えられる．. 6. むすび照明変化をともなう物体認識の問題に対して，見え方に基づく手法の枠組みで，照明錐を考慮した認識手法を提案した．提案手法では，重ね合せの原理および照明錐が交わりを持たないことを仮定して，正規化画像空間において線形識別面を用いた 2 クラス判別を組み合わせて認識を行った．また，顔画像データベースを用いた認識実験を行い，照明錐を考慮した提案手法. 最後に，有益なご意見をいただいた査読者の方々に感謝いたします．. 参考. 文. 献. 1) Basri, R. and Jacobs, D.: Lambertian reflectance and linear subspaces, Proc. IEEE ICCV 2001, pp.383–390 (2001). 2) Belhumeur, P.N., Hespanha, J.P. and Kriegman, D.J.: Eigenfaces vs. Fisherfaces: recognition using class specific linear projection, IEEE Trans. PAMI, Vol.19, No.7, pp.711– 720 (1997). 3) Belhumeur, P.N. and Kriegman, D.J.: What is the set of images of an object under all possible lighting conditions?, Int. J. Computer Vision, Vol.28, No.3, pp.245–260 (1998). 4) Brunelli, R. and Poggio, T.: Face recognition: features versus templates, IEEE Trans. PAMI, Vol.15, No.10, pp.1042–1052 (1993). 5) Cristianini, N. and Shawe-Taylor, J.: An introduction to support vector machine and other kernel-based learning methods, Cambridge University Press (2000). 6) Duda, R.O., Hart, P.E. and Stork, D.G.: Pattern Classification 2nd edition, John Wiley & Sons, New York (2001). 7) Fisher, R.A.: The use of multiple measure-.

(8) Vol. 44. No. SIG 5(CVIM 6). 照明変化をともなう物体認識へのサポートベクターマシンの適用. ments in taxonomic problems, Ann. Eugenics, 7, pp.179–188 (1936). 8) Georghiades, A.S., Belhumeur, P.N. and Kriegman, D.J.: From few to many: illumination cone models for face recognition under variable lighting and pose, IEEE Trans. PAMI, Vol.23, No.6, pp.643–660 (2001). 9) Georghiades, A.S., Kriegman, D.J. and Belhumeur, P.N.: Illumination cones for recognition under variable lighting: faces, Proc. IEEE CVPR ’98, pp.52–58 (1998). 10) Hallinan, P.W.: A low-dimensional representation of human faces for arbitrary lighting conditions, Proc. IEEE CVPR ’94, pp.995–999 (1994). 11) 石井健一郎，上田修功，前田英作，村瀬洋：わかりやすいパターン認識，オーム社 (1998). 12) Moses, Y., Adini, Y. and Ullman, S.: Face recognition: the problem of compensating for changes in illumination direction, Proc. ECCV ’94, pp.286–296 (1994). 13) Murase, H. and Nayar, S.K.: Visual learning and recognition of 3-D objects from appearance, Int. J. Computer Vision, 14, pp.5–24 (1995). 14) Nayar, S.K. and Murase, H.: Dimensionality of illumination manifolds in eigenspace, CUCS021-94, Technical Report, Department of Computer Science, Columbia University, New York (1994). 15) 岡部孝弘，佐藤洋一：キャストシャドウ存在下の照明錐モデルに関する考察，情報処理学会研究報告，CVIM 2002-131-20, pp.141–148 (2002). 16) 岡部孝弘，佐藤洋一：画像の線形化に基づく物体認識，画像の認識・理解シンポジウム（ MIRU ）論文集，I, pp.453–460 (2002). 17) Pontil, M. and Verri, A.: Support vector machines for 3D object recognition, IEEE Trans. PAMI, Vol.20, No.6, pp.637–646 (1998). 18) Ramamoorthi, R. and Hanrahan, P.: A signalprocessing framework for inverse rendering, Proc. ACM SIGGRAPH 2001, pp.117–128 (2001). 19) Ramamoorthi, R. and Hanrahan, P.: On the relationship between radiance and irradiance: determining the illumination from images of a convex Lambertian object, J. Opt. Soc. Am. A, Vol.18, No.10, pp.2448–2459 (2001). 20) Saunders, C., Stitson, M.O., Weston, J., Bottou, L., Schoelkopf, B. and Smola, A.: Support vector machine reference manual, Technical Report CSD-TR-98-03, Department of. 29. Computer Science, Royal Holloway, University of London, Egham, UK (1998). 21) Shakunaga, T. and Shigenari, K.: Decomposed eigenface for face recognition under various lighting conditions, Proc. IEEE CVPR 2001, 1, pp.864–871 (2001). 22) Shashua, A.: Geometry and photometry in 3D visual recognition, Ph.D. thesis, MIT (1992). 23) Turk, M.A. and Pentland, A.P.: Face recognition using eigenfaces, Proc. IEEE CVPR ’91, pp.586–591 (1991). 24) Vapnik, V.: Statistical learning theory, John Wiley & Sons, New York (1998). (平成 14 年 7 月 10 日受付) (平成 15 年 1 月 16 日採録) （担当編集委員. 鷲見和彦）岡部孝弘（正会員）. 1997 年東京大学理学部物理学科卒業．1999 年同大学院理学系研究科物理学専攻修士課程修了．2000 年同大学院理学系研究科物理学専攻博士課程中退．2001 年より東京大学生産技術研究所技官．コンピュータビジョン，コンピュータグラフィックスに関する研究に従事．電子情報通信学会会員．佐藤洋一（正会員）. 1990 年東京大学工学部機械工学科卒業．同大学院情報工学専攻を経て，1991 年よりカーネギーメロン大学計算機科学部ロボティクス学科博士課程に在籍．1997 年 Ph.D. in Robotics 修了．同年より東京大学生産技術研究所研究機関研究員，講師を経て，現在同研究所助教授．コンピュータビジョン，ヒューマン・コンピュータ・インタラクション，およびコンピュータグラフィックスに関する研究に従事．平成 11 年山下記念研究賞，Int’l Conf.. Shape Modeling and Applications ’97 最優秀論文賞， MIRU2000 最優秀論文賞，平成 11 年度日本バーチャルリアリティ学会論文誌論文賞，IEEE VR2001 Hon-. orable Mention for the Outstanding Paper Award 受賞．電子情報通信学会，日本バーチャルリアリティ学会，ACM，IEEE 各会員．.

(9)