自己組織化マップによる顔画像変化の特徴抽出に関する基礎的研究

(1)

生体医工学 40-4, 214/221 (2002)

研究

自己組織化マツプによる顔画像変化の

特徴抽出に関する基礎的研究＊

加藤

綾子＊＊・福井

康裕＊＊

1. ま

え

が

き

近年, セキュリティシステムやマンマシンインター

フェースなどの分野で, 顔から得られる情報への関心

が高まっている1∼5).

顔に関する研究は, 個人識別,

表情認識, 表情合成など多岐にわたっており, 顔の捉

え方においても2次元画像を用いるものから3次元計

測やモデルを用いるものまで多種多様な手法が提案さ

れている6∼15).

どの手法においても, 顔から得られる

情報は膨大であり, その膨大な情報の中から, 如何に

して必要な情報を取り出すかが重要な課題となってい

る.

本研究では顔画像の変化から動的な表情認識を行う

ことを目指しており, 顔画像1枚に含まれる情報をで

きるだけ単純化した記号で表現し, その記号の変化を

解析することにより表情認識を行うことを目標として

いる. 本稿では顔画像1枚に含まれる情報をできるだ

け単純化すること, すなわち顔画像の特徴抽出を目的

とした.

顔全体の画像からその顔の特徴を記述する場合, 従

来から行われている予め着目した特徴量, 例えば目や

口の大きさ (水平方向の長さ, 垂直方向の長さなど)

や, 着目点の移動距離・移動方向などを画像から計測

し, その特徴量を用いて表情を認識する方法で

は16,17),

着目する特徴量によっては表情認識にとって

重要な情報を落としてしまう可能性がある.

一方, 画像を比較する方法として目や口の代表的な

形状画像 (テンプレート) を予めいくつか選んでお

き, 目や口の画像がどの画像に類似しているのかを判

断するようなテンプレートマッチングを考えた場合,

基本となるテンプレートをどのように作成するのかが

課題となる.

そこで, 本研究では, 代表となるテンプレートの自

動的な作成と作成されたテンプレートを利用した顔画

像の特徴抽出について検討した. そして, この二つの機能をニューラルネットワークの一つである自己組織化マップを用いて実現した. 自己組織化マップは, バツクプロパゲーションやLVQといった教師つきの学習手法と異なり, 個人の様々な表情画像を入力するだけで自動的にクラスタリングシステムの構築が行え, これを用いることで画像の特徴抽出が可能となる. 本研究では表情認識を前提としているため, 顔画像中から眉, 目, 口などの表情の特徴が表れる個所を選択した. 2. 方法 2・1 自己組織化マップによる画像の分類自己組織化マップは, Kohonen により提案されたニューラルネットワークであり, 入力されるデータセットの持つ特徴を出力層にマッピングすることを可能とする18). この能力は, 学習により獲得される. 学習においては, 教師を必要とせず, データセットの特徴を自動的に分類できる. 自己組織化マップの構造は入力層と出力層からなる二層構造の階層型ニューラルネットワークである. 第 1図に一般的な自己組織化マップの構造を示す. 入力層はデータ層としてデータを入力する部分である. 出力層はマップ層として働き, 入力されたデータは出力層に並ぶニューロンの一つにマッピングされる. 具体的には, あるデータが入力されると, 入力されたデータに対応するただ一つのニューロンが発火する. 出力層の個々のニューロンは入力層の全てのニューロンと固有の結合荷重 (ω11∼ωnm) を持って結合されている. 一つの出力層のニューロンに着目すると, ω1i ∼ωniまでの結合荷重をn次元のベクトルと考えることができる. また, 入力層に入力されるデータ(α ∼αn) もn次元のベクトルと考えることができる. この結合荷重ベクトルと入力されたデータベクトルとが最も近いニューロンが発火するニューロン(勝ちニューロン)となる. 本研究では, 画像の持つ特徴をマッピングする自己組織化マップを構築し, 画像の特徴＊2002年5月28日受付, 2002年10月30日改訂＊＊東京電機大学理工学部電子情報工学科

(2)

加藤綾子・福井康裕: 自己組織化マップによる顔画像変化の特徴抽出 (215) 抽出を行う. 本研究で構築する自己組織化マップの構造と動作の様子を第2図に示す, 入力層のニューロンへは, 画像各画素の輝度値を入力する. このため, 入力層のニューロンは2次元状に配置されており, 縦と横のニューロン数は入力画像の縦と横の画素数と一致する. 出力層のニューロン数は, 画像を分類するカテゴリー数となる. この自己組織化マップにデータを入力した場合の動作は次のようになる. まず, 特徴抽出したい対象画像を自己組織化マップに入力する. 入力する画像は予め 256階調のグレ-スケール画像にしておくため, 入力される各画素の輝度値は0から255の値となる. ここで, η個の画素から成る入力画像を各画素の輝度値 (a1∼an)を要素としたベクトルxで表す. また, j 番目の入力層のニューロンから出力層のi番目のニューロンへの結合荷重をwjiとした場合の, 入力層の全てのニューロンから出力層のi番目のニューロンへの結合荷重 (w1i∼wni) を要素としたベクトルを勘とする. x=(α1, α2, …αn) (1) wi=(w1i, w2i,…wni) (2) 入力画像xを入力した場合の勝ちニューロンは, x とwiとのユークリッド距離dEが最小となるニューロンである.

dE(x, wi)

=√a1-w1i)2+(a2-w2i)2+…+(an-wmo)2

(3)

2・2 自己組織化マップの学習自己組織化マップの学習は様々な画像を入力することにより行われる. 自己組織化マップの学習において, 入力された画像の分類は自動的に行われ, 出力層にマップが形成される. 第1図自己組織化マップの概要 Fig. 1 The outline of a self-organizing map.

input data

x=(a1, a2, an)

feature of ith neuron wi=(W1i, w2i, …, wni)

W1=(W11, W21, …, wn1) W2=(W12, W22, …, Wn2)

Wm=(W1m, W2m, …, Wnm)

input layer output layer

第2図自己組織化マップの構造と動作

Fig. 2 Self-organizing map configuration and analytical process.

input image input layer output layer

input image input layer

(3)

-21-(216) 生体医工学第40巻第4号 (2002年12月) 画像xを入力した場合に勝ちニューロンとなるニューロンの番号をiとすると, 勝ちニューロンiの結合荷重ベクトルwiと, 勝ちニューロンiの近傍に配置されたニューロンの結合荷重ベクトルwi-1、, wi+1 などは, xに近づくように修正される. 勝ちニューロンと共に修正を行う近傍のニューロンは, 学習の進度に応じて徐々に減少させた(第3図). 例えば, 第3 図中に示したN=4の場合には, 勝ちニューロンを中心として, 両側4個以内のニューロンの結合荷重ベクトルが修正される.

wi(k+1)=wi(k)+hi(k)(x(k)-wi(k))

(4)

(4)式においてhiは勝ちニューロンiに対する学習

率係数であり, どの程度の強さで修正を行うかという

指標である. 本研究では学習率係数hを学習回数と

勝ちニューロンからの距離の関数とした. まず, 勝ち

ニューロンの学習率係数hiは学習回数kに応じて

徐々に減少するように規定した(第4図(a)).

そし

て, 近傍のニューロン, 例えぼ勝ちニューロンiから

d個分だけ離れたニューロンi±dの学習率係数hi±d

は, 勝ちニューロンの学習率係数hiを基準として勝

ちニューロンからの距離dに

応じて徐々に減少させ

た(第4図(b)).

学習開始時の勝ちニューロンの近傍集合の大きさ

(Nstart),

学習終了時の近傍集合の大きさ(Nend), 学

習開始時の学習率係数(histart), 学習終了時の学習

率係数(hiend)を

調整することにより, 学習が大局

的な方向付けから始まり, 微調整を経て終了するもの

となる. 各定数は, 数回の学習結果を基に, 経験的に

決定した.

2・3 画像の前処理

撮影された映像から自己組織化マップに入力するま

での処理を第5図に示す. まず, 30フレーム/秒でキ

ャプチャを行い, 動画像から連続的な静止画像に変換

する. 次に, 顔画像中から特徴的な部位である眉や目

や口の範囲を選択する. 本方法では, 入力した画素の

輝度値の並びが, そのまま画像の持つ特徴として計算

され, 分類が行われるため, 撮影された映像から切り

出す眉, 目, 口を顔の動きに合わせて一定の位置に保

つ必要がある. そこで, 第5図に示すような画像処理

を経て, 自動的に選択されるようにした. まず, 画像

の粗さやノイズを取り除くために画像全体に平滑化フ

ィルタをかけて平滑化する. 次に, ラプラシアンフィ

ルタを用いてエッジを強調後, エッジの抽出を行い,

眉, 目, 口のように, エッジによって囲まれる個所を

検索する. 最初のフレームでは検索された個所のう

ち, どの個所が目なのか, どの個所が口なのかなどを

手動で選択する (ラベル付け). 第2フレーム目以降

は, エッジで囲まれた全ての個所のうち, 1フレーム

前にラベル付けされた個所に最も近いものをその部位

として選択する. 次に, 目として選択された2箇所の

重心点を計算し, この2点を結ぶ線を想定する. この

線が水平になるように画像全体を回転させた後, 各特

徴部位の重心点を中心とした矩形画像を切り取る(第

6図). 以上の処理により, 各特徴部位を矩形に切り

取られた, 様々な特徴部分画像を得る.

次に, 輝度値調整を行って, 画像の明暗の差を軽減

する. 自己組織化マップへは画像の輝度値を入力する

第3図近傍集合の設定

Fig. 3 Definition of the neighborhood set.

ex. neighborhood

N=4

the number of

learning iteration k

第4図結合荷重の学習率係数の設定 Fig. 4 Definition of the renewal rate of the weights.

(a) the time function

(4)

加藤綾子・福井康裕: 自己組織化マップによる顔画像変化の特徴抽出 (217)

ため, 口や目の形状が類似した画像を入力しても, 照

明条件や顔の向きの影響で, 画像全体の輝度値が異な

っていると, 異なった特徴抽出結果になる場合が生じ

てくる. そこで, 照明条件や顔の向きなどの違いによ

る明るさのばらつきの影響を次の方法で軽減した.

画像中から基準となる画素を複数個所選び, その画

素の平均輝度値が一定になるように, 画像全体の画素

の輝度値を調節する. 基準とした画素を第7図に示

す. 目の画像については画像の上端と下端の5画素幅

の帯状部分, 口の画像については画像上端両端の5画

素四方の部分と画像下端中央の5画素四方の部分とした. 最後に, 眉・目・口の形状に合わせて, 矩形の画像から, 第8図に示すマスクパターンを用いて, 周辺画素を取り除く. 以上の手順で作成された画像を, 自己組織化マップの入力層に入力することにより, 自己組織化マップの学習や画像の分類を行う. 3. 実験 3・1 撮影表情認識を前提として表情の撮影を行い, 撮影された顔画像を用いて本手法の検証を行った. 表情の撮影は成人男性6名に対して行った. 撮影にはデジタルビデオカメラ(SHARP: VL-MX1 Pro) を用いた. 被験者には椅子に着座した状態で被験者の正面少し下方に設置したカメラを見てもらい, 被験者の顔のほぼ正面から撮影した. このとき, 照明は室内の蛍光燈のみを使用した. また, 様々な表情を撮影するため, 被験者には Ekumanらによって提唱されている6基本表情(喜び, 怒り, 悲しみ, 嫌悪, 恐れ, 驚き)19)を第5図入力画像の作成 Fig. 5 Making input images.

a

_b

c

d

e

f

第6図角度補正と切り出し Fig. 6 Angle revision and clipping.

第7図輝度値調節における参照セル Fig. 7 Reference cells for the brightness regulation

process.

第8図マスクパターン Fig. 8 Masking patterns.

(5)

-23-(218) 生体医工学第40巻第4号 (2002年12月) 演技してもらった. 無表情からある一つの表情に変化するまでの数秒間を1回の撮影として, 6種類の表情を3回ずつ撮影した. 3・2 自己組織化マップの学習条件自己組織化マップの学習に用いた画像は, 撮影データの中から, ランダムに抽出した800枚の画像である. 個人ごとに眉・目・口の各部位に対応した3種類の自己組織化マップを作成した. 自己組織化マップの学習条件を第1表に示す. 4. 結果 4・1 自己組織化マップの学習結果学習の結果, 獲得された自己組織化マップを第9図に示す. 図中の番号は, 出力層におけるニューロンの配置位置を示し, 画像はそのニューロンが良く反応する画像を示している. 眉のマップにおいては, 形状全体の変化量が小さいため, 見た目には隣接した画像の差は明確ではないが, 全体としてマップの片端から反対側の端に向かって画像が徐々に変化している. 目と口のマップでは, 片端から徐々に形状が変化しており, 目や口の形状によって分類が行われるマップが形成されている. 形状変化について見てみると, 第9図の口のマップでは, 1番のニューロンから17番まで順に口が閉じる方向に変化し, 18番から20番では, 歯が見える場合の口になっている. 第1表学習条件

Table 1 Parameters for the learning process.

第9図提案手法による自己組織化マップの学習結果 Fig. 9 The self-organizing maps using the proposed learning method.

(a) eyebrow

(b) eye

(c) mouth

第10図端のニューロンからのユークリッド距離 Fig. 10 The Euclid distance from the lst neuron.

(6)

-24-加藤綾子・福井康裕: 自己組織化マップによる顔画像変化の特徴抽出 (219) 第10図は, 1番目のニューロンが持つ結合荷重ベクトルとi番目のニューロンが持つ結合荷重ベクトルとのユークリッド距離を示す(口のマップ). 横軸はニューロン番号, 縦軸は距離を表す. 第9図のマップでは, 1番目のニューロンから反応する形状の変化と共にユークリッド距離も長くなっているが, 直線的には増加していない. 4・2 部位画像の特徴抽出による表情変化の把握学習された自己組織化マップを用いて, 表情変化を撮影した画像のうち, 形状変化がはっきりしている口と目の画像に対して分類を行った結果の例を第11図と第12図に示す. 入力した表情画像は, ニュートラルの表情から喜びの表情を演技した場合の画像を時間順に並べたものである. 図中のグラフの縦軸は勝ちニューロン番号, 横軸はフレーム番号を表す. グラフの上側の画像は, 破線で示したフレームにおける入力画像を示している. また, グラフの下側の画像は, 破線で示したフレームでの勝ちニュ-ロンがどのような画像に反応するニューロンなのかを示している. 勝ちニューロンとなったニューロンが反応する画像と入力した画像とを比較してみると, 両画像は視覚的に類似しており, 特徴部位画像を勝ちニューロンの番号として代表させても良いことがわかった. また, 入力画像列で何かしらの変化(表情変化)が起きていることを, 勝ちニューロン番号の変化として捉えることが可能であった. ここでは, 被験者一人分のデータを掲載したが, 他の被験者においてもほぼ同様の結果が得られた。 5. 考察学習された自己組織化マップを見ると, どのマップにおいてもニューロンが反応する画像が徐々に変化していることは共通している. しかし, 目と口を比べると若干の違いがある. 目の場合では, 目が閉じているか開いているかといった, 比較的単純な形状変化しか存在しないため, 学習されたマップを見ても, 端から開いた目から閉じた目へと変化しているだけである. しかし, 口の場合には, 開き方には横方向や縦方向があり, 歯が見える場合や見えない場合の差もあり複雑である. その結果, 縦方向に開いた口から徐々に閉じ, その後, 歯が見える形で再び開くといった複雑な変化がマップ中に見られる. 本方法では, 様々な形状変化を, 1次元にマッピングしようと試みているため, 隣のニューロンが反応する画像とは近い距離を保ちつつ, 全体としては蛇行した部分があると考えられる. これは, 第11図と第12図のグラフ形状の違いとして表れていると考えられる. 第11図では目が「笑み」により徐々に細くなるのに従い, 勝ちニューロンの番号が, 10番14番に向かって, 徐々に変化している. しかし, 第12図では, 口が「笑み」によって開かれ, 歯が少しずつ見えるようになるのに従い, 勝ちニューロン番号は, 8番から5番へと下がった後, 急に18 番へ大きく変化している. 8番から5番までは, 歯があまり見えていない口の開きの変化であり, 5番から 18番へと変化したのは, 歯が多く見えるようになった変化である. グラフが大きく変化しているということは, 形状の大きな変化があった, すなわち速い動きがあったと考えることもできるが, この場合は, 歯が見えているという特徴により, 5番のニュ-ロンと18 番のニューロンが反応する画像が, 比較的似ていると考えられる. また, 5番と18番の中間を示すような, ニューロ第11図目の特徴抽出結果

Fig. 11 Feature extraction r alts r eye images,

input

images

results

第12図ロの特徴抽出結果

Fig. 12 Feature extraction results for mouth images.

input

images

results

(7)

-25-(220) 生体医工学第40巻第4号 (2002年12月)

ンがマップ中に存在しなかったことも, この理由とし

て考えられる. 5番から8番への変化の途中で勝ちニ

ューロンとなっている11番の画像を見てみると, 歯

が見えている画像ではない. しかし, 下唇の輝度値

が, ちょうど歯が半分くらい見えている場合の画像の

輝度値に近くなるため, 存在するニューロンの中で最

も近いニューロンとして選ばれたと解釈できる. この

ような混乱を解決するためには, 色情報を利用すると

改善できると考えられる.

目と口とでは上記のような違いが見られたが, 勝ち

ニューロン番号の変化の大きいことが悪い結果である

というのではない. 仮にマップ上で複雑な動きを見せ

た表情変化でも, 画像の特徴が正確に数値化されてい

るのならば, この数値の変化を実際の表情変化と対応

させるアルゴリズムを工夫すれば良いからである. 入

力した画像と特徴抽出結果の画像を比較してみると,

目の場合でも口の場合でも似ているため, 本方法によ

り, 画像の持つ膨大な情報を, 勝ちニューロンの番号

という単純な数値として表現することが可能であった

と考えられる. ただし, 勝ちニューロン番号の解釈を

簡単にするためには, 学習される自己組織化マップを

シンプルにする工夫が必要であると考えられる.

その工夫の一つとして, 着目している部分の特徴以

外がマップ形成に関わらないために, 画像の前処理が

不可欠である. 第9図において, 生成されたマップの

輝度値が一様に揃えられているため, 輝度値調整は良

好に働いていると考えられる. また, 今回の実験条件

では顔が大きく動くことはなかったが, 生成されたマ

ップ (第9図) においても, 生成されたマップによる

画像の特徴抽出結果 (第10図, 第11図) において

も, 矩形に切り取られた画像中の眉, 目, 口の位置が

ほぼ一定になっているため, 画像の切り出し位置の調

整もほぼ良好に働いていたと考えられる.

6. ま

と

め

個人の様々な表情画像を用いて画像の特徴抽出の基

本となるテンプレート群を自動的に作成し, 顔部分画

像の特徴抽出を行う方法として, 自己組織化マップを

用いた手法を試みた. その結果, 撮影した表情画像に

含まれる画像の特徴を自動的に分類し, 代表となるテ

ンプレート群を作成することが可能であった. そし

て, これらのテンプレートを用いて画像の特徴抽出を

行った結果, 形状の変化に応じた画像特徴抽出が可能

であることを確認した. 本手法を連続した表情画像に

適用し, 抽出された特徴の時間変化を解析することに

より, 表情識別が行える可能性が示唆された.

本研究の一部は, 東京電機大学フロンティア共同研究センター研究補助金 (文部科学省学術フロンティア推進事業) および, 東京電機大学総合研究所 (研究課題Q00 SO5) によって行われた. 文献 1) 桐田隆博: 顔面像認識表情の認識心理学の立場から, Med. Imag. Tech., 12-6, 681/687 (1994)

2) 森島繁生: 顔面像認識表情の認識工学の立場から, Med. Imag. Tech., 12-6, 688/693(1994) 3) 森島繁生, 原島博: 表情インタフェースのための感情情報の定量表現とモデル化, ヒューマン・インタフェース・シンポジウム論文集, Vol. 9, 357/360, 計測自動制御学会ヒューマンインタフェース部会, 神戸 (1993) 4) 重田和夫, 藤岡宏治, 志水英二: 次世代ヒューマンインタフェイス「いたわりエージェント」, 機械の研究, 49-9, 913/ 919 (1997) 5) 岩田満, 鬼沢武久: 顔の表情表現と結びつけた経路決定システム, 日本ファジィ学会誌, 8-3, 532/540 (1996) 6) 小林宏, 原文雄, 池田進, 山田寛: リカレントニューラルネットワークによる動的な基本表情認識, 電子情報通信学会技術研究報告, 92-443, 11/16(1993) 7) 小林宏, 原文雄: ニューラルネットによる人の顔の6 基本表情の強さの計測に関する研究, 日本機械学会論文集 C, 59-567, 3411/3417 (1993) 8) 小野仁志, C. Cho, 南谷晴之: 顔画像の不変モーメントを用いたニューラルネットワークによる表情認識, 電気学会論文誌C, 115-12, 1568/1569 (1995) 9)N. P. Chandrasiri, Y. Xiao, 田所嘉昭, 尾田政臣: 2次元 DCTとニューラルネットワークを用いた顔画像の表情認識電子情報通信学会技術研究報告, 96-492, 91/97(1997) 10) 谷萩隆嗣, 高野裕昭: カテゴリーを組み合わせたニューラルネットワークによる顔画像認識, 電子情報通信学会論文誌, J77-D-II-11, 2151/2159 (1994) 11) 太田寛志, 佐治斉, 中谷広正: 顔面筋に基づいたモデルによる顔面構成要素の動きの追跡, 電子情報通信学会技術研究報告, 97-40, 111/118, (1997) 12) 大塚尚宏, 大谷淳: 連続出力確率分布を用いたHMMによる動画像からの不特定人物の表情認識の検討, 情報処理学会研究報告, 97-31, 39/46, (1997) 13) 金子正秀: リアルタイムに近づいた3D形状計測ヒューマンコミュニケーションへの応用-3次元形状モデルを利用した顔画像処理, 計測と制御, 34-6, 462/464(1995) 14) 間瀬健二, 末永康仁: フレーム間の動き情報による表情識別の検討, 情報処理学会全国大会講演論文集, 43-2, 2. 243/ 2. 244(1991) 15) 朴眠徹, 金子正秀, 原島博: GRIP法を用いた頭部の3 次元動き分析, 電子情報通信学会論文誌, J80-D-II-8, 2138/2151 (1997) 16) 小林宏, 原文雄: ニューラルネットによる人の基本表情認識, 計測自動制御学会論文集, 29-1, 112/118(1993) 17) 小林宏, 原文雄: ニューラルネットによる人の顔の混合表情の認識日本機械学会論文集C, 59-567, 3418/3423 (1993)

18) T. Kohonen: Self-organizing maps, Springer-Verlag, Berlin, Heidelberg, New York (1995)

19) P. エクマン, W. V. フリーセン; 表情分析入門, 誠信書房, 東京 (1987)

(8)

-26-加藤綾子・福井康裕: 自己組織化マップによる顔画像変化の特徴抽出 (221)

Feature

Extraction

of Facial

Images

Using Self-organizing

Maps*

Ayako KATOH,** Yasuhiro FUKUI**

Much information

is received from facial expressions during communication.

Therefore, during the interface

between humans and machines, for example, it's important to extract the information from facial images in order to

obtain the correct understanding.

This paper proposes a new method for extracting information from facial images.

The method provides a self-clustering

of image features, and has procedures to cluster images input using

self-organizing maps (SOMs).

A SOM is an artificial neural network consisting of an input layer and an output layer.

When the brightness values of an image are input into the input layer, the output layer works as a map layer that

clusters the features of the image.

This ability is obtained using a process known as "self-training."

This paper

discusses the application of the suggested method for analyzing actual facial images. Six fundamental facial

expres-sions (i. e., happiness, anger, sadness, disgust, fear and surprise) were enacted and recorded by digital VTR. First, an

image sequence was composed from the recorded film footage, and the eyebrows, eyes and mouth were

semi-automatically selected for observation from each image. Next, training for self-clustering was performed to

automati-cally classify all the facial expressions.

After training, an analysis of each SOM was done to review its classification

ability. The SOMs were able to classify various shapes of eyebrows, eyes and mouth. When an image sequence from

a change in facial expression was input, it was reflected in a change in output that described the change in facial

expression.

Our method may therefore be used to recognize facial expressions and emotions.

*Received on May 28th 2002, Revised on October 30th 2002

**Department of Electronic and Computer Engineering, College of Science and Engineering, Tokyo Denki University

自己組織化マップによる顔画像変化の特徴抽出に関する基礎的研究

研究

自己組織化 マツプによる顔画像変化 の

特徴抽 出に関す る基礎的研究＊

加 藤

綾 子 ＊＊・福 井

康 裕 ＊＊

1. ま

え

が

き

近年, セ キ ュ リテ ィシステ ムや マ ンマ シ ンイ ンタ ー

フ ェース な どの分野 で, 顔 か ら得 られ る情 報 へ の関心

が 高 まって い る1∼5).

顔 に関 す る研 究 は, 個 人 識 別,

表情 認識, 表 情 合成 な ど多岐 にわた って お り, 顔 の捉

え方 にお いて も2次 元画 像 を用 い る ものか ら3次 元計

測や モ デル を用 い る もの まで多種 多様 な手法 が提 案 さ

れ てい る6∼15).

どの手法 にお いて も, 顔 か ら得 られ る

情 報 は膨 大で あ り, その膨 大 な情報 の 中か ら, 如何 に

して必 要 な情報 を取 り出 すかが 重要 な課題 とな って い

る.

本 研 究 で は顔 画像 の変化 か ら動 的 な表 情認 識 を行 う

こ とを 目指 してお り, 顔 画像1枚 に含 まれ る情報 をで

きるだ け単純 化 した 記号 で表現 し, その記号 の変 化 を

解 析 す る こ とに よ り表情認 識 を行 うこ とを目標 として

い る. 本稿 で は顔 画像1枚 に含 まれ る情報 をで き るだ

け単純 化 す る こ と, す なわち顔 画像 の特徴 抽 出 を目的

とした.

顔 全 体 の画像 か らその顔 の特徴 を記述 す る場合, 従

来 か ら行 わ れ てい る予 め着 目 した特 徴量, 例 えば 目や

口の大 き さ (水平方 向 の長 さ, 垂直 方 向 の長 さ な ど)

や, 着 目点 の移 動距 離 ・移 動 方向 な どを画像 か ら計 測

し, そ の 特 徴 量 を 用 い て 表 情 を認 識 す る 方 法 で