博士論文審査結果報告書
4
0
0
全文
(2) 近年,セキュリティ,ロボット産業などの発展に伴い,画像処理技術の需 要が高まってきている.画像からの不変特徴の抽出は,画像処理およびコン ピュータビジョン分野において,ここ数十年にわたって,文字読取装置, 顔 や指紋などによる生体認証,ビデオ監視など数多くの応用研究の重要な課題 となっている.対象物の特徴抽出を行う場合,画像の特徴量は, 異なる撮影 位 置 ,異 な る 照 明 条 件 ,異 な る カ メ ラ の 角 度 に よ り 一 般 に 大 き く 変 動 す る . 不 変特徴記述子としては, 様々な条件下で撮影された画像の対象物の特徴量が 変わらず, かつ対象物の種類を識別するカテゴリ識別能力が高いことが望ま れ る . こ の 要 請 か ら 不 変 特 徴 記 述 子 の 研 究 は , 1990 年 代 か ら Local Binary P a t t e r n s ( L B P, O j a l a e t a l ( 1 9 9 4 ) ) , あ る い は S c a l e I n v a r i a n t F e a t u r e Tr a n s f o r m ( S I F T, L o w e ( 1 9 9 9 ) ) や そ の 拡 張 G r a d i e n t L o c a t i o n - O r i e n t a t i o n Histogram (GLOH, Mikolajczyk et al( 2005))な ど の 発 表 に よ り 急 速 に 発 展 してきた. 不変特徴には, 対象物を含む画像において拡大縮小に対する不変 性 , 回 転 に 対 す る 不 変 性 , 照 度 変 化 に 対 す る 不 変 性 , ア ウ ト ラ イ ヤ( カ テ ゴ リ 識別においてエラーを引き起こす外れ値)に対する不変性, 物体の一部が隠 れたりするオクルージョンに対する不変性などが存在する. 従来研究として 前 述 の S I F T, G L O H は , 拡 大 縮 小 や 回 転 に 対 し て は 不 変 で あ る が , 照 明 変 化 に は 若 干 弱 い , あ る い は LBP は 回 転 に 対 し て 弱 い , な ど の 問 題 が あ る . 本 研 究は, これらの5つの不変性を保持し, かつ高精度のカテゴリ識別能力を有 する不変特徴記述子を提供するものである. 本研究では, 不変特徴記述子の応用として顔認識とテクスチャ解析を取り上 げ, 不変特徴記述子と連動した画像マッチング手法の確立を行っている. これ. は,画像マッチングにおいて主要な要素技術である類似度尺度について 2 種 類の新たな方法について検討している. 本研究は, 画像処理あるいはコンピ ュータビジョンの分野において, 不変特徴記述子に関する 5 種類の不変性に 対する解法を提案している点でその意義は高く,画像認識研究の新たな展開 を示すものと言える.以下,各章ごとにその概要を示し評価を与える. 第 1 章 「 Introduction」 で は , 画 像 の 不 変 特 徴 記 述 子 の 主 要 な 従 来 技 術 に つ い て 概 説 し ,不 変 特 徴 記 述 子 の 問 題 点 と そ の 対 策 を 明 ら か に し て い る .ま た , 顔 認識, あるいはテクスチャ解析における画像マッチング手法の従来研究との相 違点を明らかにしている.. 第 2 章 「 Invariant 1D Local Feature Descriptors by Multi -Scans」 で は , 画像の局所領域に対して様々な回転角に基づいた走査により 1 次元輝度デー タ系列に変換し, その 1 次元データに対して多重ダウンサンプリングと勾配 コーディングを適用して, 拡大縮小に対する不変性, 回転に対する不変性, 照度変化に対する不変性を解決する不変特徴記述子を実現している.複数走 査により回転不変性を吸収し, 多重ダウンサンプリングにより 1 次元データ を様々な間隔でダウンサンプリングすることで拡大縮小に対する不変性を吸 2.
(3) 収している. また, 勾配コーディングにより, 複数の 1 次元輝度データ系列 を各点の勾配に比例した写像を行うことでコードに置き換え, 照度変化に不 変な特徴を抽出している. 拡大縮小画像, 回転した画像, 照度の異なる画像 などを含む約50種類の標準画像を用いたカテゴリ識別実験により,提案手 法 は , 従 来 手 法 L B P, S I F T, G L O H な ど 6 種 類 の 不 変 特 徴 記 述 子 と 比 較 し , カテゴリ識別精度が約5%向上することを確認している.本研究は,複数走 査からの多重ダウンサンプリングと勾配コーディングによる特徴を生かした 不変特徴記述子の着想により,高精度のカテゴリ識別を可能にしたことが評 価できる. 第 3 章 「 Invariant Local Curvelet Feature Descriptors by Multi -Scans」 で は ,第 2 章 の 不 変 特 徴 記 述 子 を 拡 張 し , 拡 大 縮 小 ,回 転 , 照 度 に 加 え て , ア ウトライヤ, オクルージョンを含む 5 種類の不変特徴を実現するために,エ ッ ジ 情 報 を 保 存 し た 画 像 変 換 で あ る Curvelet 変 換 と , L1 ノ ル ム に よ る 線 形 判別関数を用いた写像をベースにした新たな不変特徴記述子を提案している. こ こ で , L2 ノ ル ム が ユ ー ク リ ッ ド 距 離 に よ り 計 算 を 行 う の に 対 し て , L1 ノ ル ムはマンハッタン距離によって計算を行うものである. 具体的には,画像の Curvelet 変 換 に よ り 得 ら れ た Curvelet 係 数 成 分 に 対 し て 複 数 走 査 お よ び 勾 配コーディングを適用してコード系列を得, さらにアウトライヤやオクルー ジ ョ ン に 強 い L1 ノ ル ム に よ る 線 形 判 別 関 数 を 用 い た 写 像 に よ り 不 変 特 徴 抽 出を行うものである. 第 2 章において使用したデータセットを用いた評価実 験では,カテゴリ識別精度に約 3 パーセントの向上が見られ, かつアウトラ イヤやオクルージョンの不変性に強いとされるガボールフィルタによる主成 分 分 析 法 (Li et al (2009))な ど の 不 変 特 徴 記 述 子 よ り 、 約 2~ 3%性 能 向 上 が 見られることを確認している.このように第2章で述べた不変特徴記述子を 拡張して, アウトライヤやオクルージョンに対する不変性を取り入れた, よ りカテゴリ識別精度の高い不変特徴記述子を実現できたことが評価できる. 第 4 章 「 Face Recognition with Multi-Scans based Invariant Feature D e s c r i p t o r s 」で は ,第 3 章 で 述 べ た 不 変 特 徴 記 述 子 に お い て , L 1 ノ ル ム に よ る 線 形 判 別 関 数 を 拡 張 し , ま た 新 た な E a r t h M o v e r ’s D i s t a n c e( E M D ) を 導 入して画像マッチングを実現している.一般に,顔画像では,顔の角度, 照 明などの異なる撮影条件の変化や, めがね, マスクなどのオクルージョンな どが発生するが,見た目には大きな違いがある.本研究では画像の部分画像 ( ブ ロ ッ ク )に 対 し て L 1 ノ ル ム に よ る 線 形 判 別 関 数 を 適 用 し , コ ー ド 系 列 を ヒ ス ト グ ラ ム 表 現 に 置 き 換 え て ヒ ス ト グ ラ ム 間 距 離 と し て 重 み 付 き Earth M o v e r ’s D i s t a n c e を 導 入 し て 類 似 度 を 計 算 し て い る . こ の 類 似 度 尺 度 は , エ ッジに基づくため,顔画像のオクルージョンなどの差異にあまり影響されな い .実 験 で は ,顔 画 像 の 4 種 類 の 標 準 デ ー タ セ ッ ト O R L , F E R E T, F R G C , A R を用いて大規模評価実験を行っている. 実験の結果, 近年提案されている数 3.
(4) 多 く の 顔 認 識 手 法 の 中 か ら 主 要 な 20 種 類 を 選 択 し , 比 較 評 価 を 行 い , 2~ 3% の性能向上を確認している. また, サポートベクターマシンと組み合わせた 顔画像による男女識別や表情認識への拡張を検討している. ブロック単位の L1 ノ ル ム か ら の 線 形 判 別 関 数 へ の 拡 張 と 画 像 マ ッ チ ン グ に お け る 新 た な 類 似度尺度の導入により, 高精度な顔認識アルゴリズムを実現できたことが評 価できる. 第 5 章 「 Te x t u r e C l a s s i f i c a t i o n w i t h M u l t i - S c a n s b a s e d I n v a r i a n t Feature Descriptors」 で は , 前 章 に お い て 述 べ た L1 ノ ル ム に よ る 線 形 判 別 関 数 に 加 え て , Correntropy に よ る 線 形 判 別 関 数 を 用 い た 画 像 マ ッ チ ン グ を 提 案 し , テ ク ス チ ャ 解 析 へ の 応 用 を 検 討 し て い る . Correntropy と は Liu et al(2007) に よ っ て 提 案 さ れ , 相 関 関 数 と エ ン ト ロ ピ ー を 合 成 さ せ た 類 似 度 尺 度である. テクスチャ解析は,タイル, 着物などに見られる紋様を含む画像 を対象とし, どのような紋様が近いか, あるいは紋様の中にキズがあるかな どで様々な応用研究がある. 本研究は,このようなテクスチャ画像に対応で きる類似物の画像マッチングを実現しようとするものである.一般に公開さ れ て い る Brodatz デ ー タ セ ッ ト や コ ロ ン ビ ア 大 学 に お い て 公 開 さ れ て い る 大 規 模 デ ー タ セ ッ ト CUReT を 用 い て 評 価 実 験 を 行 っ た 結 果 , Guo et al(2009) の L B P を 拡 張 し た 手 法 や Va r m a e t a l ( 2 0 0 9 ) に よ る 統 計 的 手 法 な ど 5 種 類 の 従来のマッチング手法と比べ,数パーセントのカテゴリ識別精度の向上を確 認 し て い る . 特 に , CUReT に お い て 識 別 が 困 難 と さ れ る サ ブ セ ッ ト T23 で は 約 1 0 % の 精 度 向 上 を 確 認 し て い る .テ ク ス チ ャ 解 析 に お い て C o r r e n t r o p y に よる線形判別関数を用いて高精度のカテゴリ識別が可能な新たなマッチング 手法を考案したことが評価できる. 第 6 章「 Conclusion and Future Work 」で は ,本 論 文 を ま と め ,顔 認 識 や テクスチャ解析への応用分野において,更なるカテゴリ識別の高精度化につ いて今後の課題を挙げている. 以上要するに本論文は拡大縮小, 回転, 照度変化, アウトライヤ, オクルー ジョンに対して不変特徴記述子を確立することを目的とし,複数走査, Curvelet, L1 ノ ル ム や Correntropy に よ る 線 形 判 別 関 数 な ど に よ る 識 別 を 検 討し, 従来法に対する頑健性を示したもので,画像工学上価値ある業績と言 える.よって本論文は博士(工学)の学位論文に値するものと認める. 2012 年 主査. 1 月. 30 日. 早稲田大学. 教授. 博 士 ( 工 学 )( 九 州 工 業 大 学 ). 早稲田大学. 教授. 博 士 ( 情 報 工 学 )( 九 州 工 業 大 学 ) 古 月. 敬之. 早稲田大学. 教授. 博 士 ( 工 学 )( 早 稲 田 大 学 ). 松丸. 隆文. 九州大学. 教授. 工学博士(九州大学). 谷口. 倫一郎. 4. 鎌田. 清一郎.
(5)
関連したドキュメント
これらの研究成果は、交差点交通信号の実時間確率的最適制御法に関する研
専攻名 システム創成工学専攻 氏 名
第 2 章は、第 1 章で提示された本論文の問題意識に基づいて、多様な先行研究のレビュ ーを行っている。第 1 節では Marshall(1922)や
そこで、本論文では、発電出力 4MW の特性検証用 AHAT
高性能透析器および透析膜の性能評価に関する研究 Performance evaluation of highly efficient membrane and module for hemodialysis.. 山本 健一郎 Ken-ichiro
て Fuzzy GNP-RL を訓練し、あわせて、ファジィメンバシップ関数を進化により 最適化すると更なる頑健性の向上が図れることを示している。
ツチガエル第 9 染色体上の GOT-1 及び CYP17 遺伝子に関する研究 Studies on the GOT-1 and CYP17 genes on chromosome 9 of Rana rugosa.. 須田 茉莉 Mari
Determination of crystal structure and absolute configuration of thalidomide enantiomers サリドマイド対掌体の結晶構造および 絶対配置の決定.. Toshiya Suzuki