• 検索結果がありません。

修修修修 士士士士 論論論論 文文文文 概概概概 要要要要 書書書書

N/A
N/A
Protected

Academic year: 2022

シェア "修修修修 士士士士 論論論論 文文文文 概概概概 要要要要 書書書書"

Copied!
2
0
0

読み込み中.... (全文を見る)

全文

(1)修 士 論 文 概 要 書 Summary of Master’s Thesis Date of submission: 01/31/2012 (MM/DD/YYYY) 専攻名(専門分野) 情報理工学専攻 Department. 研究題目 Title. 画像情報研究. 学籍番号 Student ID number. 2. Bilateral Filter を用いた SIFT の性能改善 2.1 SIFT(ScaleSIFT(Scale-Invariant Feature Transform) SIFT は、画像の回転、スケール変化、照明変化 等に頑健な特徴量であり、主な処理として、特徴点 の検出と特徴量の記述を行う。特徴点は、平滑化の 度合いがわずかに異なる 2 つの Gaussian Filter 画 像の差分である DoG (Difference of Gaussian) 画 像群から極値を求めることで検出する。また、特徴 量は、特徴点の周辺領域の持つ勾配情報からヒスト グラムを作成し、128 次元の特徴として記述される。 ただし、低コントラストの特徴点と、エッジ上の特 徴点は、ノイズや開口問題に影響を受けやすいとい う問題があるため、特徴点検出後の処理として、こ れらの点を削除する。この際、エッジ上の点を完全 に削除できないという問題がある。特徴点のマッチ ングで誤対応となる点は、エッジ上の点である場合 が多い。 2.2 Bilateral Filter の導入 我々は、DoG 画像作成に用いる平滑化処理に注 目し、ここにエッジ保存平滑化である Bilateral Filter [2]を適用することを提案した[3]。Bilateral Filter は、画素間の距離だけで重みを決めるのでは なく、輝度の差も見て、変化の大きいところは重み を小さくすることによってエッジを残す。f(i,j) を 入力画像、g(i,j)を出力画像とすると、その処理は 次式で表される。 m2 + n2 ( f (i, j ) − f (i + m, j + n)) 2 ) exp(− ) 2 2σ d 2σ r2 n=− w m=− w g (i, j ) = w w m2 + n2 ( f (i, j ) − f (i + m, j + n)) 2 exp( − ) exp(− ) ∑ ∑ 2 2σ d 2σ r2 n =− w m=− w w. CD. 5110B129-8. 指 導 教 員 Advisor. 甲藤 二郎. 印 Seal. Bilateral Filter を用いた SIFT の性能改善に関する検討. 1. はじめに 画像間のマッチング、画像検索、物体認識・検出、 動画像での目標追跡等の実現には、画像の特徴を抽 出する必要がある。このような要求を満たす代表的 な特徴量抽出技術として Scale-Invariant Feature Transform (SIFT) [1] がある。本研究では、SIFT の問題点を指摘すると共に、Bilateral Filter [2] を 用いた SIFT の改善手法の提案を行う。また、その 応用例として、一般物体認識の特性改善について検 討する。. w. ∑∑. 山崎 智章. f (i + m, j + n) exp( −. このフィルタを適用することにより、エッジ上の 特徴点が判別しやすくなり、マッチングの際の誤対 応が減少した(図 1)。また、距離と輝度の両面から の重み付けによる情報量の増加により、検出される 特徴点も増加することが確認できた。. Original:(30, 1112ms) Proposed:(92, 4635ms) 図 1. 対応点探索結果 (対応点, 処理時間) 3. GPGPU による高速化実装 による高速化実装 本 手 法 で は 、 Bilateral Filter の 計 算 量 が Gaussian Filter に比べて大きく、処理時間が増加 することが問題となった。そこで、CUDA[4]を用 いることで GPGPU による高速化を図った。512 ×512 の画像では全体で約 6 倍、フィルタ処理部分 は約 14 倍の高速化に成功した。高速化以前では、 Bilateral Filter の処理時間が全体の処理時間の大 半を占めていたが、高速化後では全体の 40%程に 留まった。 7000. Processing time (ms). 研究指導名 Research guidance. 氏 名 Name. 6000. Proposed. 5000. 〃(Filtering part) Original. 4000 3000 2000. 〃(Filtering part). 1000 0 0. 100000. 200000. 300000. Number of pixels. 図 2. SIFT_CPU 処理速度比較 (DoB vs. DoG).

(2) 10000. 0.7. 1200. 9000 8000. Proposed. 800. 〃(Filtering part) Original. 600 400. 〃(Filtering part). 200 0. 0.5 Identification Rate. Processing time (ms). 0.6. 1000. 7000 6000. 0.4. 5000 0.3. 4000 3000. 0.2. 2000 0.1. 1000. 0. 0. 100000. 200000. 300000. Number of pixels. Keypoints(DoG) Keypoints(DoB) Identification Rate(DoG) Identification Rate(DoB). 0 1. 2. 3. 4. 5. 6. 7. 8. 9 10 11 12 13 14 15 16 17 18 19 20 Category No.. 図 4. カテゴリごとの識別率と特徴点数の比較. 図 3. SIFT_GPU 処理速度比較 (DoB vs. DoG) 3. 提案手法の 提案手法の一般物体認識への 一般物体認識への応用 への応用 3.1 実験概要 一般物体認識に用いる特徴量として、従来手法・ 提案手法のそれぞれにおける SIFT 特徴量を用い た場合について、特に以下の実験項目に着目して、 識別率の比較を行った。 ① カテゴリごとの識別率の比較 ② カテゴリごとの特徴点数の比較 ③ 特徴点に関わる二閾値と識別率の関係 3.2 実験環境 学習画像には Caltech-256 の 20 カテゴリを用い て実験を行う。学習画像、テスト画像ともに各 40 枚を用いる。一般物体認識のプロセスにおけるクラ スタリング手法には k-means を用い、SVM 識別器 によって識別を行う。Visual Word 数は 100 個ご と 100~1000 個まで実験を行い、そのうち最も識別 率の高かったものを、その手法を用いた場合の識別 率として採用した。③における閾値とは、エッジ上 の特徴点排除、低コントラストの特徴点排除のそれ ぞれの処理に用いる 2 つの閾値とし、それぞれの 閾値を変化させたときの識別率を比較する。 3.3 実験結果と 実験結果と考察 図 4 から図 6 に実験結果を示す。全カテゴリ平 均の識別率は、提案手法は従来手法に比べて高い結 果となったが、図 4 を見ると従来手法よりも識別 率が劣るカテゴリも存在する。提案手法では抽出さ れる特徴点数が多いため、その特徴点の割合が集中 する部分が識別に有効に働くか(カテゴリ固有の特 徴であるか)どうかが識別率に大きく影響している。 また実験③では、提案手法における識別率の変動が 従来手法と比較して大きいことから、提案手法では 閾値設定の影響が大きいと言える。さらに、図 6 に示した特徴点数を考慮すると、特徴点数よりも閾 値設定が識別率に大きく影響している。. 図 5. 各閾値における識別率 (左:従来手法、右:提案手法). 図 6. 各閾値における特徴点数 4. まとめ 本研究では、Bilateral Filter を SIFT の平滑化 処理に適用することで、精度面における性能向上に 成功した。また、計算量の観点から見ると問題があ ったが、GPGPU により高速化を行うことでこれを 解決した。 また、一般物体認識における識別率を比較し、提 案手法により抽出された特徴量を用いた場合、全体 的に識別率が向上することを確認した。また、特徴 点数が多いことは必ずしも有利ではなく、適切な閾 値の設定が識別率に影響を及ぼすと言える。 参考文献 [1]D. Lowe, “Distinctive image features from scaleinvariant keypoints”, Proc. of International Journal of Computer Vision (IJCV), pp.91-110, 2004. [2]C. Tomasi and R. Manduchi, “Bilateral Filtering for Gray and Color Images”, Proc. of ICCV, pp.83 9-846, 1998. [3]山崎智章,甲藤二郎,"Bilateral Filter を用いた SIFT の性能改善",信学技報,IE2009-184, Mar.2010. [4]“CUDA Technical Training”, http://developer.nvidia.com/ object/cuda_training.htm.

(3)

参照

関連したドキュメント

1 Mobile IPv6 について 1.1 Mobile IPv6 の機能 インターネットで通信に用いられるIP アドレスは、

和音認識 フレームごとに DNCOF ベクトルを求めていくと, 楽曲全体にわたり図 3 のような DNCOF ベクトルの 時系列が得られる.図 3

そこで , 本研究では機械学習の 1 つである Support Vector Machine(SVM) を用いた動的な チューニングを行う機能を追加した c-satws を作成した.. SVM

動き検出の 検出の改善 複数フレームの合成では誤った領域を合成すると画像 劣化の原因となるため、動き検出の性能が手法全体の

研究の背景と目的 近年,インターネットなどの通信技術の発達によ り,機密情報を扱う業務もネットワーク上で行われる

企業に対しては具体的な環境をはじめとした ESG

入力アプリケーションに対する,各手法の低電圧と面 積を表 1 に示す.演算器における電力消費量を図 2 に 示す.図 3