• 検索結果がありません。

第 9 章 画像認識研究:実験 89

9.5 標識判定率

提案手法により,ぼやけテンプレート画像を追加したり,駐車禁止標識に関して色情報を用いた 特別処理を加えることによって,どの程度マッチング率が向上したかを調べた.Fig.9.7にマッチ ング率を示す.左のSIFTが従来と同様に単純にSIFTを用いて標識の判定を行った結果であり,

中央がテンプレート標識にぼやけ標識を追加した結果であり,右図が駐車禁止標識に対して特別 処理を追加した結果である.ここで,マッチング率とは発見された標識に対してテンプレート標 識とマッチングを行い,正しい標識を認識できたときの割合を表す.単純にSIFTのみを用いた 場合では,32.94%となり,約1/3しか認識できていない.ぼやけテンプレートを追加すると,ぼ やけ画像に対応することになり,42.35%までマッチング率が向上した.このことから,ぼやけて いる入力標識に関しては,ぼやけているテンプレート標識が有効に働くことが分かる.駐車禁止 標識に関する特別処理を行うと,認識率は70.58%まで向上した.駐車禁止標識は道路画像中で最 も良く出てくる標識であり,実験画像内の標識のうち半分近くを占めているので,今回駐車禁止 標識に対する特別処理を加えたことによって,大きくマッチング率が向上した.すなわち,SIFT 特徴量によるマッチングで多くの駐車禁止標識が認識されていなかったということになる.平坦 で特徴の少ない標識に関しては特徴量を使わずに色情報のみで単純に認識してしまうのが良いこ とが分かった.

9.5 標識判定率

徴量が9個であり,非常に少ない値となっている.この量での正確なマッチングやVoting処理を 行うことができないので,SIFT特徴量では有効に駐車禁止標識判定ができないことが分かる.

Figure 9.8 A number of feature points in each sign

道路画像内に存在する標識全体から実際にどの程度認識できたのかを最後に述べる.Fig.9.9に 標識部分の発見率と標識の判定率の両方をまとめたものを示す.もともと50%しか認識できな かったところ60%認識できるようになり,提案手法が有効に働いたことが分かった.しかし,認 識率が60%というのはまだまだ低い値なので,特徴点の分布について調査した.Fig.9.10に標識 テンプレートとぼやけテンプレートと実際に抽出された標識の特徴点の分布を示す.テンプレー トと抽出された標識で同じような分布となっているが,抽出された標識にしか存在しない特徴点 もある.ぼやけテンプレートでも一部の特徴点は補うことができていないので,ブロックノイズ でぼやけさせる以外にも複数のぼやけテンプレートを用意し,対応していく必要がある.また,

SIFTでは特徴点がこのように異なってしまう問題があるので,単純なテンプレートマッチングを 組み合わせる手法も考えていく必要がある.

その他の失敗例としては,Fig.9.11が挙げられる.左図では解像度が低すぎたり,カメラから標 識までの距離が遠すぎるために重要やエッジなどの情報が欠落してしまっていて認識ができない.

また,右図では太陽光により色情報が削られ,情報が細線化されてしまっている.標識認識を考 えるときはどこまで認識できるようにするべきかということも今後考えていかなければならない.

第9章 画像認識研究:実験

Figure 9.9 The result of Detection and Classification

Figure 9.10 Distribution of features(Left:template, Center:Blurred template, Right:extracted)

9.5 標識判定率

Figure 9.11 Failure cases of Traffic Sign Recognition

10

結論

10.1 符号化研究について

10.1.1 まとめ

近年,4Kや8Kなどの超高精細動画像の普及やその研究が盛んに行われている中で,動画像の 符号化にはまだいくつか問題がある.特に,ズームや回転などの平行移動ではない被写体の動き に対する有効な動き補償が行われていないことから,本研究では8Kグローバルモーションを持 つ動画に対するH.265/HEVCの符号化効率の改善手法を提案した

提案手法では,H.265/HEVCから得られる動きベクトルを用いて,ズーム情報(ズーム中心と ズーム倍率)や回転情報(回転中心や回転角度)を計算し,全てのBフレームをI フレームとの 差分が小さくなるようにアフィン変換することによってビットレートの削減を目指した

ズームイン動画については,以下のような実験結果が得られた.

ズーム情報の精度

ズーム情報の検出は中程度のQP値を指定した時にH.265/HEVC符号化から得られる動き ベクトルを用いると最も精度良く検出できることが分かった.力ずく探索によるズーム情 報の検出結果と比べたところズーム中心の画素差は(2.667,1.875)であり,ズーム倍率差は

0.000007であり,精度良くズーム情報を検出できた.

RD曲線による評価

通常のH.265/HEVCによる符号化結果と提案手法による符号化結果をRD曲線で比較した

ところ,提案手法の方が符号化効率が上がった.また,ズーム速度が速いほど提案手法の効 果が大きく表れ,BフレームのみのRD曲線について低ビットレートで約0.635dBの向上を 果たした.

CU分割と動きベクトルの変化

提案手法によるCU分割の変化と動きベクトル値の変化を分析した.CU分割は通常の符号 化に比べて64x64のCUが増え,32x32のCUが減少した.したがって,提案手法では大き なブロックサイズで符号化を行うので符号化ビット数が削減され効率の良い符号化が実現し た.また,動きベクトル値は通常はズーム中心から離れれば離れるほど大きくなるが,提案

第10章 結論

手法ではBフレームをIフレームのサイズに変換したことにより,フレーム全体において動 きベクトル値が0に近づき,動きベクトル値の符号化ビット数を減らすことができた.これ ら2つの分析から提案手法により確かに符号化ビット数が低下していることが分かった.

主観的比較

実際の画質についても比較を行った.提案手法ではアフィン変換を用いてズームに適した変 換を行うことにより,エッジ部分が鮮明になり画質の向上を果たした.

回転動画については,以下のような実験結果が得られた.

RD曲線による評価

通常の H.265/HEVC による符号化結果と提案手法による符号化結果をRD 曲線で比較し

た.回転動画では動画の性質上,複号時に補間できない部分が生じるが,HEVCによってそ の部分を別途符号化送信することで補ったところ,補間に成功した.RD曲線では,通常の

H.265/HEVCよりも提案手法の方が良い結果となり,Bフレームのみの RD曲線について

低ビットレートで約0.36dBの向上を果たした.

10.1.2 今後の課題

本研究における今後の課題について述べる.

まず,ズーム動画について本研究ではズーム速度が動画像内で一定と仮定して実験を行ってい る.だが実際はズーム速度が一定ではない動画像も存在するので,毎フレームあるいは4フレー ムや8フレームごとにズーム情報を更新するような処理を考える必要がある.また,本実験では ズームイン動画に対する処理しか扱っていないので,ズームアウトの動画についての処理も検討 する必要がある.

次に,回転動画については複号時に周りの画素を補間するときにIフレームから画素を補間す るが,そのときに補間したことによって,その部分の境界線が見えてしまう問題がある.その部 分に対し,デブロッキングフィルタを新たにかけ直すといった処理を加えなければならない.

本研究では,ズーム動画・回転動画についてそれぞれ独立した動画を扱ったが,パン・ズーム・

回転の全てのモーションが組み合わされた動画に関して適切なアフィン変換を行う手法を提案し

関連したドキュメント