標識判定率

第 9 章画像認識研究：実験 89

9.5 標識判定率

提案手法により，ぼやけテンプレート画像を追加したり，駐車禁止標識に関して色情報を用いた特別処理を加えることによって，どの程度マッチング率が向上したかを調べた．Fig.9.7^にマッチング率を示す．左のSIFTが従来と同様に単純にSIFTを用いて標識の判定を行った結果であり，

中央がテンプレート標識にぼやけ標識を追加した結果であり，右図が駐車禁止標識に対して特別処理を追加した結果である．ここで，マッチング率とは発見された標識に対してテンプレート標識とマッチングを行い，正しい標識を認識できたときの割合を表す．単純にSIFTのみを用いた場合では，32.94%となり，約1/3しか認識できていない．ぼやけテンプレートを追加すると，ぼやけ画像に対応することになり，42.35%までマッチング率が向上した．このことから，ぼやけている入力標識に関しては，ぼやけているテンプレート標識が有効に働くことが分かる．駐車禁止標識に関する特別処理を行うと，認識率は70.58%まで向上した．駐車禁止標識は道路画像中で最も良く出てくる標識であり，実験画像内の標識のうち半分近くを占めているので，今回駐車禁止標識に対する特別処理を加えたことによって，大きくマッチング率が向上した．すなわち，SIFT 特徴量によるマッチングで多くの駐車禁止標識が認識されていなかったということになる．平坦で特徴の少ない標識に関しては特徴量を使わずに色情報のみで単純に認識してしまうのが良いことが分かった．

9.5 ^{標識判定率}

徴量が9個であり，非常に少ない値となっている．この量での正確なマッチングやVoting^処理を行うことができないので，SIFT特徴量では有効に駐車禁止標識判定ができないことが分かる．

Figure 9.8 A number of feature points in each sign

道路画像内に存在する標識全体から実際にどの程度認識できたのかを最後に述べる．Fig.9.9に標識部分の発見率と標識の判定率の両方をまとめたものを示す．もともと50%しか認識できなかったところ60%認識できるようになり，提案手法が有効に働いたことが分かった．しかし，認識率が60%というのはまだまだ低い値なので，特徴点の分布について調査した．Fig.9.10に標識テンプレートとぼやけテンプレートと実際に抽出された標識の特徴点の分布を示す．テンプレートと抽出された標識で同じような分布となっているが，抽出された標識にしか存在しない特徴点もある．ぼやけテンプレートでも一部の特徴点は補うことができていないので，ブロックノイズでぼやけさせる以外にも複数のぼやけテンプレートを用意し，対応していく必要がある．また，

SIFTでは特徴点がこのように異なってしまう問題があるので，単純なテンプレートマッチングを組み合わせる手法も考えていく必要がある．

その他の失敗例としては，Fig.9.11が挙げられる．左図では解像度が低すぎたり，カメラから標識までの距離が遠すぎるために重要やエッジなどの情報が欠落してしまっていて認識ができない．

また，右図では太陽光により色情報が削られ，情報が細線化されてしまっている．標識認識を考えるときはどこまで認識できるようにするべきかということも今後考えていかなければならない．

第9章画像認識研究：実験

Figure 9.9 The result of Detection and Classification

Figure 9.10 Distribution of features(Left:template, Center:Blurred template, Right:extracted)

9.5 ^{標識判定率}

Figure 9.11 Failure cases of Traﬃc Sign Recognition

第 10 ^章

結論

10.1 ^{符号化研究について}

10.1.1 まとめ

近年，4Kや8Kなどの超高精細動画像の普及やその研究が盛んに行われている中で，動画像の符号化にはまだいくつか問題がある．特に，ズームや回転などの平行移動ではない被写体の動きに対する有効な動き補償が行われていないことから，本研究では8Kグローバルモーションを持つ動画に対するH.265/HEVCの符号化効率の改善手法を提案した

提案手法では，H.265/HEVCから得られる動きベクトルを用いて，ズーム情報（ズーム中心とズーム倍率）や回転情報（回転中心や回転角度）を計算し，全てのBフレームをI フレームとの差分が小さくなるようにアフィン変換することによってビットレートの削減を目指した

ズームイン動画については，以下のような実験結果が得られた．

• ^{ズーム情報の精度}

ズーム情報の検出は中程度のQP値を指定した時にH.265/HEVC符号化から得られる動きベクトルを用いると最も精度良く検出できることが分かった．力ずく探索によるズーム情報の検出結果と比べたところズーム中心の画素差は(2.667,1.875)であり，ズーム倍率差は

0.000007であり，精度良くズーム情報を検出できた．

• RD^{曲線による評価}

通常のH.265/HEVCによる符号化結果と提案手法による符号化結果をRD曲線で比較した

ところ，提案手法の方が符号化効率が上がった．また，ズーム速度が速いほど提案手法の効果が大きく表れ，B^{フレームのみの}RD曲線について低ビットレートで約0.635dB^の向上を果たした．

• CU分割と動きベクトルの変化

提案手法によるCU分割の変化と動きベクトル値の変化を分析した．CU分割は通常の符号化に比べて64x64のCUが増え，32x32のCUが減少した．したがって，提案手法では大きなブロックサイズで符号化を行うので符号化ビット数が削減され効率の良い符号化が実現した．また，動きベクトル値は通常はズーム中心から離れれば離れるほど大きくなるが，提案

第10^{章結論}

手法ではB^{フレームを}Iフレームのサイズに変換したことにより，フレーム全体において動きベクトル値が0に近づき，動きベクトル値の符号化ビット数を減らすことができた．これら2つの分析から提案手法により確かに符号化ビット数が低下していることが分かった．

• ^{主観的比較}

実際の画質についても比較を行った．提案手法ではアフィン変換を用いてズームに適した変換を行うことにより，エッジ部分が鮮明になり画質の向上を果たした．

回転動画については，以下のような実験結果が得られた．

• RD曲線による評価

通常の H.265/HEVC による符号化結果と提案手法による符号化結果をRD 曲線で比較し

た．回転動画では動画の性質上，複号時に補間できない部分が生じるが，HEVCによってその部分を別途符号化送信することで補ったところ，補間に成功した．RD^{曲線では，通常の}

H.265/HEVCよりも提案手法の方が良い結果となり，Bフレームのみの RD曲線について

低ビットレートで約0.36dBの向上を果たした．

10.1.2 ^{今後の課題}

本研究における今後の課題について述べる．

まず，ズーム動画について本研究ではズーム速度が動画像内で一定と仮定して実験を行っている．だが実際はズーム速度が一定ではない動画像も存在するので，毎フレームあるいは4フレームや8フレームごとにズーム情報を更新するような処理を考える必要がある．また，本実験ではズームイン動画に対する処理しか扱っていないので，ズームアウトの動画についての処理も検討する必要がある．

次に，回転動画については複号時に周りの画素を補間するときにIフレームから画素を補間するが，そのときに補間したことによって，その部分の境界線が見えてしまう問題がある．その部分に対し，デブロッキングフィルタを新たにかけ直すといった処理を加えなければならない．

本研究では，ズーム動画・回転動画についてそれぞれ独立した動画を扱ったが，パン・ズーム・

回転の全てのモーションが組み合わされた動画に関して適切なアフィン変換を行う手法を提案し

ドキュメント内グローバルモーション検出を用いた 8K 動画の H.265/HEVC 符号化画質改善 (ページ 100-107)

第 9 章 画像認識研究：実験 89

9.5 標識判定率

第 10 章

結論

10.1 符号化研究について

10.1.1 まとめ

10.1.2 今後の課題

第 9 章画像認識研究：実験 89

第 10 ^章

10.1 ^{符号化研究について}

10.1.2 ^{今後の課題}