• 検索結果がありません。

修 士 論 文 概 要 書

N/A
N/A
Protected

Academic year: 2021

シェア "修 士 論 文 概 要 書"

Copied!
2
0
0

読み込み中.... (全文を見る)

全文

(1)

修 士 論 文 概 要 書

CD 2008 年 2 月提出 学籍番号 3606U049-3 専攻名(専門

分野) 情報・ネットワーク 指 導

研究指導名 画像情報処理研究

氏 名

鈴木 惇也

教 員

甲藤 二郎 印

研 究

題 目 高精度動きベクトルを用いた符号化画質改善手法

1. はじめに

近年、画像の符号化において分散映像符号化(DVC)[1]や MDC[2]の様に、付加情報や複数の圧縮画像の活用によってデ コーダ側で復号画像の画質改善を行う手法に関する研究が盛 んに行われている。我々も同様に、一枚の画像を互いに独立 に圧縮符号化し、その復号画像を重ね合わせることにより量 子化誤差を低減する効果を示すと共に[3,5]、この効果を利用 した動画像符号化方式として、デコーダに付加情報として符 号化規格を超える精度の動きベクトルを与える画質改善手法 の検討を進めている。この方式は、[4]で提案されている、画 像を複数の符号化形式で圧縮・送信し、異なる圧縮画像を受 信・合成した場合に画質改善が図れる不確定性符号化方式と 目標を同じくする。本稿ではこの提案手法と、手法について 更なる画質改善及び圧縮効率向上を目指した改善案について 検討を行う。

2.提案手法

2.1 付加情報を用いた符号化画質改善 (I)

[3,5]の量子化誤差低減効果の動画像符号化への応用例とし て、筆者らは、(付加情報を使用せずに)デコーダ側の動き検 出によって画質改善を図る手法と、エンコーダ側の付加情報 の添付によって画質改善を図る手法の検討を並行して進めて いる。その中で、本稿では付加情報の利用による動画像の符 号化画質改善手法を以下に示す。

全体の流れを図2.1に示す。エンコーダで原画像Fを符号 化する際に、符号化規格の画素精度よりも高精度な動きベク トル探索を同時に行う。この高精度動きベクトル探索は次の ようにして行っている。

F中の連続した2フレームの画像Fm、Fm-1について、Fm をブロック分割し、各ブロックについて符号化ストリーム中 の動きベクトル値(本研究では H.263+を採用しているため 1/2pel精度)を中心として、更に高精度(本研究では±1/4pel)

に MSE を最小とする高精度動きベクトルを探索する。この 時、イントラフレームについてはストリーム中にベクトルが ないため、復号画像I中の連続した2フレームの画像Im,Im-1 を用いて一旦動きベクトル探索を行い、これをストリーム中 のベクトル値とみなして上記の高精度動きベクトル探索を行 う。次に、探索した高精度動きベクトルを使用して合成処理 を行い、PSNRの改善効果を判定する。PSNR が改善する場 合は、高精度動きベクトル vm とストリーム中の動きベクト ルの差分ベクトル(3bit)を伝送する。また、各ブロックについ て合成の有無を示す情報(1bit)を付加情報として伝送する。

デコーダではこれらの付加情報を利用して復号画像 I をフ レーム間合成することで復号画像の画質を改善する。2つのフ レーム内のブロックを高精度動きベクトルで動き補償合成す ることで、量子化誤差低減効果が期待できる。

各フレームにおける合成処理を図2.2に示す。Imをブロッ ク分割し、付加情報により合成を行うブロック(A)に対して、

対応する高精度動きベクトルを用いて Im-1 から動き補償し たブロック(B)を用意する。ここで、高精度動きベクトルはス トリーム中のベクトル値に付加情報として受け取った差分ベ クトル値を加えて生成する。ただし、イントラフレームでは ストリーム中にベクトル値が存在しないた

め、エンコーダと同様に復号画像を用いて動きベクトル探索 を行い、ストリーム中のベクトル値の代用とする。この2つ のブロックについて、合成ブロック(C)をブロックC = (ブロ ックA + ブロックB) / 2として生成する。

このように、デコーダではPSNRが向上するブロックのみ 合成が行われ、画質改善したフレーム画像Gm及び動画像G を得る。以降、この手法を手法1と呼ぶ。

F I

復号画像

付加情報

フレーム間 合成処理

エンコード デコード

原画像

G 合成結果画像

デコーダ エンコーダ

ストリーム

・高精度ベクトル

・合成判定 F

F II

復号画像

付加情報

フレーム間 合成処理

エンコード デコード

原画像

G 合成結果画像

G G 合成結果画像

デコーダ デコーダ エンコーダ

ストリーム

・高精度ベクトル

・合成判定

図2.1 手法全体の流れ

第mフレーム

第m-1 フレーム

高精度ベクトル vm

復号ブロック

動き補償ブロック 合成

合成ブロック

合成結果画像 ブロック分割

ブロック分割 復号画像

第mフレーム

第m-1 フレーム

高精度ベクトル vm

復号ブロック 復号ブロック

動き補償ブロック 合成

合成ブロック 合成ブロック

合成結果画像 合成結果画像 ブロック分割

ブロック分割 復号画像

図2.2 各フレームにおける処理概要

手法1による改善結果を図2.3に示す。

図におけるDecoded Imageは復号画像のR-D曲線、Improved

Imageは手法1によって改善した画像のR-D曲線である。画

像は、ITE 標準動画像の No.11:”Buildings along the canal”を QCIFに縮小して使用した。これにより、手法1はビットレー トが高い程有効であることが分かる。次節では、圧縮効率の 更なる改善を目指し、手法1における付加情報であるベクト ルの選出方法、及びその利用方法の改善を提案する。

図2.3 手法1による画質改善効果

100 150 200 250

30 31 32 33 34 35 36

Bit Rate [kbps]

PSNR [dB]

Decoded Image Improved Image

(2)

2.2 付加情報を用いた符号化画質改善 (II)

2.2.1 ベクトル選出条件

手法1では動きベクトル探索を行った後にPSNR向上の判 定を行うため、無駄な探索が発生する。そこで、MSEが最小 になるものではなく、合成によってPSNRが最大となるもの を探索する。これにより、手法1 で探索からもれていた、効 果的なベクトルの探索を行うことが出来る。しかし、PSNR を向上するベクトルをすべて採用すると付加情報量が大きく なり、R-D特性が悪化する。そこで、合成した際にPSNRの 向上が閾値以上となるベクトルのみを採用する。これにより、

PSNR の改善効果が高く、かつ適度な量の付加情報が送信可 能になる。

2.2.2 ベクトル探索対象画像

手法1ではiフレーム目(iは任意の正数)の復号画像Iiを改 善するための合成に用いるブロック及びベクトル探索は、i-1 フレーム目の復号画像Ii-1から行っていた。これに対して、

本稿ではベクトルの合成に使用する画像をIi-1ではなく、手 法1によって画質改善を行った復号画像I’i-1を使用する。こ れを簡単な図にしたものが図2である。

これは単純にPSNRの高い画像を用いるということだけでな く、画質改善の対象となる画像と合成に用いる画像との関係 性を小さくするという目的がある。

フレーム間合成 フレーム間合成

Ii-1 Ii

I’i

フレーム間合成 フレーム間合成

I’i-1 Ii I’i

手法1

提案手法 Ii-1

Ii-2

フレーム間合成 フレーム間合成

I’i-2

フレーム間合成 フレーム間合成

Ii-1 Ii-1 IIii

I’i I’i

フレーム間合成 フレーム間合成

I’i-1

I’i-1 IIii I’I’ii

手法1

提案手法 IIi-1i-1 Ii-2

Ii-2

フレーム間合成 フレーム間合成

I’i-2 I’i-2

図2.4 画像合成の流れ

これはフレーム間の合成によるPSNRの向上が、画像の符 号化による量子化誤差の低減[3,5]に基づくためである。つま り、合成に用いられる画像は、それぞれが独立した符号化に よって独立した量子化誤差を含んでいることが望ましい。し かし、H.263 のようなフレーム間符号化では連続する画像の 相関が高く、量子化誤差も似通った値を持ってしまうため、

フレーム間合成により次のフレーム画像と関係性の小さくな った画像を合成に用いる手法が有効なのである。

3. 実験

提案手法の画質改善効果を確認するために符号化実験を行 っ た 。 実 験 に 使 用 し た 画 像 は ITE 標 準 動 画 像 の No.06:“Intersection”, No.11:”Buildings along the canal”, No16:”Whale Show”, No.19:“Opening Ceremony”をそれぞ れQCIFに縮小したものである。また、動画像符号化には[4]

と同様に H.263+を使用し、付加情報の高精度ベクトルは

1/4pel 精度、ベクトルの探索範囲は動き補償された箇所から

±1pixel以内とした。ここで、手法1に加え2.2.1節の選出条 件の改善を施したもの手法A、それに更に2.2.2節の改善を行 ったものを手法Bとする。

3.1各手法の比較

ここで、2.2.1節の改善で閾値0.2とした手法A、手法Bに ついて手法1との比較を行った(原画像はNo.11)。図5.6は 各手法の R-D 特性を示したものであるが、ほぼ全ての Bit Rateで手法Bが最も優れた結果を示している。これによって、

本稿で提案した改善手法により、手法1に比べ、幅広いビッ トレートでの大きな改善が可能であることが示された。

3.2 各画像による効果

図3.2、他の画像(No.1、No.3、No.8)に対して手法Bを 使用した際の結果(R-D特性)を示す。

8 0 1 0 0 1 20 14 0 1 6 0 18 0 2 0 0

2 8 2 9 3 0 3 1 3 2 3 3 3 4 3 5

Bit Rate [kbps]

PSNR [dB]

Re su lts of Meth od.1 Re su lts of Meth od.A Re su lts of Meth od.B

図3.1 各手法におけるR-D特性の比較

100 150 200 25 0 300 350 400

25 26 27 28 29 30 31 32 33 34 35 36

Bit Rate [kbps]

PSNR [dB]

No.6(De coded) No.6(Method:B) No.16(Decode d) No.16(Method:B).

No.19(Decode d) No.19(Method:B)

図3.2 様々な画像への手法Bの適用結果

No.6 を除いて概ね良好な結果が得られているといえる。

No.6の画像は、静止した背景の前を、さほど大きくない物体 (自動車)が高速で向きを変えながらフレームイン・アウトを繰 り返している。次節で確認実験の結果を示すが、本手法が最 も有効であると考えられるのは画面全体が一方向にシフトし ていくような画像である。これは、動き補償によって、フレ ーム間でほぼ同じ画像を合成出来た場合、実質的に[3,5]にお ける同一画像内で画素シフト及び独立した符号化を適用させ たとみなせるためである。完全に静止している領域では量子 化誤差の低減効果が無く、動きが複雑で正しい動きベクトル の検出が困難な場合は改善効果は小さくなる。そのため、No.6 のような画像では提案手法による画質改善効果が小さくなり R-D特性が悪化したと考えられる。

4. おわりに

本稿では符号化方式の独立性に基づく量子化誤差低減効果

[3,5]を活用した動画像符号化方式として、高精度動きベクト

ルを付加情報として利用した手法、及びその手法についての 改善案を提案し、各種動画像を利用した実験によりその効果 を確認した。

文 献

[1] B.Girod et al, "Distributed Video Coding," Proc. of the IEEE, Jan.2005..

[2] V.K.Goyal,"Multiple Description Coding: Compression Meets the Network," IEEE Signal Proc. Magazine, Sep.2001.

[3] 板垣他: "複数の圧縮画像を用いた量子化誤差低減方式", 2007春季信学全大, A-4-44, Mar.2007..

[4] 石川,渡辺:"画像の不確定性符号化について", PCSJ2006, P-3.02, Nov. 2006.

[5] 板垣他: "複数の圧縮画像の合成時における PSNR 改善 効果の一検討", PCSJ2007, P-2.09, Nov.2007.

図 3.2 、他の画像( No.1 、 No.3 、 No.8 )に対して手法 B を 使用した際の結果(R-D 特性)を示す。  8 0 1 0 0 1 20 14 0 1 6 0 18 0 2 0 02 82 93 03 13 23 33 43 5Bit Rate [kbps]PSNR [dB]Re su lts of Meth od.1Re su lts of Meth od.ARe su lts of Meth od.B図3.1  各手法におけるR-D特性の比較 10015020025 030035

参照

関連したドキュメント

【22】 Tetsuyasu YAMADA, Keiichi KOYANAGI, Hiroshi SUNAGA, and Hajime MATSUMURA: "Reliable Real-time Software Structure for Distributed Switching Nodes",

Mitsuharu Matsumoto, Shuji Hashimoto, "DOA estimation utilizing power inversion adaptive array by aggregated microphones", The 5th IEEE International Symposium on Signal Processing

和音認識 フレームごとに DNCOF ベクトルを求めていくと, 楽曲全体にわたり図 3 のような DNCOF ベクトルの 時系列が得られる.図 3

Ohtsuki, "Scan-Based Attack against Elliptic Curve Cryptosystems, " IEEE ASP-DAC 2010, Poster session, Jan. Ohtsuki, "Scalable Unified Dual-Radix Architecture

動き検出の 検出の改善 複数フレームの合成では誤った領域を合成すると画像 劣化の原因となるため、動き検出の性能が手法全体の

Mitsuharu Matsumoto, Tomomi Abe, Shuji Hashimoto, "Performance evaluation of acoustical array by combining microphones and piezoelectric devices," 2008 IEEE

Proceedings of 2001 IEEE International Symposium on Industrial Electronics "ISIE 2001", FrA4-04, Pusan (Korea). 2001, 6

4 まとめ 本研究では JPEG 画像を対象とし、原画像を参照しな い画質評価手法の提案を行った。通常原画像を用いて 評価する 2 つの手法 PSNR と SSIM について、DCT 係