• 検索結果がありません。

フィールド/フレーム適応DCTを用いた時-空間スケーラブル符号化

N/A
N/A
Protected

Academic year: 2021

シェア "フィールド/フレーム適応DCTを用いた時-空間スケーラブル符号化"

Copied!
7
0
0

読み込み中.... (全文を見る)

全文

(1)

愛知工業大学研究報告

第 3 2号 B 平成 9年

1

5

3

フィールド/フレーム適J;t

DCT

を用いた

時 一 空 間 ス ケ ー ラ ブ ル 符 号 化

S

p

a

t

i

o

TemporalS

c

a

l

a

b

l

e

Video Coding u

s

i

n

g

Adaptive I

n

f

i

e

l

d

l

I

nframe DCT

浅 田

昌俊十

M

a

s

a

t

o

s

r

u

ASADA

沢 田 克 敏

I

K

a

t

s

u

t

o

s

h

i

SA

W

ADA

ABSTRACT This paper describ巴喧 a spatio-temporal resolution scalable coding scheme. Resolution scalability means a coding prope町 wherelower partial resolution pic旬rescan be obtained by decoding only subsets of the total coded bit S仕eam,while吐lefull resolution pic加re1Srecons甘uctedby decoding the total bit stream百usscheme employs企ame

subsampling associated with adaptive interpolation for temporal scalability and adaptive infield/in企ameDCT for spatial scalability. The proposed scheme provides four different spatio・temporalresolutions of a vid巴osequence --two temporal resolutionsヲ eachconsisting of two spatial resolu加ns.This can be applied to interlaced video s巴quenceseffectively Computer simulation results have demonstrated that this scheme has better coding performance compared to conventional non adaptive methods 1 はじめに 本 稿 で は 、 画 像 の 情 報 を 圧 縮 す る た め の 高 能 率 符号化に加え、スケーラピリティを実現するためのス ケーラフツレ符号化について検討する。スケーラピリ ティとは、画像データの伝送、蓄積、受信、表示な どにおいて、装置の性能レベノレに応じてデータの 一 部 あ る い は 全 部 を 用 い て 臨 像 の サ イ ズ や 解 像 度、動きのなめらかさなどを変更できる機能である。 本研究では、時間と空間を組み合わせた時 空間 スケーラブル符号化を行い、再生される時間と空間 の解像度の異なる 4種類の画像について検討するO その中で行われる DCTを用いた空間スケーラブノレ 符号化では、フィーノレド/フレーム適応 DCTを用 いる勺これは、インタレース画像に対して効率よく符 号化でき、空間スケーラフソレ符号化によって再生さ れ る 空 間 的 な 低 解 像 度 画 像 の 品 質 を 改 善 す る こ と ができる。また、時間スケーラブル符号化で時間的 な低解像度画像を再生するために用いるフィールド /フレーム適応内挿もインタレース画像に対して有 効である。 2 時一空間スケーラブル符号化 2・1 時一空間スケーラブル符号化の全体構成 本稿で提案する時 空間スケーラフツレ符号化1)2) 3)は、時間スケーラビリティと空間スケーラピリティを 同時に実現する。そのため、時一空間スケーラブノレ 符号化は、時間と空間のスケーラブノレ符号化を組 み合わせた構成になっている。図 1に 時 空間スケ ーラフツレ符号化の構成を示す。まず、入力される画 像に対して時間スケーラフツレ符号化を行うために奇 数フレームと偶数フレームに分ける。そして、それぞ れのフレームに対して DCTを用いた空間スケーラ ブ勺レ符号化を行い、 DCT係数を低周波成分と高周 波成分に分ける。復号側では、 DCT係 数 の 低 周 波 成 分 の み を 用 い て 空 間 的 な 低 解 像 度 画 像 を 再 生 十 愛 知 工 業 大 学 大 学 院 電 気 電 子 工 学 専 攻 (豊田市) し、低周波成分と高周波成分をすべて用いて空間 I 愛 知 工 業 大 学 情 報 通 信 工 学 科 (豊田市)

(2)

1

5

4

愛知工業大学研究報告,第32号B,平成 9年,Vo 3.l2・B,M紅白 1997 符号化側 「ー符号化デ-$1 Lo

Ho 復号側 再生解像度 空間.低 時間'低 空間:フル 時間.低 空間目

i

!

時間.フル 空間.フル 時間:フル 0:奇数フレーム L:空間低周波成分 e偶数フレーム H:空間高周波成分 図1 時 空 間 ス ケ ー ラ ブ ノ レ 符 号 化 の 構 成 表1 符号化データと再生される画像の関係 解 像 度 対応する 空間 時間 デ}タ 低 低

L

o

フノレ 低

L

o

Ho

低 フル

L

o

,Le フノレ フル

L

o

Ho

L

e

H

e

的なフノレ解像度画像を再生する。また、奇数フレー ムのみを用いて時間的な低解像度画像を再生し、 奇数フレームと偶数フレームを用いて時間的なフル 解像度画像を再生する。このように、時 空間スケ ーラブノレ符号化では、空間的な解像度の異なる2 つの画像と時間的な解像度の異なる2つの画像を 組み合わせることにより、4種類の異なる解像度の 画像を再生することができる。表1に再生される4種 類の画像とそれに対応する符号化データを示す。 2・2 時間スケーラブル符号化 時間スケーラブノレ符号化では、入力される画像を 奇数フレームと偶数フレームに分けて処理を行う。 復号側で、時間的なフノレ解像度画像の再生には、 奇数フレームと偶数フレームの両方の符号化デー タを用いる。一方、時間的な低解像度画像の再生 奇量 偶敢 奇艶 フレーム フレーム フレーム /ー

'¥r

f

l

ネ │ 中

I

Q

ネ │ 中

I 9

I 9

(.)静止している置蟻 O:jl号される画素

/

"

'

¥

/

'

"

¥

/

'

午、↓

千吋

?

?

11

<

1

! 十

《 十

K

1

t

<

I

VTντ

(b)動いている領域 X:補間される画素 図2 フ ィ ー ノ レ ド / フ レ ー ム 適 応 内 挿 の 説 明 には、奇数フレームのデータのみを用いる。まず、 奇数フレームのデータを用いて奇数フレームの商 像を再生し、次に、この奇数フレームの再生画像を 用いて偶数フレームの画像を内挿再生する。 ここで偶数フレームを内挿するためにフィーノレド /フレーム適応内挿1)2)3)を用いる。一般にフレーム 内挿を用いる場合、静止している部分の空間解像 度を保持できるが、動いている部分ではインタレ} ス画像のため時間的な動きの順番が逆戻りする。ま た、フィールド内挿を用いる場合、動いている部分 の時間的な順番は問題ないが、静止している部分 の空間解像度は低下する。フィーノレド‘/フレーム適 応内挿では、フィーノレド内挿とフレーム内挿の長所 を生かすためにその2つの内挿方法を適応的に切 り換えるようにする。すなわち図2に示すように、静

(3)

フィーノレド、/フレーム適応DCTを用いた時一空間スケーラフツレ符号化 155 (a) 符号化側 DCT離散コサイン変換 IDCT逆離散コサイン変換 日。量子化 MCP動き補償予測 (b)復号側 VLC可変長符号化 VLD可変長復号化 L:低周波成分 H高周波成分 低解像度画像 フル解像度画像 図3 MC予 測 DCT空 間 ス ケ ー ラ ブ ル 符 号 化 の 構 成 止している領域ではフレーム内挿を、また、動いて いる領域ではフィー/レド内挿を用いる。フレーム内 挿では、図2(的に示すように内挿される偶数フレー ムの1つ前の奇数フレームの第1フィーノレド、と第2フ ィーノレドの画素がそれぞれ補間される偶数フレーム の第1フィーノレドと第2フィーノレドの画素となる。一 方、フィーノレド内挿では、図2(b)に示すように内挿さ れる偶数フレームの第1フィーノレドは1つ 前 の 奇 数 フレームの第2フィールドから空間的な画素のずれ を補正するように補間され、また内挿される第2フィ ーノレドはlつ後の奇数フレームの第1フィーノレド、から 補間される。 2・3 空間スケーラブル符号化 2・3・1 MC-DCT空間スケーラブル符号化 図3にMC予 測DCT空間スケーラブノレ符号化4)5) の構成を示す。符号化側では、入力画像を8画素 X8ラインに分割したブロックに対してDCTを行い、 その64個の DCT係数を低周波(L )成分(16個) と高周波(H )成分 (48個)に分ける。その 2つの成 分は、それぞれ MC予測符号化される。 L成 分 ル ープでは、 16個のL成分の係数とH成分の係数を 0にしたものに対して IDCTを行い画像領域に戻し てMC予測を行う。そして、予測画像に対して DCT を行い H 成分の係数は除去して次のフレームの L 成分との差分をとり、量子化して符号化する。一方、 H 成分ループでは、 48個の H 成分の係数と L 成 分ループで用いられるL成分の係数に対してIDCT を行い画像領域に戻して MC予測を行う。そして、 予測画像に対して DCTを行い L成 分 の 係 数 は 除 去して次のフレームの H成分との差分をとり、量子 化して符号化する。 復号側では、 L成分と H 成分のデータをそれぞ れ復号し、符号化側と同じ MC予測ループで得ら れた予測画像の DCT係数との和をとる。そして、 L 成分のデータのみを用いると空間低解像度画像が 得られ、 L成分と H成分の両方のデータを用いると 空間フル解像度画像が得られる。 2・3・2 フィールド/フレーム適応DCT インタレース画像を効率よく符号化するためにフ ィールド/フレーム適応 DCT1 )2)3)5)引を用いる。フィ ーノレド、/フレーム適応 DCTでは、 DCTを行うブロ ックをフィールド単位、またはフレーム単位のいずれ の構成にするかを適応的に切り替えることにより、画 像全体をフィーノレド単位やフレーム単位の構成の DCTで、行うより効率よく符号化することができる。

(4)

愛知工業大学研究報告,第32号B,平成9年,Vol.32聞B,Mar. 1997 - 第1フィーlレド面禁 0 第 2フィーJレド画素 刊 M

o

O

G

0

0

0

0 .

川 ・

0

0

O

O

0

O

O .

刊 M

o

O

G

0

0

0

0

・ 。

η

0

0

0

0

0

O

O .

什 ・

0

0

0

0

0

0

0 .

叩 ・

C

O

0

0

0

0

0

o

h F B

o

0

0

0

0

0

0

・ 。

ー 一 s

o

O

G

0

0

0

0

・ 。

- E z -- 0

O

O

0

0

0

0

o

-s

o

0

0

0

0

0

0

・ 。

5

0

0

0

0

0

O

G

0 4

G

O

0

0

0

0

0

0 3

0

0

0

0

0

0

0

0 2

0

0

0

0

0

0

0

0 1

0

O

G

O

G

0

0

・ 。

D

O

0

0

0

0

0

0 .

nunU4Z4a 内 5 4 内 5 4 q ベ w q ︾必崎刈“ T R E M R 叫 R O R O 守 F ヲ f I l l l ψ

1

5

6

~ 89101112131415

0

.

.

.

.

.

.

.

.

000000000 ι1

1100000000 J

1

2

••••••••

T

3

200000000

.

.

.

.

.

.

.

.

300000000 ~ 89101112131415 4

400000000

5

.

.

.

.

.

.

.

.

1500000000 J T

I

7

6

600000000

.

.

.

.

.

.

.

.

700000000 (C)フレーム単位の構成 一一ー+ 01234567

0

.

.

.

.

.

.

.

.

000000000 .1

1100000000 J

1

2

••••••••

T

3

200000000

.

.

.

.

.

.

.

.

300000000 ~ 01234567 4400000000

.

5

.

.

.

.

.

.

.

.

1500000000 J T1 6600000000

7

. 700000000 (a)原画像の分割されたブロッヲ

-“ .

. .

. .

. .

.

炉 内 ・ ・ ・ ・

・ ・ ・ ・

i

η

・ ・ ・ ・ ・ ・ ・

一什 . . . . . . . .

白 叩

-9 ... . B . . . . . . . . 0 1 2 3 4 5 6 7 I l l i -v 一一ー+ o 1 234 567

0

.

.

.

.

.

.

.

.

1

2

.

.

.

.

.

.

.

.

13... J T1

7

6

45 • • • • • • • •

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

ーム, 89101112131415 000000000 100000000 .200000000 1300000000 J

I

400000000 T500000000 600000000 700000000 b}フィールド単位の構成 一一ー+ o 1 234 567 000000000 100000000 .200000000 1300000000 J 1 400000000 T500000000 600000000 700000000 フィーノレド/フレーム適応

DCT

の ブ ロ ッ ク 構 成 このフィールド/フレーム適応

DCT

MC

予測

DCT

空間スケーラブソレ符号化に取り入れることによ り、再生される空間的な低解像度画像の品質を向 上させることができる。 (1)

mzzs(│

い 制

1

+

1

先 制

1

)

)

本稿で提案した時 空間スケーラブノレ符号化の 計算機シミュレーション実験を行った。図1の構成で

m=ZS(│M11+│yrM)

お~.:第1フィーノレド画素直 Y;j:第2フィーノレド画素値 3.シミュレーション実験 実験内容 3.1

DCT

を行うブPロックの構成は、図

4

(

砂のように原画 像を互いに重なり合わない16画素X16ラインのブ ロックに分割し、図4(b)のように4つのフィールド単 位のブロックか、または図4(c)のように4つのフレー ム単位のフ守ロックに分割して

8X8

DCT

を行う。

DCT

を行うフゃロックの構成を切り替える方法は、 図4(的のブロックのま垂直方向の隣接する画素の相 関が低いときはフィールド、単位のブロック構成をし、 垂直方向の隣接する画素の相関が高いときはフレ ーム単位のブロック構成をする。その垂直方向の相 関の強さを求めるには、式(1)によって垂直方向のフ ィーノレド内差分絶対値和 Dl、また式(2)によって垂 直方向のフィーノレド間差分絶対値和 D2を計算す る。 Dl ;;;D2のときは、フィーノレド内での相関の方 が強いのでフィーノレド、単位でフ守ロックを構成する。ま た、 Dl

>

D2のときは、フィールド聞での相関の方 が強いのでフレーム単位の構成をする。 図4

(5)

フィールド/フレーム適応DCTを用いた時 空間スケーラフツレ符号化 時←空間スケーラフツレ符号化を行い、時間と空間 の解像度の組み合わせによって再生される4種 類 の画像について検討した。また、フィールド/フレ ー ム 適 応 DCTを用いた場合の効果を確認するた め、フィーノレド DCT(画像全体をすべてフィールド 単位の DCT)とフレーム DCT(画像全体をすべて フレーム単位の DCT)を用いた場合と比較検討し た。実験条件を以下に示す。 -使用画像 Cheerleader, Flower garden, Table tennis . DCT ブロックサイズ:水平8画 素 × 垂 直8ライン . M C ブロックサイズ水平16画 素 × 垂 直8ライン 探索範囲. 水平::t31X垂直土15(奇数フレーム) 水平土15x垂直::t7 (偶数フレーム) l画 素 精 度 の 全 探 索 3・2 実験結果および考察 (1)時間フノレ 空間フノレ解像度画像 図5は時 空間スケーラブル符号化によって得ら れる時間ブルー空間フル解像度画像に対する符号 化特性である。フィーノレド/フレーム適応 DCT ( Adaptive DCT )、フィーノレドDCT( Infield DCT )、 フレームDCT(Inframe DCT)を用いた場合の3つ を比較している。この図で、横軸は画像を再生する ために必要な符号化エントロビーで、 1画素あたりに 必要な情報量(単位・[bit/pelJ)を表している。縦軸は 原画像に対する再生画像品質を SNR(単位:[dB]) で表している。 この図から、 3つの DCTの差は同じエントロビー で SNRを比較したとき l[dB]以内であることがわか る。実際に再生した画像を観察した結果、 3つの DCTの違いによる差はほとんど、確認で、きなかった。 したがって、時間フノレー空間フノレ解像度画像の場 合には、符号化特性と実際に再生画像を観察した 結果から DCTの違いによる大きな差はほとんどな いと言える。 (2)時間フル 空 間 低 解 像 度 画 像 図6は時 空間スケーラブノレ符号化によって得ら れる時間フルー空間低解像度画像に対する符号化 特性である。この図から同じエントロビーで SNRを

1

5

7

4 2 0 8 4 4 4 3

.

.

.

.

I

1/

J

1

s

f

宅36

'

"

z 34 (f} 2 0 8 3 3 2 26 0.0 0.5 1.0 1.5 2.0 2.5 3.0 E ntropy[bit/pe 1] -+-Adaptive DCT ---l:トーInfieldD CT -6-lnframe DCT 図5 時間フノレー空間フノレ解像度画像 の 符 号 化 特 性 (Cheerleader ) 34

v

γ f In ロ -32 30 ロ ョ

2 ~ 28 Z (f} 26 24 22 0.0 0.2 0.4 0.6 0.8 1.0 1.2 E ntro py[bit!pel] -<砂-AdaptiveDCTー£トーInfieldD CT -trー InframeDCT 図6 時 間 フ ノ レ ー 空 間 低 解 像 度 画 像 の 符 号 化 特 性 (Cheerleader ) 比較したとき、フィーノレド/フレーム適応 DCTを用 いた場合、フィールド DCTやフレーム DCTを用い たときより最高で 3.5[dB]程 SNRが高いことがわか る。実際に再生した画像を、図7、図8に示す。図7 のように動いている領域でフレーム DCTを用いると 画像がぼやけてしまうが、フィーノレド/フレーム適応 DCTを用いた場合には良好な画像が得られる。ま た、図8のように静止している領域(家の屋根の部 分)でフィーノレド、 DCTを用いると画質劣化が大きい が、フィーノレド/フレーム適応 DCTを用いるとフィ

(6)

1

5

8

愛知工業大学研究報告,第32号B,平成9年,Vol. 32・B,M紅 1997 フ レ ー ム DCT フ ィ ー ル ド / フ レ ー ム 適 応 DCT 図 7 空 間 低 解 像 度 画 像 の 動 い て い る 領 域 の 例 フィーノレド DCT フ ィ ー ル ド / フ レ ー ム 適 応 DCT 図 8 空 間 低 解 像 度 画 像 の 静 止 し て い る 領 域 の 例 ールド DCTを用いた場合より画像品質が良くなる。 つまり、フィールド/フレーム適応 DCTを用いた場 合、フィールド、 DCTやフレーム DCTを用いた場合 に比べ画像品質が向上することがわかる。このよう に、符号化特性と実際に再生画像を観測した結果 からフィールド/フレーム適応 DCTの効果が確認 された。 (3)時間低 空間フル解像度画像 時間低一空間フル解像度画像は、符号化データ から復号される奇数フレームを用いて偶数フレーム を内挿している。そのため、時間低 空間フノレ解像 度画像を再生するために必要な符号化エントロピー は、時間フルー空間フ/レ解像度画像の場合の約半 分になる。再生画像を観察した結果、偶数フレーム の内挿にフィールド/フレーム適応内挿を用いたた め、フレーム内挿のような動き順番の逆転の問題は なく、また、フイ}ノレド内挿のような静止部分の空間 解像度の低下も生じなかった。 (4)時間低一空間低解像度画像 時間低一空間低解像度画像も、符号化データか ら復号される奇数フレームを用いて偶数フレームを 内挿している。そのため、時間低一空間低解像度 画像を再生するために必要な符号化エントロピー は、時間フルー空間低解像度画像の場合の約半分 になる。再生画像を観察した結果、この場合もフィ ールド/フレーム適応内挿の効果が確認された。 4.むすび 本稿では、フイ}ルド/フレーム適応 DCTとフィ ールド/フレーム適応内挿を用いた時一空間スケ ーラフ守ル符号化について検討した。計算機シミュレ ーション実験の結果、時 空間スケーラブル符号化 を行うことにより、復号側で時間と空間の解像度の 異なる4種類の画像を再生することができた。また、 インタレース画像に対してフィーノレド/フレーム適 応 DCTを用いることにより、フィーノレド DCTやフレ ーム DCTに比べ、空間的な低解像度画像の品質

(7)

フィーノレド、/フレーム適応DCTを用いた時 空間スケーラブノレ符号化 159 を改善することができた。さらに、フィーノレド/フレ ーム適応内挿の効果も確認することができた。 文献 1)浅田,沢田・"フィーノレド/フレーム適応 DCTとフ レーム内挿を用いた時一空間解像度階層符号化 1996年 電 子 情 報 通 信 学 会 総 合 大 会 D-260, 1996.3 2)浅田,沢田"フィーノレド、/フレーム適応 DCTを 用いた時一空間解像度階層符号化" 1996年テ レビジョン学会年次大会 23-6,1996.7.

3) M.Asada and K.Sawada・"AScalab1e Video Coding Scheme Based on AdaptiveInfie1d1Inframe DCT and Adaptive Frame Interpolation", Proc. IWISP'96, pp.257・260,Nov. 1996. 4) M.Nakamura and K.Sawada: "Scalable Coding Schemes based on DCT and MC Prediction", Proc ICIP'95, vo1.2, pp.575-578, Oct. 1995. 5)浅田,沢田"インタレース画像に対する動き補償 予測DCT階層符号化" 1995年 電 気 関 係 学 会 東 海 支 部 連 合 大 会 553,1995.9. 6)八島,上倉,沢田・"適応ブロック構成 DCTを用 いたHDTV圃標準TVコンパチブツレ符号化" 1989 年 電 子 情 報 通 信 学 会 秋 季 大 会 D・54,1989 ( 受 理 平 成

9

3

月21日〉

参照

関連したドキュメント

①物流品質を向上させたい ②冷蔵・冷凍の温度管理を徹底したい ③低コストの物流センターを使用したい ④24時間365日対応の運用したい

AMS (代替管理システム): AMS を搭載した船舶は規則に適合しているため延長は 認められない。 AMS は船舶の適合期日から 5 年間使用することができる。

弊社または関係会社は本製品および関連情報につき、明示または黙示を問わず、いかなる権利を許諾するものでもなく、またそれらの市場適応性

前項では脳梗塞の治療適応について学びましたが,本項では脳梗塞の初診時投薬治療に

気候変動適応法第 13条に基 づく地域 気候変動適応セン

適応指導教室を併設し、様々な要因で学校に登校でき

Abstract: The method to calculate the damping ratio of the system relevant to chatter vibration and to identify the time series model using the adaptive filter are

◎ペルー特恵税率が新たに適用され、それと同時に一般特恵 一般特恵( (GSP GSP) )税率 税率