JPEG2000 Precinct構造を用いた低遅延HDTV符号化方式
6
0
0
全文
(2) 符号化方式 佐野 雄磨Ý. 内藤 整ÝÝ. 渡辺 裕Ý. Ý 早稲田大学 大学院 国際情報通信研究科. 〒 東京都新宿区西早稲田 ÝÝ 株式会社 研究所. 〒
(3) 埼玉県上福岡市大原
(4) 丁目 番 号. Ý. 化の流れにある. 素材の高品質伝送を目的として、 による 符号化の研究が行われてきた.放送局間の素材伝送や番組 配信においては伝送遅延の低減がユーザ要求として強く求められるが,ビデオフレームといった 符号化処理単位を大きく設. あらまし. 近年,ディジタル放送の開始に伴い映像素材は. 高い圧縮率とスケーラビリティを持つ. 定するにつれて符号化遅延は大きくなる.これに対し,入力画像を分割しそれぞれ独立して符号化し伝送するという手法が 考えられる.これまでにもタイルを用いた分割符号化が検討されてきたが,低ビットレート時に発生するタイル歪みや,符号. の
(5) 構造を利用して,分割による境界歪を発生さ. 化効率の低下という問題点があった.そこで本稿では, せずに低遅延で符号化する手法について検討する. キーワード. , ,低遅延符号化,タイル,
(6) ,ビット配分,バッファリング. . Ý
(7) ÝÝ
(8) Ý Ý. ! "# $ % &$!& & '&& "() *&+! ,# ( "#&--( '-( .& ÝÝ /% 0#!
(9) ( #---#( "(
(10) .& Ý.
(11)
(12)
(13)
(14)
(15)
(16) ! " . "
(17)
(18)
(19)
(20) "
(21)
(22) Æ
(23)
(24)
(25)
(26) # $
(27)
(28) !
(29)
(30) "
(31)
(32) " "
(33)
(34)
(35)
(36) "
(37)
(38) "
(39)
(40)
(41) "
(42) $
(43)
(44)
(45)
(46)
(47) $
(48) $
(49)
(50)
(51) $
(52)
(53) "
(54) $
(55) $ $
(56)
(57)
(58)
(59)
(60)
(61) .
(62) $
(63)
(64)
(65) , %
(66) −7−. 1. 1.
(67) はじめに
(68) 年
(69) 月から,地上波ディジタル放送が一部 の地域で始まった.ディジタル放送によって,従来 のアナログ放送の チャンネル分と同じ周波数帯域 幅で 2 '3 を配信することが可能になる.これに伴 い,映像素材は 2 '3 化の流れにある.2 '3 素 材の高品質伝送を目的として,高い圧縮率とスケー ラビリティを持つ .4
(70) 5 6 による 2 '3 符号 化の研究が行われてきた 5
(71) 6. 放送局間の素材伝送や番組配信においては伝送遅 延の低減がユーザ要求として強く求められる.しか し,ビデオフレームといった,符号化処理単位を大 きく設定するにつれて符号化遅延は大きくなる.例 えば,74 などの動画像符号化では,フレーム単 位の符号化処理を適用しており,この場合,符号化 に先立ち符号化対象となる画像データの読み込みが 完了するのに最低でも フレーム分 8約 9 待た されることになる.これに対し,入力画像を分割し それぞれ独立して符号化することによって伝送遅延 を低減するという手法が考えられる 56 5:6.これまで にも .4
(72) のタイル構造を用いた分割符号化が 検討されてきた.しかし,入力画像をタイルに分割 し,各タイルを独立に符号化するために,低ビット レート時にタイルの境界付近で発生する歪みや,符 号化効率の低下という問題点があった.そこで本稿 では,.4
(73) の 4!& 構造を利用して,分割 による境界歪を発生させずに低遅延で符号化する手 法について検討する.. 従来の低遅延符号化手法 低遅延符号化の概念 まず,本研究では .4
(74) の符号化をハードウェ ア上で行うことを想定している.ハードウェア上で .4
(75) の符号化を行う場合,ウェーブレット変 換以降の処理が一瞬で行えると考えられるため,一 連の符号化過程の中で最も時間がかかるのは,入力 画像の読み込みであるといえる.符号化処理単位を フレームとすれば,フレームのサイズが大きくなる に従って,読み込み時間は大きくなり,結果として 符号化遅延が増大する.これに対し,入力画像を空 間的に分割し,読み込んだ領域から順次符号化を開 始することによって符号化の遅延時間を減少させる 方法が考えられる..4
(76) では,この分割領域 としてタイルを用いて符号化することが可能である.. . タイル化. .4
(77) では,入力画像を矩形のタイルに分割 可能である 5 6.分割された各タイルは,タイル境界 を越えての画素参照は行わず独立に符号化,復号さ れる.サイズの大きい画像を符号化する際には,タ イルを用いて並列的に符号化,復号することによっ て処理を軽減し,遅延を減少することが可能である. しかし一方で,低ビットレート時には,タイルの境 界付近は画素値の不連続性が生じるという欠点があ る 56 56.. タイル化歪 入力画像から分割されたタイルは,それぞれ独立. に符号化される.+ 変換の際に,タイルの境界 の係数ついては,係数を折り返すことによってタイ ル外部への係数値を得て + 変換を行う.一方 で,タイル分割しない場合は,タイル境界にあたる 位置の係数は折り返し処理を行わず,フィルタ長の 係数を参照して + 変換を行う.タイル分割を 行うと,接する
(78) つのタイルで折り返し処理によっ て + 変換が行われるために,その境界に不連 続性が生じ,画質の劣化の原因となる.特に低ビッ トレート時にその傾向は顕著である.図 にタイル 化歪の様子を示す.画像を中央に水平な歪が確認で きる.. Tile 1. Tile 2. 図. &. ' (. ' (. タイルの分割法 左 とタイル化歪 右. .4
(79) のタイル分割を用いて,2 '3 素材の 低遅延符号化を行う場合,このタイル化歪を除去ま たは低減することが必要となる.本稿では,分割の 単位をタイルではなく 4!& を用いることにより, 境界の不連続性による歪を発生させない低遅延符号 化手法を検討する.次章で,その手法について説明 する.. を用いた低遅延符号化 . .4
(80) の符号化手順の中で,コードブロック は集められて 4!& という領域を形成することが 可能である.4!& は単なるコードブロックの集 合であり,4!& サイズはコードブロックサイズを 考慮して設定する必要がある 5 6.タイルとは異なり, 4!& を設定することによって符号化や画質には 影響を与えることはない 5;6.また,4!& の大き さは,
(81) のべき乗である必要があるが,そのサイズは 各解像度レベルで異なる値をとることが可能である. また,.4
(82) では,タイルパートごとにパケッ トの順序を決めることが可能である.4!& は, パケット順序を決める単位の一つであり,4!& ごとにパケットを連続的に配置可能である.特定の 4!& 情報を得たり,空間的なランダムアクセス などを行う際に有用である 5 6 56.以下に,タイルに よる分割と 4!& によるの違いを示す. 入力画像の上下二等分をタイルとして設定した場 合のサブバンド分割の様子を図
(83) に,4!& とし て設定した場合のサブバンド分割の様子を図 に示 す.サブバンド分割を 段階した後の最低域成分に おけるタイルもしくは 4!& が図の右側の黒色部 分にあたる.タイルはそれぞれのタイル内でサブバ ンド分割が行われ,4!& は画像全体でサブバン ド分割された後,4!& として分割される.. −8−. 1
(84) 1.
(85) LL3 HL3 LH3 HH3. HL2. LH2. HH2. 段階. LH1. DWT 3. LL3 HL3 LH3 HH3. HH2 HL2. LH2. HH2. LH1. 図. . 長よりも多くオーバーラップさせて分割すれば,注 目領域に関しては分割の影響なく )' を行うこと が可能である.つまり,分割しないで符号化した場 合と同じ結果が得られる.. HL1 HH1. 提案手法の概要. HL1. 提案手法の概要を図 に示す.. HH1. loading chip1. タイル構造のサブバンド分割. chip2. ・・・. Precinct 1. HL3 LH3 HH3. 段階. LH2. Precinct 2. HL2. Precinct 3 Precinct 4. HL1. ・・・. HH2. = Overlap Line. DWT 3. PrecinctN-1 Precinct N. LH1. HH1. 図. ,. 提案手法の概要図. 提案手法を送信側,受信側のついてそれぞれの動 作を説明する. 図 )
(86) 構造のサブバンド分割 9 送 信 側 伝送の単位として 4!& を用いる.図 のよう
(87) 変換の有効タップ長 に,入力画像の上端から水平に 4!& を設定する. そして,チップを複数使って,順次 4!& を読み込 )'8 !)+'!&$!9 での低域成分 んでいく.まず, 番目のチップは,第 4!& と は, )' ローパスフィルタを多段にかけることに オーバーラップ分のラインを読み込み符号化を行う. よって得られる 5 6.ここで,最低域成分の 画素 符号化終了後,第 4!& のデータだけを受信側 が符号化されるのに参照した画素数のことを「有効 へ伝送する.その間,
(88) 番目のチップは第
(89) 4!& タップ長」とする.有効タップ長は )' のレベル とその上下のオーバーラップ分のラインを読み込み 数とフィルタのタップ数から求めることが可能であ 符号化を行う.符号化終了後第 4!& と同様に, る. × ; フィルタを用いた時の,有効タップ長の 4!& のデータのみを送信する.その後も, 注目 様子を図示したものを図 : に示す. 残っているチップや符号化の終了したチップを用い て,同様に符号化を行う. %9 受 信 側 original 受信側では,4!& ごとにデータを受信する. .4
(90) では,4!& 構造をとる場合,全ての down sampling 4!& がそろわなくては,画像全体を復号するこ とは出来ない.しかし,一つ後の 4!& を受信す れば,その前に受信した 4!& に関しては,復号 しそのデータを得ることが可能である.したがって, × 受信側では,注目している 4!& を復号するため ・ ・ に一つ次の 4!& の受信を待たなくてはならない が.しかし,4!& のサイズはフレームと比較し 図 * + フィルタ長と段階数 て小さく,フレームを符号化単位とした時に比較し て,最初のデータを得るまでの遅延時間が小さくな )' のレベル数を ,フィルタのタップ数を と るといえる.オーバーラップをとっていれば,注目 すると,有効タップ長は以下のように表される. 4!& に境界歪が生じることはないので,4!& を小さく取ることによって,符号化遅延をますます 有効タップ長 < 8
(91) 98 9 = 低減することが可能である. DWT filter (t:9tap). LL(n-1). LL(n=2). LL(n=5). 例えば, × 整数フィルタを用いて, 段階 )' を行うと有効タップ長は 8
(92) 98 9 =. <
(93) . となる.すなわち,注目画素の周辺
(94) 画素がそ の画素の符号化に影響を与えることになる.以上よ り,画像を分割して符号化する際に,この有効タップ. ビット配分 前節で述べたように,提案手法では,4!& を 上から順番に読み込んだものから符号化を行う.そ のため,ある 4!& を読み込み符号化する時点で は,それ以降の 4!& の画像情報はまったくわか らない.通常,入力画像全体で符号化する場合は,画 像全体で + 変換を行い,画像全体の画像特性に 基づいて,> 最適化によって各 4!& にビット配. −9−. 11.
(95) 分される.しかし,提案手法の場合,他 4!& の 画像特性もわからないため,ある 4!& を符号化 する時点で最適なビット配分を行うことは困難であ る.仮に各 4!& に同じビットレートを割り当て て符号化を行うと,4!& によって情報量が異な るため,情報量が少ない 4!& に余分なビットが 割り当てられたり,情報量が多い 4!& に十分に ビットを割り当てられないという事態が発生し,結 果的に画像全体で符号化したときと比較して,画質 が劣化する. そこで,本稿では前フィールドのビット分布を用 いて,それ以降のフィールドのビット配分を最適化 することを考える.提案するビット配分手法を図示 したものを図 に示す. for each precinct Precinct 1 Precinct 2. Scalar Quantization. ・ ・. truncation. transmission. 情報は類似していると考えられるので,これによっ て画像全体の特徴を考慮したビット配分を行うこと が可能である.. ビット配分の実験 前節で述べた,ビット配分手法について実験を行っ た.入力画像には, ' 標準画像の "!!8
(96) × ,
(97) :%9 を用いた.符号化の条件として,?; フィルタを用い, 段階 )' を行い,ビットレート は % とした.さらに,4!& サイズを
(98) : × : とし, フィールドに 4!& 存在するよう に設定した.また,プログレッションは 4@>/ であ る.本手法では,フィールドベース符号化を行うた め,まず第 フィールドを上端から順次読み込み符 号化を行う.そして,各 4!& でスカラー量子化 を行い,その後の符号量を記録した上で,ポスト量 子化を行い符号量を調整する.表 に第 フィール ドの各 4!& の量子化後の符号量の割合を示す.. & スカラー量子化後の各
(99) の符号 量の割合
(100) 符号量の割合
(101) 符号量の割合 第& -,第 &,.第 /), 第. &,,0 第) & / 第0 -./ 第* &**0 第/ )第, &-&) . Precinct 3. Field 1. 表. Distribution of bits for each precinct. Precinct 1 Precinct 2. Scalar Quantization. ・ ・. truncation. transmission. Precinct 3. Field 2 ・ ・. フィールドに割り当てられるビット量は,
(102) × : × < :: %. ・ ・. 図. -. 提案ビット配分手法の概念図. まず,最初のフィールドに関しては,前フィールド の情報も無く,各 4!& に最適なビット配分を行 うのは不可能であるため,各 4!& について,想 定ビットレートで符号化を行う.その際,.4
(103) の符号化処理の中で,まずスカラー量子化を行い,そ の後ポスト量子化によって,想定ビットレートに調 整する.ここでスカラー量子化後の各 4!& の符 号量を記録しておく.各 4!& のスカラー量子化 後の符号量は,その 4!& の情報量の指標となる ため,この値を記録し,注目 4!& の符号量が全 体の符号量のどれくらいの割合になるかを算出する. 第
(104) フィールド以降は,一つ前のフィールドの注目 4!& のスカラー量子化後の符号量の全体に対す る割合を, フィールドに割り当てられる符号量に かけて,その 4!& に配分するビット量を決める. フィールドごとの符号量は,フィールドサイズ とビットレートによって求められる.フィールドの 縦の長さを ,横の長さを ,ビットレートを とすると, フィールドに割り当てられる符号量 は, < × × と表される. 第 & フィールドの第 -4!& の符 号量の割合を とすると第 &= フィールドの第 -4!& に割り当てられる符号量 は以下の ように計算可能である. . . < × . 動画像では,前フィールドと次フィールドの画像. である.従って,第
(105) フィールドで各 4!& に 割り当てられるビット量は表
(106) のようになる..
(107) 第& 第 第) 第* 第, 表. .
(108) に割り当 '(
(109) 符号量 '( ,**&& &) .&/ ..,, . &/& ./ 0 ,-)&0 & & / . )/ &)).00 . 第 フィールドで各 てられる符号量 符号量 第 第 第 第 . また,画像全体で符号化しビット配分した時の各 4!& のビット量を表 に示す.. ) フィールド全体で符号化した場合の各
(110) の符号量
(111) 符号量 '(
(112) 符号量 '( 第& ,*) * 第&0-,第 ./* 第. &0)- 第) /0/- 第0 - *0 第* &&0.-0 第/ ./第, &)0 表. 表
(113) と表 より,提案手法によって,画像全体で 符号化しビット配分した時とほぼ同様のビット配分 が行われていることがわかる. 次に,画像全体で符号化され理想的なビット配分 が行われた画像と,提案手法によって符号化された 画像の品質を比較した. 4",> 5A6 理想的なビット配分 :
(114) 提案手法 :
(115) ;. 1:1 −10−.
(116) この結果から,提案手法は理想的なビット配分に近 い 4",> を取ることがわかる.また,オーバーラッ プをとって符号化を行ったために,境界の不連続性 による視覚的な画質の劣化が生じていない.従って, 低ビットレート時も境界の不連続性を発生させるこ となく画質を維持することが可能である.. バッファリング 本手法では,各 4!& には,最初のフレームを 除いて異なるビット量を割り当てて符号化し,伝送 する.そのため,@A>8@&& A >9 回線で伝 送する場合には送信側( 受信側で,バッファリングが 必要となる 5 6.バッファリングは,伝送遅延の一 因となりうるが,符号化の単位をフレームとした時 と比較して,4!& のサイズが小さいため,大き な遅延が生じないようにバッファを設計することが 可能である. 提案手法を用いた場合のバッファモ デルを考える.図 ; に受信側のバッファモデルと送 信側のバッファモデルを示す.. 送信側バッファと受信側バッファのビット量の合計 をバッファサイズ となるので,受信側のビット量 8 9 は,以下のように表される. 8 9 < < . . < . 8 9 =. . ・・・. p1 p2 p3. Delay. 符号化側バッファのビット量 + 復号側バッファのビット量 ∥ バッファサイズ. t. L. L. 送信側 バッファ. 8 9 =. 図. .. p1 p2 p 3. . 8 = 9 <. は - 番目の 4!& が符号化,もしくは復号さ れる時点を表す.伝送ビットレートを ,フィール ドレートを ,各フィールドの 4!& 数を とす. ると, . ×. . という関係を持つ.また, はバッファサイズ を 用いて, < と表すことが出来る.8 9 このバッファリングモデルにおいて,あるフィー ルドの 番目の 4!& の符号化が終わった時,送 信側バッファには,. . 8 9 . 8 9. .
(117) . . 89. 8 = 9 < 8 9 = . 8:9. . 8
(118) 989 式をまとめると
(119) . . . . . 8 9 =. 8 = 9. . < . と表すことが出来る.また, は受信側のバッ ファリングによる遅延時間で, とは,. <. 8
(120) 9. となる.8 9 式を 8:9 式に代入すると. 受信側と送信側のバッファモデル.
(121) <. 8 = 9 <. ¸ 8 = 9 8 9 =. t. <. 8 9. . . 8 9 =. Delay. 8 9. 9 オーバーフロー
(122) 8 9 = 8 = 9. ・・・. L-Lo. 8 9. 9 アンダーフロー. L. 受信側 バッファ. 8 9 =. . 次に, 番目の 4!& について,オーバーフロー とアンダーフローを防ぐ条件をそれぞれ以下に示す.. ¸ 8 9 = Lo. 8 9. = 8 9. のビット量が存在する. 88 9 は 番目の 4!& のビット量, は送 信側バッファの初期値9. . . 8 9 =. 8 = 9 . . 89. となり,&= 番目の 4!& のビット量が満たすべ き条件が求められた.この中で,前章のビット配分 で各 4!& に割り当てられるビット量は決まって いるので,全ての 4!& について 89 式を満たす ようなバッファ量 を求め,バッファを設計するこ とが可能である. 想定する条件として,伝送ビットレート<7%, フィールドレート<$,4!& 数<, < を 考える.この条件の下,全ての 4!& で 89 式を 満たすバッファモデルの フィールド分のバッファ 占有量の例を,"!!, !&!-,0& &B!& の 種類の標準画像について図 ,( に示す. 図 ,, のバッファモデルでは, は -% であり,送受信含めた遅延は ; × となる. 従って,バッファを用いることによって符号化遅延 は生じるが,符号化単位を 4!& としているため, 遅延時間は少なくおさえることが可能である.. 11 −11−.
(123) ま と め. バッファ占有量の変化. 350000 300000 it]b[ 250000 量有200000 占ァ150000 フッ バ100000 50000 0. 0. 0.02 図. 0. 0.04. 時間 [sec]. バッファ占有量. 0.06. 0.08. 本稿では,2 '3 解像度の映像素材を .4
(124) の 4!& 構造を利用することによって低遅延かつ 境界歪の生じない符号化手法を提案した.その上で, 問題となる各 4!& へのビット配分,そしてバッ ファリングモデルについて中心に検討した.提案手 法により,理想的なビット配分に近い結果が得られ ることがわかった.さらに,提案手法に基づいたバッ ファを設計することによって,低遅延で固定ビット レートで伝送可能であることを示した. 今後の課題として,ポスト量子化処理を考慮した, より精度の高いビット配分を実現させることが挙げ られる.. 0.1. '#
(125)
(126) (. 文. 350000 300000 ]it 250000 b[ 量有200000 占ァ150000 フッ バ100000 50000 0. バッファ占有量の変化. 0. 0.02. 図. /. 0.04. 時間 [sec]. バッファ占有量. 0.06. 0.08. 0.1. '
(127) " 1
(128) (. バッファ占有量の変化 350000 300000 it][b 250000 量200000 有 占 ァフ150000 ッ バ100000 50000 0. 0. 図. 0.02. &. 0.04. 時間 [sec]. バッファ占有量. 0.06. 0.08. 献. 3&4 #256 6&5#6/5+& '78 #80( 9&-*-: 6 #
(129) ; < 6"8 "
(130)
(131)
(132) & ,= > 34 ?
(133) "
(134)
(135) @ <?
(136) @
(137) A
(138) 8B
(139)
(140)
(141) 6
(142) " = :
(143) 0 #
(144)
(145) 6
(146) * 3)4 6
(147) >
(148) A
(149) < 8
(150) +
(151)
(152) " A
(153) #
(154) "
(155) 8
(156) =
(157)
(158)
(159)
(160) #"" 3*4 # ;55
(161) 1C5 # 5 3,4 D B
(162) 1
(163) A # $ E <:
(164) "
(165) ? 8 7 C
(166) 2 # =
(167)
(168) 6F . :
(169)
(170) 9
(171) $ G 1 3-4 > " D >?#72 ? D2D. <
(172)
(173)
(174)
(175)
(176)
(177)
(178) =
(179) 8 6
(180)
(181)
(182) "
(183)
(184) ). >8A&. 3.4 : :
(185) " " =>
(186) "
(187) 8"= ?#8 ) B
(188) 8 "
(189) 5# #
(190)
(191) "
(192) 08& ) 304 6 :
(193)
(194) > + >
(195) . “ :
(196)
(197)
(198) @
(199) "
(200)
(201) %,; 8
(202)
(203) "
(204) ”#256 6&5#6/5+& 9&,/* > 3/4 > + >
(205) 6 :
(206)
(207). “ # 8
(208)
(209) $ 8 ” # ? "
(210) )*.8),,. 3& 4 田邊,石川,渡辺,富永,<> 映像 配信のためのマルチ解像度変換法= 情報処理学会研究 報告, *,9,
(211) & /8&&* * 3&&4 小野,渡辺,<国際標準画像符号化の基礎技術= コロ ナ社,&//0. 0.1. '2
(212)
(213)
(214) "(. 今後の課題 本提案手法では,各 4!& のビット配分を行うた めに,前フィールドのスカラー量子 化後の各 4!& の符号量割合を参照した.そして,スカラー量子化 後の符号量割合か ら,各 4!& へ割り当てるビッ ト量を算出することが可能であることを示した.し か し,スカラー量子化による符号量制御は,ポスト 量子化によるレート制御と比較して精 度が落ちる. そこで,今後は,ポスト量子化による符号パスの切 捨て点情報も考慮に入れることで,精度の高いビッ ト配分を検討する必要がある. −12−. 11.
(215)
関連したドキュメント
適用回避防止規定の概要として、子法人(配当等の額を受けた事業年度の前事業年度の総資産の帳簿価
平成 27 年 2 月 17 日に開催した第 4 回では,図-3 の基 本計画案を提案し了承を得た上で,敷地 1 の整備計画に
活性は前胸腺 を 培養 し,そ の後エ クダイ ソン 分泌量 を RIAで 測定.破 線 は,2日 の前胸腺を休眠蛹に移植 し, 1日
算処理の効率化のliM点において従来よりも優れたモデリング手法について提案した.lMil9f
スライド5頁では
議論を深めるための参 考値を踏まえて、参考 値を実現するための各 電源の課題が克服さ れた場合のシナリオ
では、シェイク奏法(手首を細やかに動かす)を音
一方、Fig.4には、下腿部前面及び後面におけ る筋厚の変化を各年齢でプロットした。下腿部で は、前面及び後面ともに中学生期における変化が Fig.3 Longitudinal changes