マクロブロック符号化モードの適応選択

第 6 章符号化構造の適応選択方式 61

6.3 マクロブロック符号化モードの適応選択

第6章符号化構造の適応選択方式 66

(M=3)

R_M₃=R−H_M₃(B)×2−H_M₃(P) (6·1) (M=1)

RM1=R−HM1(P)×3 (6·2)

R : 残ビット数(3フレーム相当)

H_M₃(B) : Bピクチャ(M=3)オーバヘッドビット数 HM3(P) : Pピクチャ(M=3)オーバヘッドビット数 H_M₃(P) : Pピクチャ(M=1)オーバヘッドビット数

上式において，M=1適用時にPピクチャ1枚あたりに割当て可能なDCT係数符号化ビット数はR_M₁/3により表せる．またM=3に関して，事前実験の結果よりBピクチャのDCT 係数符号化に要するビット数はPピクチャと比較して格段に少ない点を考慮し，Pピクチャに割当て可能なDCT係数符号化ビット数をRM3と仮定する．ここでPピクチャ符号化の観点からM=1に対するM=3の優位性を示す指標V_M₃を式(6·3)により定義し，式(6·4)が真となる場合に限りM=1を適用する．T H_V はV_M₃に対して定義する判定閾値である．

VM3 = RM3

(R_M₁/3)×W_Err (6·3)

V_M₃＜T H_V (6·4)

ただし，WErrは(b)の問題に関連して導入する重み係数であり，予測フレーム間隔の増加に伴ってPピクチャの予測効率が低下する度合を反映しており，算出手順を以下に説明する．

1フレーム間隔の順方向予測誤差信号の算出において，トップフィールドとボトムフィールドについて参照フィールドを限定しない場合の誤差2乗和を計算し，それぞれE_top，E_btm とする．加えて，トップフィールドとボトムフィールドについて参照可能なフィールドを，

予測距離が大きい一方に限定した場合の誤差2乗和を計算し，それぞれE_top ，E_btm とする (図6–4参照)．このとき次式によりW_Errを決定する．

W_Err = min(E_top E_top,E_btm

E_btm) (6·5)

6.3 マクロブロック符号化モードの適応選択

第6章符号化構造の適応選択方式 67

表6–5: 符号化モードの定義

m (a) (b) (c)

0 Intra ― ―

1 Frame 順方向

2 Field

3 Inter Frame 逆方向

4 Field

5 Frame 双方向

6 Field

以上の定義から，MPEG-2符号化においてマクロブロックごとに符号化モードmが取り得る候補は表6–5のようにまとめられる．

Test Model 5などにみられる一般的なMPEG-2符号化制御において，符号化モードの選択は単に予測誤差信号の絶対値和や分散値を基準として行われており，動きベクトルビット数ならびにFrame DCT/Field DCT(以下，DCTタイプと呼ぶ)の選択を考慮した最適化手法に関する検討例は少ない．このため，同制御のもとでは，発生ビット数最小化という意味で最適な符号化モードの選択は保証されず，特に，全ビット数に占めるオーバヘッド部分の割合が高い低レート符号化に対しては，オーバヘッド部分に費やすビット数も加味した符号化モード選択の改善による効果が大きいと予想される．以上の背景から，本章では，符号化モードの適応選択手法に関して最適化を試み性能評価を行った．前提条件として，符号化モード選択時には，Intraモードを除く各符号化モードにおいて最適とされる動きベクトルは特定されており，マクロブロック単位に各符号化モード選択時の輝度信号に対する予測誤差信号(16画素×16ライン)を取得可能であるとする．以上の前提のもとで符号化モードおよびDCTタイプの選択手法について最適化を図る．

6.3.2 マクロブロック符号化ビット数の推定

6.3.1の前提をもとに符号化ビット数の推定を行う．ここですべてのDCT入力ブロックに

対し，一旦DCTを施して実際のビット数を得るのは現実的ではないため，DCT入力ブロックの統計量として分散値を抽出し，同分散値をもとに各ブロックに要する符号化ビット数を推定することとする．具体的には固定量子化器(量子化パラメータ：∆)の下で分散値と発生ビット数の関係を非線形関数により近似可能であることを利用し，式(6·6)で示す非線形関数f によりブロックの発生ビット数を推定する．

f(σ²,∆) =a×log₂σ²+b (6·6)

第6章符号化構造の適応選択方式 68

ただし関数fを決める実数(a, b)は，符号化種別(Intra/Interの2種類)と量子化精度の組合せに応じて，最適な解をもつと考えられ，符号化器にはすべての組合せに対応する(a, b)が予め用意されていることとする．ここでMPEG-2における量子化精度は，量子化パラメータと量子化マトリクスの乗算により決まるが，一例としてIntra，Interのそれぞれにつき，

量子化マトリクスを1種類に固定し，量子化スケールタイプを非線形タイプに限定した場合，

ブロックごとに適用される量子化精度としては量子化パラメータ(MQUANT値)で表現できる計31種類に特定でき，2種類(符号化種別)×31種類の計62種類の(a, b)を用意する必要がある．式(6·6)を用い，各候補(m, n)(m:符号化モード,n:DCTタイプ)に対するマクロブロックの符号化ビット数は次式により推定可能である．6.3.1で設けた前提から，算出対象は輝度信号のみとした．

i) m＝0(Intraモード)

V(m, n) = d+s+C(m, n) (6·7) C(m, n) =

3 k=0

fa(σ²_k(m, n),∆) (6·8) ii) m＞ 0(Interモード)

V(m, n) = r+s+C(m, n) (6·9) C(m, n) =

3 k=0

f_b(σ_k²(m, n),∆) (6·10)

式(6·8)，式(6·10)において，fa,fbはそれぞれ，Intra，Interのマクロブロックに対し，式 (6·6)に準じてブロックレイヤの符号化ビット数を推定する関数であり，f_aに限ってはIntra DC係数を除くDCT係数を推定対象とする．式(6·7)，式(6·9)において，d, s, rはともに確定的に計算されるビット数成分であり，以下の定義に従う．

d : Intra DC係数符号化ビット数(輝度信号4ブロック分)

s : 動きベクトルを除くオーバヘッド部分(マクロブロックレイヤ)のビット数 r : 動きベクトル符号化ビット数

マクロブロックごとの符号化モード選択は，取り得るすべての候補(m, n)について符号化ビット数V(m, n)の推定を行った上で以下に従いビット数最小化の規範で行う．

i) C(m, n) = 0なる候補が存在する場合

ブロックレイヤのビット数が極めて少ないと推定されるため，符号化モードとして優先的に選択することとする．複数存在する場合には，誤差電力の総和を比較し最小値を与えるものを選択する．

ii) otherwise

minm,nV(m, n)を与える(m, n)を選択する．

第6章符号化構造の適応選択方式 69

表6–6: 符号化条件

符号化方式 MPEG-2 MP@HL(4:2:0) 符号化レート 15Mb/s

レート制御 Test Model 5準拠量子化制御量子化マトリクス固定，

非線形量子化スケールピクチャ構造フレームピクチャ

動き補償フレーム予測/フィールド予測適応動き検出 ±63.5画素×±31.5ライン，半画素

(1フレーム間隔に対して) DCTタイプフレームDCT/フィールドDCT適応

6.4 性能評価

ドキュメント内 i HDTV HDTV (ページ 70-73)

第 6 章 符号化構造の適応選択方式 61

6.3 マクロブロック符号化モードの適応選択

第 6 章符号化構造の適応選択方式 61