• 検索結果がありません。

キーワード

N/A
N/A
Protected

Academic year: 2021

シェア "キーワード"

Copied!
3
0
0

読み込み中.... (全文を見る)

全文

(1)

(45)883

知っておきたい キーワード

H.264って何ですか

知っておきたい キーワード

正会員 

八 島 由 幸

H.264って何ですか

†日本電信電話株式会社 NTTサイバースペース研究所

"What's H.264?" by Yoshiyuki Yashima (NTT Cyber Space Laboratories, Yokosuka) キーワード:H.264,MPEG-4 part10 AVC,画像符号化

Keywords you should know. 第6回

映像情報メディア学会誌 Vol. 60,  No. 6,  pp. 883〜885  (2006)

H.264の位置づけ

H.264は動画像圧縮符号化国際標準 方式の一つです.ここで,「H.264」と いう呼び方はITU-T標準として付与さ れた名称であって,同じ内容のものが ISOにおいて「MPEG-4  part10  AVC」

として標準化されています.図1は H.264標準化の経緯を示しています.

動画像符号化のルーツは,テレビ電 話やテレビ会議向けに標準化された H.261です.MC(動き補償)とDCT

(離散コサイン変換)を組合せて圧縮す る枠組みがH.261で確立されました.

そしてこのMC+DCT方式は,以降の

MPEG-2,MPEG-4,H.263にも継承 されました.MPEG-2では,放送,通 信,蓄積に汎用的に利用できるような 拡張がなされ,またMPEG-4ではオブ ジェクト単位で符号化できる新しい枠 組みが取り入れられています.そして H.264は,MPEG-2や従来のMPEG-4

(MPEG-4  Part-2,Simple  Profileや Advanced  Simple  Profileが相当する)

に比べて2倍以上の効率を狙った超高 圧縮をターゲットとして標準化が進め ら れ ま し た . 標 準 化 は I T U - T

(SG16/VCEG)とISO(SC29/WG11

( M P E G ))の 共 同 検 討 チ ー ム J V T

(Joint  Video  Team)で進められ2003

年に勧告されています.さらにその拡 張方式として,4:2:2や10ビット映像 といったプロフェッショナル向けを指 向する,より高い機能を備えたH.264 FRExt(Fidelity  Range  Extension)が 標準化されました.H.264でもこれま でと同様に基本的にはMC+DCTの枠 組みが使われています.図1にはこれ までの各標準方式に取り入れられた技 術の変遷を示していますが,H.264で は基本的枠組みは変えずに,種々の最 適化を図れるしくみを導入していると ころが特徴です.

導入技術(機能,圧縮効率)

1990

1996

2003 H.264 H.26L 高効率化

高効率化

改良

同じもの 同じもの 改良

1995

1991

高機能化

2003 1998

汎用化

高効率化 1995

導入技術(機能,圧縮効率)

ITU-T

MPEG-4  AVC JVT

ISO

MPEG-4 MPEG-2 H.261

H.262

H.263

MPEG-1

・動き補償(MC)+離散コサ   イン変換(DCT)の枠組み

・2次元VLC

・DCT直流成分予測

・3次元VLC

・両方向予測 ・半画素動き補償

・量子化マトリクス

・インタレース対応  フィールド/フレーム適応  DCT係数適応スキャン

・階層符号化(スケーラビリティ)

・プロファイルとレベルの概念

・AC / DC成分予測

・1 / 4画素動き補償

・任意形状符号化

・グローバル動き補償

・スプライト符号化

・シームレススケーラビリティ

・高度エラー耐性

・可変ブロックサイズMC

・複数フレームからの予測

・4×4整数DCT ・算術符号化

・可変ブロックサイズMC

・複数フレームからの予測

・4×4整数DCT

・算術符号化

図1 H.264の位置づけ

(2)

映像情報メディア学会誌 Vol. 60,  No. 6  (2006) 884(46)

知っておきたい キーワード

H.264って何ですか

H.264への新規導入技術

H.264に新しく導入されている技術 は,要素技術という観点から見ると必 ずしも目新しいものではありません.

映像符号化標準化の過程では,ある要 素技術を導入するかどうかを判断する とき,符号化効率とともにその要素技 術を実行するための計算の複雑さも重 要なポイントとなります.従来は,計 算機のCPU速度やLSI/コーデック装 置実現性などを考慮して,圧縮効率は 向上してもあまり複雑な方式は採用を 見送ってきたという経緯がありまし た.一方H.264では,計算をできるだ け複雑にしないという条件をある程度

緩やかにして,符号化効率の向上する 技術はどんどん取り入れました.「デ コードできる道具はたくさん用意した からエンコーダは上手に利用してね」

という設計思想です.符号化ソフトウ ェアやハードウェア装置設計者(特に エンコーダ設計者)から見れば,道具

(符号化ツール)選択の余地が多く,

どのように最適化すればよいかという うれしい難題をふっかけられたことに なります.H.264では非常に多くの拡 張がなされています.表1にH.261,

MPEG-2との主な技術の比較を示しま す.詳細は文献1)などに譲るとして,

ここではいくつかのキーポイントだけ を説明します.

(1)フレーム内予測:MPEG-2など 従来は画素値そのものをDCTし ていたものを,フレーム内予測 してからDCTすることにしまし た(図2).予測モードは13種類,

従来符号量が大きかったIフレー ムの符号量が劇的に減ります.

(2)可変ブロックサイズ動き補償:

従来は基本的に16x16のブロッ クサイズごとに動きを検出して いたものを,表1に示す7種類の サイズを適応的に用いることが できるようにしました(図3).

(3)予測参照フレーム:過去未来の 任意の2枚からの予測が可能で す(図4).

(4)整数DCT:演算が簡単で,かつ ミスマッチ対策がいらないなど の利点があります.

(5)算術符号:あらかじめ決められ た可変長符号ではなく,信号の 発生確率に随時適応するため,

映像の種類や符号化パラメータ が変化しても,それに追随した 最適に近い符号割当てが可能と なります.

表1 標準化に採用されている符号化ツールの比較

  比較項目  H.261  MPEG-2 Main Profile  H.264/AVC Main Profile  H.264/AVC FRExt

入力信号  プログレッシブ  インタレース  インタレース  インタレース

色信号  4:2:0  4:2:0  4:2:0  4:2:0, 4:2:2, 4:4:4

フレーム内符号化  DCT  DCT  フレーム内予測+整数DCT  フレーム内予測+整数DCT

フレーム間符号化  フレーム間予測+DCT  フレーム間予測+DCT  フレーム間予測+整数DCT  フレーム間予測+整数DCT

フレーム間予測  順方向  双方向  双方向  双方向

予測参照フレーム  過去1枚  過去未来各1枚  任意の2枚  任意の2枚

重みつき予測  な し  な し  あ り  あ り

動き補償ブロックサイズ  16×16  16×16  16×16, 8×16, 16×8,  16×16, 8×16, 16×8,

      8×8, 4×8, 8×4, 4×4  8×8, 4×8, 8×4, 4×4

動き補償精度  整数画素  1/2画素  1/4画素  1/4画素

小数画素作成フィルタ  な し  2タップ  6タップ,2タップ  6タップ,2タップ

動きベクトル符号化  左との差分  左との差分  近傍三つの中央値差分  近傍三つの中央値差分

DCTブロックサイズ  8×8  8×8  4×4  4×4, 8×8

DCTミスマッチ対策  代表値奇数化  最高次係数符号反転  必要なし  必要なし

符号割当て  Fixed VLC  Fixed VLC  CAVLC, CABAC  CAVLC, CABAC

ループ内フィルタ  あり(ON/OFF制御)  な し  あり(フィルタ強度適応)  あり(フィルタ強度適応)

[MPEG-2]

DCT

符号化対象ブロック

[H.264]

DCT係数

予測誤差 DCT係数 DCT

符号化対象ブロック 13種類のパターンで フレーム内予測

図2 フレーム内予測

[MPEG-2] 16×16

[H.264]

16×16 8

× 16 16×8 8×8

4×8 8×4 4×4

図3 可変ブロックサイズ動き補償

[MPEG-2]

順方向は1枚の 参照フレームから予測 双方向は前後の 参照フレームから予測

[H.264]

過去の2枚のフレーム からの予測

同じ参照フレーム からの予測

任意の前後のフレームからの予測

図4 参照フレーム選択の拡張

(3)

(47)885

知っておきたい キーワード

H.264って何ですか

H.264の使われ方と今後

符号化効率が非常に良いことから産 業界でもH.264の利用が広がってきま した.2006年4月からはじまった,

携帯・移動体機器向けデジタル放送

(ワンセグ放送)の映像符号化方式と してH.264が採用されています.また,

次世代DVDでも,HD-DVDおよびブ ルーレイいずれもH.264が搭載必須コ

ーデックの一つとなっています.また,

IPTV,すなわちIPネットワークを利 用した放送・映像配信のシステム構築 においても,ネットワークリソースの 効率的利用の観点からH.264の利用が 検討されています.

さらに,今後の映像符号化標準化に も影響を与えています.MPEGで検討 されている,時空間およびSNRスケ ーラビリティを同時に実現する新しい

スケーラブル符号化SVCでは,その ベースレイヤ符号化方式としてH.264 が使われます.また,マルチカメラか らの多視線映像を効率的に符号化する Multiview Video Codingでも基準画像 はH.264とする方向で標準化が議論さ れています.今後の映像サービスを支 える映像符号化キーテクノロジーとし て,H.264は確たるポジショニングを 築きつつあります.

H.264の符号化性能

H.264はどのくらいの符号化効率を 達成できるのでしょうか.MPEG-2と H.264を実際の動画像を使って試して み ま し た . MPEG-2  TM5お よ び H.264  JM10.1といういずれも標準化 テストモデルソフトウェアを利用しま した.JMでは高速動き検出モードを 使用しています.図5に,横軸をビッ トレート,縦軸を画質としてその結果 を示します.画質はSN比で比較しま した.図5から,同じ画質を達成する た め の ビ ッ ト レ ー ト が , H . 2 6 4 は MPEG-2に比べると低レートでは7割

〜5割程度で済んでいることがわかり ます.ただし,TMやJMというのは あくまでもモデルであって,工夫の余 地がたくさん残されていることには注 意しなければなりません.

H.264の最大性能を引き出そうとす るときには,RDO(Rate-Distortion

Optimization)という概念が重要にな ります.符号化の過程では,16×16 単位のマクロブロックで,イントラ/

インタ判定,フレーム内予測パターン,

動きベクトル,ブロック分割情報など をどのように決めるかという「符号化 モード」が決められます.ある符号化 モードで符号化したときの歪み量を D,必要となる情報量をRとします.

RDOとは,いろいろな符号化モード で符号化してみて評価値J=D+λRを 最小にするような符号化モードを選択 することを意味します.ここで,通常 Dは原信号と復号信号との二乗誤差で 定義されます.また,RはDCT係数の 符号化に必要となる情報量のほか,動 きベクトルや符号化モードの符号化に 必要となる情報量もすべて含みます.

λは未定乗数であり,例えばJMでは,

量子化の粗さの関数として定められて います.RDOの概念はH.264に限った ものではありませんが,H.264では先

に述べたように,選択できる符号化モ ードがMPEG-2に比べて格段に多くな っているため,RDOにより最適値が 得やすくなるという特徴があります.

なお,すべての符号化モードに対して RDOを行うことが理想ですが,演算 量が膨大になってしまいます.このた め,限られたモードのみで最適化する 方法や,符号化をいちいちやってみる のではなく最適モードをうまく予測す る方法の考案が重要となります.歪み Dを二乗誤差だけでなく,人間の視覚 特性パラメータを入れて定義すること も重要です.

アプリケーションによって最適化の 方法や作りが違ってきますので一概に は言えませんが,高品質映像サービス に適用する場合,標準テレビで2〜

3Mbps,HDTVで6〜10Mbpsという ところがターゲットレートになってく るでしょう.

(a)Sequence No.15 : Yachting 43

41 39 37 35 33 31 29 27 250

H.264  JM

MPEG−2  TM

SNR(dB)

2 4 6

Bitrate(Mbps)

(c)Sequence No.30 : Crowded Crosswalk

SNR(dB)

41 39 37 35 33 31 29 27 250

H.264  JM

MPEG−2  TM

2 4 6 8

Bitrate(Mbps)

(b)Sequence No.16 : Whale Show

SNR(dB)

Bitrate(Mbps)

34 32 30 28 26 24 22 200

H.264  JM

MPEG−2  TM

2 4 6 8

図5 H.264の符号化性能(映像情報メディア学会標準テスト画像利用)

1)大久保榮監修:H.264/AVC教科書,インプ レス

参 考 文 献

八島

や し ま

由幸

よ し ゆ き

1983年,名古屋大大学院工学研究科電子工学専攻修士課程修了.

同年,日本電信電話公社(現NTT)入社.以来,画像信号の高能率符号化,

MPEG関連システムの研究開発に従事.現在,NTTサイバースペース研究所画像 メディア通信プロジェクト映像符号化技術グループリーダ,主幹研究員.工学博 士.正会員.

参照

関連したドキュメント

テューリングは、数学者が紙と鉛筆を用いて計算を行う過程を極限まで抽象化することに よりテューリング機械の定義に到達した。

また適切な音量で音が聞 こえる音響設備を常設設 備として備えている なお、常設設備の効果が適 切に得られない場合、クラ

本装置は OS のブート方法として、Secure Boot をサポートしています。 Secure Boot とは、UEFI Boot

タップします。 6通知設定が「ON」になっ ているのを確認して「た めしに実行する」ボタン をタップします。.

えて リア 会を設 したのです そして、 リア で 会を開 して、そこに 者を 込 ような仕 けをしました そして 会を必 開 して、オブザーバーにも必 の けをし ます

父親が入会されることも多くなっています。月に 1 回の頻度で、交流会を SEED テラスに

モードで./していることがわかります。モータの インダクタンスがÑnˆきいので、 2 Íの NXT パ ルスの'k (Figure 18 のºˆDWをk) )

夜真っ暗な中、電気をつけて夜遅くまで かけて片付けた。その時思ったのが、全 体的にボランティアの数がこの震災の規