• 検索結果がありません。

HDTV対応双方向通信用H.264/AVCリアルタイムソフトウェアコーデック

N/A
N/A
Protected

Academic year: 2021

シェア "HDTV対応双方向通信用H.264/AVCリアルタイムソフトウェアコーデック"

Copied!
5
0
0

読み込み中.... (全文を見る)

全文

(1)Vol.2010-AVM-68 No.3 2010/3/4. 情報処理学会研究報告 IPSJ SIG Technical Report. 1. は じ め に. HDTV 対応双方向通信用 H.264/AVC リアルタイムソフトウェアコーデック. 近年,IPTV や IP ネットワークを用いた地上波デジタル放送の再送信や,ハードディス クレコーダ等で H.264/AVC1) で符号化された HD サイズの映像コンテンツが広く用いら れてきている.また,IP ネットワークの広帯域化により,今後は映像配信やテレビ会議シ. 佐 野. 卓†1 上 倉. 大 西 一 人†1. 隆 之†1 長 沼. 岩 崎 次 郎†2. 裕. ステム等の IP ネットワークを用いた映像伝送アプリケーションが増えてくると考えられる.. 江†1. H.264/AVC の符号化処理においては膨大な計算量を必要とするため,現在は LSI 等の専用 ハードウェアを用いてリアルタイム符号化処理を行うものが主流となっている2)–4) .ソフト ウェアを用いた H.264/AVC リアルタイム符号化処理装置としては HD サイズ(1280×720,. 本稿では HDTV 対応双方向通信用 H.264/AVC リアルタイムソフトウェアコー デックの構成とその性能について述べる.本コーデックは複数の符号化コアで構成さ れ,並列処理を行う事でフル HD 品質(1920×1080 画素,29.97 フレーム/秒)の映 像を高画質かつ低遅延に符号化を行うことが可能である.また,エラー訂正機能及び エラー隠ぺい機能により,高品質な映像コミュニケーションが実現可能である.. 30 フレーム/秒)のものは発表されている5) が,フル HD サイズ(1920×1080, 30 フレー ム/秒)のものはまだほとんどない.そこで我々はフル HD の映像を低遅延かつリアルタイ ムに H.264/AVC に符号化し,双方向通信を行う HDTV 対応双方向通信用 H.264/AVC リ アルタイムソフトウェアコーデックを開発した. 本稿では,まず第 2 節で本コーデックシステムに要求される要求条件についてまとめ,第. A Software-based H.264/AVC HDTV Real-time Interactive CODEC Architecture Using Parallel Processing. 3 節で本コーデックシステムの構成について述べる.次に第 4 節で本コーデックシステムの 処理量,遅延量,画質,エラー耐性についての評価を行う.最後に第 5 節で本コーデックシ ステムの適用例について述べ,第 6 節でまとめとする.. 2. 要 求 条 件. Takashi Sano,†1 Takayuki Onishi,†1 Hiroe Iwasaki,†1 Kazuto Kamikura†1 and Jiro Naganuma†2. 本コーデックシステムを実現するには以下に示す性能・機能が求められる.. (1) This paper describes a software-based H.264/AVC HDTV real-time interactibe CODEC architecture using parallel processing. It provides Full-HD quality (1920 x 1080 pixels, 29.97 frames per second) using parallel encoding, natural interactive conversation with low delay of less than 165 ms, and smooth visual communication free from macro block noises. This software with a home television and a home digital video camera achieves HDTV-quality bidirectional video communication via commercially IP broadband network.. 並列処理. 近年,複数の CPU コアを搭載した汎用 CPU が広く普及してきている.H.264/AVC の膨 大な演算量を処理するためにはマルチコア CPU の性能を最大限に活かすための並列処理手 法が必要となる.. (2). エラー耐性. ブロックノイズの無い高品質な映像伝送を実現するためには,ネットワークエラーに対する 対処が必要となる.特に FEC(Forward Error Correction)6) やエラー隠蔽処理は,パケッ トロスに対する対処として有効である.. (3). †1 日本電信電話株式会社,NTT サイバースペース研究所 Nippon Telegraph and Telephone Corporation, NTT Cyber Space Laboratories †2 NTT エレクトロニクス株式会社 NTT Electronics. 低遅延. 文献 7) では,テレビ電話およびテレビ会議システムにおいて違和感の無い円滑な会話を実 現するためには片道 200msec 以下の遅延量を実現することが必要であると述べている.本. 1. ° c 2010 Information Processing Society of Japan.

(2) Vol.2010-AVM-68 No.3 2010/3/4. 情報処理学会研究報告 IPSJ SIG Technical Report ,3 &RPPXQLFDWLRQ. . &RQWURO (QF. 8'33DFNHW3D\ORDG.  ,36HQGHU *HQHUDWH(6. &DSWXULQJ. 9LGHR. (6. $XGLR(QFRGLQJ 6OLFH3DUWLWLRQLQJ. &DPHUD. $XGLRLQ. $XGLR. 'DWD6\PERO. (QFRGHU'HFRGHU. ,QSXW2XWSXW 0LFURSKRQH. ,33DFNHW. %LWVWUHDPRI. . 2QH3LFWXUH. ࣭ ࣭ ࣭. (6. N. 2XWSXWWR 1HWZRUN. 9LGHR(QFRGLQJ $XGLRRXW. 0RQLWRU. 'LVSOD\. $XGLR 9LGHR. $XGLR'HFRGLQJ 9LGHR'HFRGLQJ. (6 (6. )(&&DOFXODWLRQ ,35HFHLYHU. ,33DFNHW. N ࣭ ࣭ ࣭ Q. (UURU5HFRYHU &RQWUROOHU. 図 1 全体構成図 Fig. 1 Block diagram of the CODEC system. )(&6\PERO. 6SHDNHU. )(&3DFNHW. 図 2 FEC のデータ構造 Fig. 2 Data structure of FEC. コーデックシステムにおいても片方向 200msec 以下の遅延量を実現する. ,3LFWXUH 

(3) . 以上のようにソフトウェアでの双方向映像通信には並列処理,エラー耐性,低遅延が重要 となる.. 3. HDTV 対応双方向通信用 H.264/AVC リアルタイムソフトウェアコーデッ クの構成. 7UDQVPLVVLRQ. ࣭࣭࣭. 5HFHLYHUZLWK)(&. ࣭࣭࣭. 33LFWXUH 

(4) . )(&. 33LFWXUH 

(5) . 33LFWXUH 

(6) . 33LFWXUH 

(7) . ,3LFWXUH 

(8) . ࣭࣭࣭. ࣭࣭࣭. ࣭࣭࣭. ࣭࣭࣭. ࣭࣭࣭. ࣭࣭࣭. ࣭࣭࣭. ࣭࣭࣭. ࣭࣭࣭. ࣭࣭࣭. 'HFRGHU. 

(9) . 

(10) . GLVFDUG. GLVFDUG. GLVFDUG. 

(11) . 'LVSOD\. 

(12) . 

(13) . 

(14) . 

(15) . 

(16) . 

(17) . 本コーデックシステムの全体構成図を図 1 に示す.本コーデックの符号化部は,複数の符. 図 3 エラー隠蔽処理 Fig. 3 Error concealment. 号化コア,スライス分割部,ストリーム結合部,全体制御部で構成されている.入力された 映像はスライス分割部で水平帯状に分割され,各符号化コアで H.264/AVC へ符号化され る.参照画像は共有メモリに保存され符号化に用いられる.各符号化コアで符号化された. を各ピクチャの生成パケット数としピクチャ毎に FEC 演算を行うことで,遅延量の増加が. ビットストリームはストリーム結合部で結合され,IP 送信部へ出力される.全体制御部は. なく FEC 演算が可能である. パケットロスが発生した場合のエラー隠蔽処理の模式図を図 3 に示す.ネットワークエ. 全ての符号化コアから符号化結果を収集し,次のフレームの符号化に用いる符号化パラメー. ラーによって復号できないピクチャが発生した場合,復号処理を一時停止し次の I ピクチャ. タを生成し各符号化コアへ送信する.. FEC の方式にはリード・ソロモンを採用している.FEC のデータ構造を図 2 に示す.UDP. が復号されるまで直前の正常なピクチャを出力する.本コーデックではこのようなエラー処. パケットペイロードにパケット化された 1 ピクチャ分のビットストリームに対し FEC 演算. 理の時間を短くするために,M=1,N=5 という短い GOP 構造を採用している.これによ. を施し,FEC パケットを生成する.ネットワーク上で UDP パケットロスが発生した場合,. りマクロブロックノイズのない映像が出力可能である.. IP 受信部で FEC パケットを用いてエラー訂正を行う.パラメータ (n,k) は可変であり,k. 2. ° c 2010 Information Processing Society of Japan.

(18) Vol.2010-AVM-68 No.3 2010/3/4. 情報処理学会研究報告 IPSJ SIG Technical Report 㻣㻜㻌. 3UDFWLFDO,31HWZRUN. 㻢㻜㻌. /RFDWLRQ$. 㻲㼞㼍㼙㼑㻌㼞㼍㼠㼑㻌㼇㼒㼜㼟㼉㻌. %LGLUHFWLRQDO 7UDQVPLVVLRQ. /RFDWLRQ%. 図 4 評価環境 Fig. 4 Evaluation system. 㻡㻜㻌 㻠㻜㻌. ЌLQUHDOWLPH. 㻟㻜㻌 㻞㻜㻌 㻝㻜㻌 㻜㻌 㻜㻌. 4. 実装と評価. 㻞㻌. 㻠㻌 㻢㻌 㻺㼡㼙㼎㼑㼞㻌㼛㼒㻌㼑㼚㼏㼛㼐㼑㼞㻌㼏㼛㼞㼑㻌. 㻤㻌. 図 5 並列処理における処理性能 Fig. 5 Processing speed with parallel encoding. 本コーデックは C 言語と MMX/SSE 等のアセンブラ言語を用いて実装されている.本 コーデックの記述ライン数を表 1 に示す.アセンブラ言語は動き予測処理,画面内予測,. DCT/IDCT,デブロッキングフィルタ等の記述に用いられている. 今回用いた評価環境を図 4 に示す.また,本評価システムの構成を表 2 に,符号化処理 に用いたパラメータを表 3 に示す.. (QFRGH. 'HFRGH. . . ,3&RPPXQLFDWLRQ. . 本コーデックの並列処理における処理性能を図 5 に示す.評価に使用した CPU はハイ. . パースレッド機能を搭載したクワッドコア CPU であるため,符号化コアが増えるにつれて. 0( 0& . 処理可能なフレームレートが増大していく.本コーデックは 4 コア以上の CPU であればリ. &$%$&. /). . . . 0& ,'&7 . 2WKHU . 次に本コーデックの遅延量について測定した.遅延量はタイムコード入りの映像を用いて. アセンブラ言語 [Klines]. 映像キャプチャから,符号化,ネットワーク送受信,復号処理を経てディスプレイ表示まで. 54.5 17.4. の時間差を測定した.本コーデックでは片方向 165msec の遅延量で動作可能である. 表 3 符号化パラメータ Table 3 Encoding parameters. 表 2 システム構成 Table 2 System configutation. CPU Memory OS Camera Capture Device. 2WKHU.  . に示す.本コーデックは CPU の約 60%の使用率でリアルタイム動作可能である.. 表 1 記述ライン数 Table 1 Total number of source lines. Encoder Decoder. &$%$& /). 図 6 CPU 処理の内訳 (符号化コア 8 個の場合) Fig. 6 CPU performance with 8 encoding cores. アルタイム処理可能である.符号化コアを 8 個で動作させた場合の CPU 処理の内訳を図 6. C 言語 [Klines] 79.5 36.1. '&7 4 .  *+]

(19). Image Format Profile / Level Bit rate GOP Structure Symbol Mode Audio Format. Intel Core i7-940 (2.93GHz) DDR3-SDRAM 6GB Windows Vista Ultimate SP1 Panasonic HDR-HC9 Blackmagic Intensity Pro. 3. 1920×1080 / 29.97fps H.264 High profile / Level 4.0 10Mbps M=1, N=5 (I:Field, P:Frame) CABAC MPEG-1 Layer 2. ° c 2010 Information Processing Society of Japan.

(20) Vol.2010-AVM-68 No.3 2010/3/4. 情報処理学会研究報告 IPSJ SIG Technical Report 㻟㻝㻚㻡. 㻟㻣㻚㻡 㻟㻣㻚㻜. 㻟㻝㻚㻜. 㻼㻿㻺㻾㼇㼐㻮㼉. 㻼㻿㻺㻾㼇㼐㻮㼉. 㻟㻢㻚㻡 㻟㻜㻚㻡. 㻟㻜㻚㻜. 㻶㻹㻝㻡㻚㻝㻌㻔㻾㻰㻙㼛㼒㼒㻕 㻼㼞㼛㼜㼛㼟㼑㼐. 㻟㻢㻚㻜 㻟㻡㻚㻡. 㻞㻥㻚㻡. 㻶㻹㻝㻡㻚㻝㻌㻔㻾㻰㻙㼛㼒㼒㻕 㻼㼞㼛㼜㼛㼟㼑㼐. 㻟㻡㻚㻜. 㻞㻥㻚㻜. 㻟㻠㻚㻡 㻥. 㻝㻜. 㻝㻝. 㻝㻞. 㻝㻟. 㻝㻠 㻝㻡 㻝㻢 㻮㼕㼠㻌㼞㼍㼠㼑㼇㻹㼎㼜㼟㼉. 㻝㻣. 㻝㻤. 㻝㻥. 㻞㻜. 㻡. 図 7 PSNR による符号化効率測定結果 (Woman in flowers) Fig. 7 Coding efficiency of ”Woman in Flowers”. 図8. 本コーデックの PSNR による画質評価結果を図 7,8 に示す.コンテンツは ITE 標準動. 㻢. 㻣. 㻤. 㻥. 㻝㻜 㻝㻝 㻝㻞 㻮㼕㼠㻌㼞㼍㼠㼑㼇㻹㼎㼜㼟㼉. 㻝㻟. 㻝㻠. 㻝㻡. 㻝㻢. PSNR による符号化効率測定結果 (Video phone) Fig. 8 Coding efficiency of ”Video phone”. 㻜㻚㻥㻞. 画像の「Woman in flowers」と民生カメラで撮影した「Video phone」の 2 つを用いた.ど 㻜㻚㻥㻝. ちらも固定カメラで撮影された映像である.比較対象として JM バージョン 15.18) で同一の 符号化パラメータを用いて符号化した結果を併記した.JM は符号化処理に実時間の約 150 㻿㻿㻵㻹. 㻜㻚㻥㻜. 倍もの時間がかかっているのに対し,本コーデックは JM と比較して約 0.3dB の画質劣化. 㻜㻚㻤㻥. でリアルタイム処理を実現している.. 㻶㻹㻝㻡㻚㻝㻌㻔㻾㻰㻙㼛㼒㼒㻕 㻼㼞㼛㼜㼛㼟㼑㼐. 次に SSIM による画質評価結果を図 9,10 に示す.SSIM とは主観評価指標を考慮した. 㻜㻚㻤㻤. 画質評価方法である.本コーデックは Video phone では JM よりも高い SSIM を示してお り,Woman in flowers においても 15Mbps 以上のビットレートで JM よりも主観画質が向. 㻜㻚㻤㻣 㻥. 上している事が分かる.これにより,高画質なテレビ電話/テレビ会議システムが実現可能 図9. である.. FEC によるエラー訂正処理の評価結果を表 4 に示す.評価は B フレッツベーシックの商. 㻝㻜. 㻝㻝. 㻝㻞. 㻝㻟. 㻝㻠 㻝㻡 㻮㼕㼠㼞㼍㼠㼑㼇㻹㼎㼜㼟㼉. 㻝㻢. 㻝㻣. 㻝㻤. 㻝㻥. 㻞㻜. SSIM による画質評価結果 (Woman in flowers) Fig. 9 SSIM of ”Woman in Flowers”. 用回線を用いて約 60 分間行った.各ピクチャに付与する FEC パケット数は,I ピクチャに 対して 7 パケット,P ピクチャに対して 4 パケットとした.これらは FEC の処理負荷とエ. 5. 適用シーン. ラーに対するカバー率とのトレードオフを事前実験にて評価したうえで設定した.本コー デックに搭載された FEC は遅延を増やす事無くパケットロスが発生したピクチャのうちの. 本コーデックは高品質なテレビ電話,テレビ会議,遠隔講義等に適用可能である.また,. 約 90%以上のピクチャを回復可能である.これにより,一般的な IP 網上での高品質な双方. 遠隔医療,遠隔診断,遠隔問診等の高画質が求められる分野においても適用可能であると考. 向通信が可能である.. えられる.本コーデックシステムは一昨年の InterBEE2008 に出展し,幕張会場と事業所. 4. ° c 2010 Information Processing Society of Japan.

(21) Vol.2010-AVM-68 No.3 2010/3/4. 情報処理学会研究報告 IPSJ SIG Technical Report 㻜㻚㻥㻝. 㻜㻚㻥㻜. 㻿㻿㻵㻹. 㻜㻚㻤㻥. 㻜㻚㻤㻤. 㻶㻹㻝㻡㻚㻝㻌㻔㻾㻰㻙㼛㼒㼒㻕 㻼㼞㼛㼜㼛㼟㼑㼐 㻜㻚㻤㻣. 㻜㻚㻤㻢 㻡. 㻢. 㻣. 図 10. 㻤. 㻥. 㻝㻜 㻝㻝 㻝㻞 㻮㼕㼠㻌㼞㼍㼠㼑㼇㻹㼎㼜㼟㼉. 㻝㻟. 㻝㻠. 㻝㻡. 図 11 デモンストレーションの様子 (InterBEE2008) Fig. 11 A photo of demonstration (InterBEE2008). 㻝㻢. SSIM による画質評価結果 (Video phone) Fig. 10 SSIM of ”Video phone”. 2) K. Iwata, S. Mochizuki, T. Shibayama, F. Izuhara, H. Ueda, K. Hosogi, H. Nakata, M. Ehama, T. Kengaku, T. Nakazawa, and H. Watanabe, ”A 256mW Full-HD H.264 High-Profile CODEC Featuring Dual Macroblock-Pipeline Architecture in 65nm CMOS”, Symposium on VLSI Circuits, 2008, pp. 102-103. 3) M. Ikeda, H. Iwasaki, K. Nitta, T. Onishi, T. Sano, A. Sagata, Y. Nakajima, M. Inamori, T. Yoshitome, H. Matsuda, R. Tanida, A. Shimizu, and J. Naganuma, ”A Professional H.264/AVC CODEC Chip-Set for HDTV Broadcast Infrastructure and High-End Flexible CODEC Systems,” A Symposium on High Performance Chips (HOT CHIPS 19), Aug. 2007. 4) Koyo Nitta, Mitsuo Ikeda, Hiroe Iwasaki, Takayuki Onishi, Takashi Sano, Atsushi Sagata, Yasuyuki Nakajima, Minoru Inamori, Takeshi Yoshitome, Hiroaki Matsuda, Ryuichi Tanida, Atsushi Shimizu, Ken Nakamura, and Jiro Naganuma, ”An H.264/AVC High422 Profile and MPEG-2 422 Profile Encoder LSI for HDTV Broadcasting Infrastructures,”, 2008 IEEE Symposium on VLSI Circuits, pp.106107, 2008. 5) Tatsuji Moriyoshi and Shigeki Miura,“ Real-time H.264 Encoder with Deblocking Filter Parallelization, ” ICCE 2008, 2008, 2.4-2. 6) Takayuki Onishi, Takashi Sano, Hiroe Iwasaki, Jiro Naganuma, “H.264/AVC 双方 向 HDTV リアルタイムソフトウェアコーデックにおける低遅延 FEC 性能評価”, 信学 会全国大会 2009, D-11-9, 2009. 7) Satoru Iai, Takaaki Kurita, Nobuhiko Kitawaki, “ Quality Requirements for Multimedia Communication Services and Terminals –Interaction of Speech and Video Delays–, ” in GLOBCOM ’93, 1993, vol. 1, pp. 394-398. 8) Joint Video Team (JVT), H.264/AVC JM Reference Software.. とを IP ネットワークを介して双方向通信を行うことで,高品質な映像コミュニケーション システムの実演を行った (図 11).. 6. お わ り に 本稿では HDTV 対応双方向通信用 H.264/AVC リアルタイムソフトウェアコーデックの構 成と評価結果について述べた.本コーデックではフル HD サイズの高画質な映像と 165msec の遅延量による円滑な会話,マクロブロックノイズの無い高品質なエラー耐性処理により, 臨場感のある高品質なテレビ電話,テレビ会議システムを実現する事が可能である.今後は 更なる高画質・低レート化と,大画面,多地点対応等の多機能化を進めていく予定である.. 参. 考. 文. 献. 1) ISO/IEC, Information Technology - Coding of Audio Visual Objects - Part10 : Advanced Video Coding 2003.. 表 4 FEC によるエラー訂正処理の評価 Table 4 Error correction by FEC. A to B B to A. Lost frames 185 86. Recovery frames 171 79. Recovered rate[%] 92.4 91.9. Average frame rate[fps] 29.95 29.96. 5. ° c 2010 Information Processing Society of Japan.

(22)

Fig. 3 Error concealment
表 2 システム構成 Table 2 System configutation CPU Intel Core i7-940 (2.93GHz)
図 9 SSIM による画質評価結果 (Woman in flowers) Fig. 9 SSIM of ”Woman in Flowers”
表 4 FEC によるエラー訂正処理の評価 Table 4 Error correction by FEC

参照

関連したドキュメント

参加方式 対面方式 オンライン方式 使用可能ツール zoom Microsoft Teams. 三重県 鈴鹿市平田中町1-1

Furuta, Two extensions of Ky Fan generalization and Mond-Pecaric matrix version generalization of Kantorovich inequality, preprint.

(In the sequel we shall restrict attention to homology groups arising from normalising partial isometries, this being appropriate for algebras with a regular maximal

Possibly new results derived from these formulas are a limit from Koornwinder to Macdonald polynomials, an explicit formula for Koornwinder polynomials in two variables, and

As Llarull rigidity theorem (and the weighted rigidity theorem) still holds if the condition that h is 1-contracting is replaced by the condition that h is area-contracting,

2 To introduce the natural and adapted bases in tangent and cotangent spaces of the subspaces H 1 and H 2 of H it is convenient to use the matrix representation of

In recent work [23], authors proved local-in-time existence and uniqueness of strong solutions in H s for real s > n/2 + 1 for the ideal Boussinesq equations in R n , n = 2, 3

[r]