博士論文審査結果報告書
4
0
0
全文
(2) 情 報 社 会 の 発 展 に 伴 い ,マ ル チ メ デ ィ ア コ ン テ ン ツ が 広 く 利 用 さ れ て き た 。 動画像データはマルチメディアデータの多くの割合を占め、近い将来に超高 精 細 (UHD) ビ デ オ ア プ リ ケ ー シ ョ ン が 普 及 す れ ば 、 更 に 劇 的 に 増 加 す る 見 込みである。動画像の蓄積と通信の負担を軽減するために、ビデオ圧縮技術 が広く使用されてきた。圧縮することによって、大きな原画像データは、小 さなバイナリデータに変換される。復号化により、圧縮されたデータが解凍 さ れ て 、 画 像 と し て 表 示 す る こ と が で き る 。 2013 年 に 標 準 化 さ れ た High E f f i c i e n c y Vi d e o C o d i n g ( H E V C ) は 、 従 来 の H . 2 6 4 / AV C と 比 べ て 、 圧 縮 率 を 2 倍 に す る 最 新 の ビ デ オ 圧 縮 規 格 で あ り 、高 い 圧 縮 率 を 実 現 す る た め に 、 多 く の 新 し い 符 号 化 手 法 が 導 入 さ れ た 。結 果 と し て 、H E V C の 符 号 化 / 復 号 化 の 計 算 量 が 、H . 2 6 4 と 比 べ て 5 . 2 / 2 . 1 倍 と な っ た た め 、画 像 品 質 を 保 ち つ つ 、 計算複雑度の低いアルゴリズムおよびアーキテクチャの開発が望まれている。 動画像符号化では、原画像を予測画像との残差を用いて符号化するため、 ま ず 、種 々 の 予 測 法 に 対 し て 符 号 化 レ ー ト と 歪 み の コ ス ト ( R - D コ ス ト ) を 最 小化する符号化モードを決定し、再構成ループで再構成画像を作成して次の 処理へ進む。レートは、原画像と再構成画像からの予測画像との残差を符号 化するためのビット数および最良モード情報を表し、残差を空間領域から周 波 数 領 域 へ 離 散 コ サ イ ン 変 換 (DCT) 後 に 量 子 化 し て 削 減 し た 符 号 の ビ ッ ト 数で評価する。歪み度は原画像と再構成画像との間の差異を表し、逆量子化 と 逆 DCT (IDCT) を 用 い て 作 成 し た 再 構 成 画 像 の 原 画 像 か ら の 歪 み で 評 価 す る 。 モ ー ド の 決 定 で は 、 多 数 の モ ー ド の R-D コ ス ト を 評 価 す る 必 要 が あ り 、D C T と 量 子 化 お よ び そ の 逆 の 処 理 が 重 要 な 構 成 要 素 と な っ て い る 。H E V C で は 、 H . 2 6 4 と 比 較 し て 以 下 の 2 つ の 課 題 が あ る 。( 1 ) H E V C に お け る 大 き な 変 換 ブ ロ ッ ク サ イ ズ の 採 用 で 、D C T と I D C T の 占 め る 割 合 が 大 き く な り (イ ン ト ラ エ ン コ ー ダ で は 約 53% )、そ の 削 減 お よ び 電 力 の 効 率 化 が 重 要 で あ る 。( 2 )H E V C で は H . 2 6 4 よ り も 多 数 の モ ー ド ( イ ン ト ラ 予 測 だ け で 1 7 5 モ ー ド )が 存 在 し 、 モ ー ド 毎 に R-D コ ス ト を 計 算 す る と 膨 大 な 計 算 量 と な る 。 画質を保ちつつ、評価するべきモード数を減らすことが重要である。 本論文では、上記の課題に対し、モード決定と再構成ループに関わる 3 つ の研究トピックに取り組み、計算複雑度の少ないアルゴリズムおよびアーキ テ ク チ ャ を 提 案 し て い る 。( 1 )変 換 処 理 に 対 し て 計 算 方 式 と メ モ リ 構 成 の 最 適 化 に よ り 、ハ ー ド ウ ェ ア 量 を 削 減 し た ア ー キ テ ク チ ャ を 提 案 す る 。( 2 )再 構成ループの逆量子化と逆変換処理に対し、乗算器の再利用とゼロ要素のメ モリ読み書き操作のスキップにより、ハードウェア量と消費電力を削減する ア ー キ テ ク チ ャ を 提 案 す る 。( 3 )低 計 算 複 雑 度 コ ス ト モ デ ル に 基 づ き 、R - D コスト計算を必要とするイントラ処理のモード数を削減する手法を提案する。 論 文 は 以 下 の 5 つ の 章 で 構 成 さ れ て い る 。各 章 毎 に 概 要 を 述 べ 評 価 を 行 う 。 第 1 章 Introduction で は 、 動 画 像 符 号 化 の 全 体 の 処 理 に つ い て 説 明 し 、 動画像符号化におけるモード決定と再構成ループの位置付けと、3 つの研究 トピックを選択した動機付けを説明する。 第 2 章 A n A r e a - E f f i c i e n t Tr a n s f o r m A r c h i t e c t u r e D e s i g n で は 、小 さ な ハ ー ド ウ ェ ア 量 で DCT と IDCT 処 理 が 可 能 な ア ー キ テ ク チ ャ を 提 案 し て い る 。 変換処理は演算処理を必要とする行変換と列変換とからなる。さらに、行変 換 の 結 果 を 格 納 す る た め の 転 置 バ ッ フ ァ ( Tr a n s p o s e B u f f e r ) が 必 要 と な る 。 こ の と き H E V C の 変 換 ブ ロ ッ ク サ イ ズ が 大 き い た め 、2 つ の 問 題 が 存 在 す る 。 2.
(3) 第 1 の問題は、演算処理部のハードウェアコストが大きくなることである。 例 え ば 、3 2 ピ ク セ ル の ブ ロ ッ ク を 変 換 す る に は 、3 2 回 の 乗 算 と 3 1 回 の 加 算 が 32×32 の 出 力 の 各 要 素 の 計 算 に 必 要 と な る 。 第 2 の 問 題 は 、 転 置 バ ッ フ ァ 部 分 の ハ ー ド ウ ェ ア コ ス ト が 大 き く な る こ と で あ る 。3 2 ピ ク セ ル の ブ ロ ッ ク の 行 変 換 の 結 果 を 格 納 す る に は 、1 0 0 K 以 上 の ゲ ー ト 数 が 必 要 と な る 。第 1 の 問 題 に つ い て は 、 [Shen、 IEICE 2013]が 、 Chen の ア ル ゴ リ ズ ム [Chen、 TCOM 1977]を 用 い 、 変 換 行 列 の 対 称 性 を 利 用 し て 、 同 じ 係 数 の 計 算 を ま と めることで、乗算および加算の回数を減らす方法を提案している。本論文で はさらに、バタフライ構造の入力を各クロックサイクルで共有することがで き る 再 配 列 さ れ た パ ラ レ ル ・ イ ン ・ シ リ ア ル ・ ア ウ ト( Reordered PISO)方 式 を 提 案 し て い る 。 第 2 の 問 題 を 解 決 す る た め に は 、 SRAM を 用 い て 、 行 変 換 の 結 果 を 格 納 す る 新 た な 方 法 を 提 案 し て い る 。 [Zhu 、 ICIP 2013] で も S R A M を 用 い た 方 式 を 提 案 し て い る が 、最 悪 の ケ ー ス で I / O 使 用 率 が 1 2 . 5 % に過ぎないため、転置バッファの面積消費は依然として大きい。一方、本論 文で提案する手法では、転置バッファの操作を、行変換結果の格納位置を並 べ 替 え る こ と で 実 現 す る 方 法 を 提 案 し て い る 。結 果 と し て 、演 算 処 理 部 で は 、 [Shen、 IEICE 2013]と 比 較 し て 25% の ゲ ー ト 数 が 削 減 さ れ た 。 ま た 、 転 置 バ ッ フ ァ の ハ ー ド ウ ェ ア は 、[ Z h u 、I C I P 2 0 1 3 ] と 比 較 し 、約 6 2 % の 削 減 が 可 能となった。提案手法によりメモリ部を含めてハードウェア回路規模を削減 している点は学術面、実用面で評価できる。 第 3 章 A Low-Cost System Design for De-quantization and Inverse Tr a n s f o r m で は 、画 像 の 再 構 成 処 理 に お け る 逆 量 子 化 と 逆 変 換 の シ ス テ ム の アーキテクチャを提案している。逆量子化では量子化された入力係数をスケ ーリングパラメータとの乗算で元に戻した結果の保持にバッファ等が用いら れ、2 段階で行われる逆変換処理の中間結果の保持に転置バッファが使用さ れる。従来法では、逆量子化で乗算器が多用されること、および逆量子化と 逆変換処理の結果の記憶で、多くのゼロ要素が存在するにもかかわらず、通 常 の 数 値 と 同 様 に 扱 う こ と が 問 題 で あ っ た 。 [Tikekar 、 ICIP 2014] で は 、 逆 変換の演算処理部についてのみゼロ要素の処理をスキップしたが、メモリ操 作のゼロ要素の処理については行っていない。これらの問題に対して以下の 方法を提案している。逆量子化での乗算のハードウェアを減らすために、入 力 係 数 を ベ ー ス 部 分 (Base level)と 残 り の 部 分 の 2 つ に 分 解 す る 。 ベ ー ス 部 分 の 値 は 0, 1, 2, 3 に 限 ら れ る た め に 、 ベ ー ス 部 分 と ス ケ ー リ ン グ パ ラ メ ー タ の 乗 算 は ル ッ ク ア ッ プ テ ー ブ ル ( L o o k U p Ta b l e , L U T ) で 置 き 換 え る 。 残 り の 部 分 に つ い て は 、 4x4 の 処 理 ブ ロ ッ ク に お い て 、 ゼ ロ で な い 数 は 、 多 く の 場 合 、 4 個 よ り 多 く は な い た め 、 1 ク ロ ッ ク サ イ ク ル で 1 つ の 4×4 ブ ロ ッ ク を 処 理 す る た め に 4 つ の 乗 算 器 の み を 設 け る 。ゼ ロ で な い 数 が 4 つ 以 上 あ る場合には、出力順序を調整し 4 つの乗算器を異なるクロックサイクルで再 度、利用することで対応する。システム内の 2 つのバッファに対し、ゼロ要 素のメモリ操作をスキップするために入力係数のデータを再利用し、最初に ゼロ要素を検出する制御フローを作成する。検出後、メモリ操作のゼロスキ ッ プ を 実 施 す る 。 そ の 結 果 、 逆 量 子 化 処 理 に 対 し て 、 [Tikekar 、 ICI P 2014] と 比 較 し て 、本 提 案 は ハ ー ド ウ ェ ア 量 を 7 7 % 削 減 可 能 と し た 。メ モ リ 操 作 の ゼロスキップ法は、メモリ操作をスキップしない方法に比べてメモリ部分の 消 費 電 力 を 2 9 % 〜 8 6 % 削 減 す る こ と が で き た 。乗 算 器 の ハ ー ド ウ ェ ア 量 の 削 3.
(4) 減とメモリ部における電力の削減は実用面で評価できる。 第 4 章 Fast Prediction Unit Depth and Prediction Mode Selection Algorithm for HEVC Intra Prediction で は 、 イ ン ト ラ 予 測 の 予 測 ユ ニ ッ ト ( P r e d i c t i o n U n i t , P U )の 選 択 と 予 測 モ ー ド の 選 択 を 高 速 に 行 う 方 法 を 提 案 す る 。 HEVC テ ス ト モ デ ル ( HM) で は 、 PU の サ イ ズ が 5 通 り あ り 、 そ の 内 の 64×64 / 32×32 / 16×16 の 場 合 の R-D コ ス ト 計 算 を 必 要 と す る 予 測 モ ー ド の 数 は 3 で 、8 × 8 / 4 × 4 の 場 合 の 数 は 8 で あ る 。こ れ ら す べ て の 場 合 で R-D コ ス ト を 計 算 す る と 、 計 算 時 間 が 大 き く な る の で 、 多 く の 研 究 で は 、 最 良 の 可 能 性 が 低 い モ ー ド の R-D コ ス ト 計 算 を ス キ ッ プ す る 方 法 を 提 案 し て い る 。 [ X i o n g , I S PA C S 2 0 1 2 ] は 、 P U と 予 測 モ ー ド 選 択 の た め の 勾 配 ベ ー ス の高速決定アルゴリズムを提案したが、符号化の計算複雑度の削減度合が画 像 デ ー タ に 依 存 し 、計 算 時 間 が か か る 。[ Z h a n g 、V C I P 2 0 1 2 ] も 勾 配 ベ ー ス の 方法を提案し、計算時間は削減したが、画質の低下を招いている。そこで本 論文では新たなコスト計算モデルに基づく方法を提案している。最初に、単 純 化 さ れ た コ ス ト 計 算 に 基 づ い て 、高 速 な 前 処 理 を 行 う 。8×8 の コ ス ト を 見 積 も っ た 後 、 そ の 結 果 を 利 用 し て 、 よ り 大 き な PU の コ ス ト を 予 測 す る 。 予 測 し た 推 定 コ ス ト に 基 づ い て 、 5 つ の PU サ イ ズ の う ち の 2 つ の 隣 接 す る サ イ ズ の PU の み を 選 択 し 、 R-D コ ス ト 計 算 を 行 う 。 こ れ に よ り 、 HM で 採 用 されている詳細なコスト計算を避けることができる。提案したコスト計算モ デルでは大きな変換サイズでの計算はなくなるが、単純化されたコストのた め 実 際 の R-D コ ス ト と は 違 い が あ る 。 そ れ を 軽 減 す る た め に 、 32x32 PU に つ い て は 、 あ る 条 件 下 で R-D コ ス ト を 計 算 す る 補 償 方 式 を 提 案 し て い る 。 この補償法は、特に高解像画像の符号化性能を効果的に改善することができ る 。 H M( バ ー ジ ョ ン 7 . 0 ) と 比 較 し て 、 提 案 ア ル ゴ リ ズ ム は 、 イ ン ト ラ 符 号 化 処 理 に 関 し て 、 BD-bitrate は 1.87% の 圧 縮 効 率 の 低 下 で あ る が 、 約 52% の 計 算 時 間 の 削 減 を 達 成 し た 。一 方 、 [ X i o n g 、I S PA C S 2 0 1 2 ] と 比 較 す る と 、 BD-bitrate で 0.62% の 低 下 で あ る が 、 符 号 化 時 間 で は 平 均 で 14% 、 最 良 で 23% の 短 縮 を 実 現 で き て い る 。 ま た 、 [Zhang、 VCIP 2012]と 比 較 す る と 、 B D - b i t r a t e は 3 . 2 3 % の 向 上 で 、符 号 化 時 間 が 平 均 で 5 % の 増 加 と な っ て い る 。 画質劣化を抑えつつ時間短縮に新しい計算モデルを提案したことは学術的に 評価できる。 第 5 章 C o n c l u s i o n a n d F u t u r e Wo r k で は 、本 論 文 の 結 論 と 将 来 の 課 題 に ついて述べている。 以 上 、本 論 文 は H E V C に よ る 動 画 像 圧 縮 符 号 化 に お い て 、モ ー ド 決 定 お よ び再構成ループの課題に対する新アルゴリズムと新アーキテクチャを提案し、 学術的にも、実用的にも高く評価できる。よって本論文は博士(工学)の学 位論文として価値あるものと認める。 2017 年. 1 月 27 日. 審査員 主査. 早稲田大学教授. 工 学 博 士 (京 都 大 学 ). 木村晋二. 早稲田大学教授. 博 士 (工 学 )(大 阪 大 学 ). 吉村 猛. 早稲田大学教授. 工 学 博 士 (東 北 大 学 ). 早 稲 田 大 学 名 誉 教 授 工 学 博 士 (早 稲 田 大 学 ) 4. 渡邊 孝博 後藤 敏.
(5)
関連したドキュメント
これらと比べて約 14 倍と 17 倍のスループットを達成しており、8K UHD@60fps 映像を処理するに必要な 2G ピク セル/秒を達成している。この提案手法で
[r]
[r]
現在までに、1画面内の処理(空間予測)に対して、隣接ピクセルの値から推定する Lai-Man Po
(マルチレベルセル NAND 型フラッシュメモリ向け NB-LDPC 復号器アーキテクチャ)]であ り、MLC 型 NAND
であり、本提案の NRGSLBP 法で更により良い検出率の結果が得られた。Daimler データセッ トに対しては、NRGSLBP 法は 10 -3 FPPW、10 -4
[r]
In Chapter Four, the author discusses the topic of family formation, pressures to marry, gender roles within the family, cultural and religious differences between the