学生 23 省メモリ指向一枚超解像アーキテクチャとその FPGA 実装北海道大学大学院情報科学研究科大平貴徳真田祐樹築田聡史五十嵐正樹池辺将之浅井哲也本村真人 1

(1)

省メモリ指向一枚超解像

アーキテクチャとその

FPGA実装

大平　貴徳

、

真田　祐樹

、

築田　聡史

、

五十嵐　正樹

、

池辺　将之

、

浅井　哲也

、

本村　真人

1

北海道大学大学院　情報科学研究科

学生₂₃

(2)

研究背景

ー高速ー低コストー解像度の精度

・映像機器の高機能化に伴う映像の高解像化

解像度を高める研究（超解像）

４Kテレビ Super Resolu2on image-‐processing

・省メモリ指向ハードウェアアーキテクチャ

・一枚超解像の

FPGA

実装

2 ーレティナディスプレイー_{4Kハイビジョンテレビ}

・低解像度の映像コンテンツが数多く存在

(3)

超解像の分類

再構成型

学習型

①映像や連写から複数枚の画像を用意

②それぞれの位置を合わせる

③画素を情報を対比させ繰り返しの処　　　　　　　　　

　　理を行う

①予め画像のパターンを学習

②入力画像とパターンを比較

③パターンにより画素情報を復元し出力

3 入力画像出力画像画像パターン位置合わせ処理復元処理入力画像出力画像繰り返し演算位置合わせ処理再構成型演算処理

(4)

実装するアルゴリズムの位置づけ

ーハードウェア指向ー高速処理ー低コスト

従来の超解像

本研究で用いた一枚超解像

・複数枚の画像から高解像な画像を生成・学習パターンから高解像な画像を生成ー複数画像やデータベースを　使用するので高コストー位置合わせやイタレーション　が必要なため演算量が多い 4 ・一枚画像のみ使用・繰り返しなしのストレートフォワード処理演算処理

とても奇麗な出力が得られるが・・・

繰り返し演算リミッタ２リミッタ１入力画像出力画像拡大エッジ抽出高周波生成加算演算処理

(5)

一枚超解像アルゴリズム

①縦横それぞれ2 倍に拡大 ②拡大された画像にハイパスフィルタを　　施し、エッジ信号を抽出 ③非線形処理によりエッジから高調波を取得 ④発生した高調波を元画像に加算することに　　より高解像な出力を得る

[1]S.Goshi, ”A new signal processing method for video –Reproduce the frequency spectrum exceeding the Nyquist frequency-‐,” Proc. 3rd

Mul2media Systems Conf.,pp.47-‐52,2012. 5

リミッタ２リミッタ１入力画像出力画像拡大エッジ抽出高周波生成加算

一枚超解像アルゴリズムフロー

[1]ではLanczos補間を用いて

画像の拡大を行っている

本研究ではこれを提案手法へ拡張

拡大

(6)

•  Lanczos補間

sinc関数に基づく補間法

–  Lanczos2フィルタ

•  ４行の入力ラインバッファ

•  バイキュービック補間に類似

–  Lanczos3フィルタ

•  7行の入力ラインバッファ

•  理想的な補間

拡張した拡大部の説明

Lanczos kernel

•  考案手法

・　４行の入力ラインバッファ

・ボックスフィルタリングに基づく処理

・　整数演算

サンプリングポイント（右側のみ）

B. Pribyl,”Fine image resampling algrothm” Proceedings of CESCG 2010

・ハードウェア指向

・境界部におけるジャギーが少ない

・低コストかつ高精度な補間が可能

6

・

_Lanczos2

ではジャギーが無視できない

・

_Lanczos3

は高精度であるが計算コスト

　や資源量が大きい

(7)

拡大アルゴリズムのフロー

7

Up sampling

bilinear x2 Up sampling bilinear x2

input _{4
neighbor}Max, Min

Max Min Box ﬁltering

7 × 7 reﬁnement Edge sampling Down output

①バイリニア補間を用いて入力画像を４倍する

②拡大した画像の最隣４画素の最大値と最小値を算出

③拡大した画像に７×７の移動平均フィルタをかけ、ジャギーを除去

④算出した最大値、最小値を用いてジャギーを除去した画像のエッジを復元

⑤画像を半分に縮小し、最終的に入力画像の２倍の画像を出力

(8)

拡大：バイリニア拡大

8

・線形補間を用いた拡大法

・再近傍の平均を取り画素を補間

・加算器、セレクタ、シフタにより構成

A B A B C C D D Bilinear×2 Bilinear×2 P₁ = A + C 2 , P3 = P₁+ P2 2 , P2 = B + D 2 , Up sampling bilinear ×4 Box filtering 7×7 Edge Refine input output Down sampling bilinear 1/2 Max,Min 4 neighbor input2 Reg >>1 input1 output1 output2 Reg >>1 >>1

回路セル

(9)

拡大：ボックスフィルタリング

9

P

₅

=

1

9 (P

1

+ P

2

++ P

9

)

・

7×7の移動平均フィルタ

・ジャギーを除去しエッジを平滑化

・１行のラインバッファ、シフタ、加算器

により構成

P1 P2 P3 P4 P5 P6 P7 P8 P9 P1 P2 P3 P4 P6 P7 P8 P9 P5 boxﬁltering 7×7 ※３×３のカーネルの場合 Up sampling bilinear ×4 Box filtering 7×7 Edge Refine input output Down sampling bilinear 1/2 Max,Min 4 neighbor Add data Next data output Sub data Reg Shift Reg

回路セル

(10)

拡大：

Max,Minの算出

10

・最近傍点における輝度の最大値

と最小値を算出

・レジスタ、比較器により構成

P₃ = max(P1, P2,P5) P3 = min(P1, P2,P5) P1 P2 P4 P5 P3 P1 P2 P3 P4 P5 Max _Min Max Min Up sampling bilinear ×4 Box filtering 7×7 Edge Refine input output Down sampling bilinear 1/2 Max,Min 4 neighbor Reg Reg SW SW SW SW SW SW SW SW SW SW Max Min 2nd 3rd 4th e n w s c

回路セル

(11)

拡大：エッジリファイン

11

Max Min

P ' = (Max − Min)* (1+ tanh(10 * (P / 255 − 0.5)))

2 − Min Max Min Max Min P

・最近傍における輝度の最大値と

最小値の間で傾きを立ち上げる

・ルックアップテーブル、セレクタ、

加算器により構成

Edge Reﬁne Up sampling bilinear ×4 Box filtering 7×7 Edge Refine input output Down sampling bilinear 1/2 Max,Min 4 neighbor Look-Up Table Boxfilter Min Max Output

回路セル

(12)

拡大：バイリニア縮小

12 A B A B C C D P = A + B + C + D 4 bilinear 1/2

・線形補間を用いた画像の縮小

・近傍画素の平均を取り画像を縮小

・レジスタ、加算器、シフタにより構成

P Up sampling bilinear ×4 Box filtering 7×7 Edge Refine input output Down sampling bilinear 1/2 Max,Min 4 neighbor input2 Output Reg Reg >>2 input1 Reg

回路セル

(13)

拡大部回路構成図

13 input image (serial input) enlarged image (serial output) up sampling up sampling up sampling up sampling line buffer up sampling down sampling down sampling box filter edge refinement edge refinement edge refinement edge refinement Max / Min Max / Min Max / Min Max / Min box filter box filter box filter up sampling flow line Buffer up sampling line Buffer up sampling up sampling line Buffer line Buffer line Buffer up sampling flow 0

Box ﬁltering

Max, Min

Edge

reﬁnement

Down sampling

bilinear 1/2

Up sampling

bilinear ×4

(14)

ボックスフィルタ回路構成図

14

11

8 8 8

add2 add3 add4

output1 output2 output3 output4 Line buffer 15 15 15 15 sub1 sub2 sub4 sub3 11 11 8 add1 加算加算 Shift Register Box filter 11 11 8 8 8 8 8 加算加算 Shift Register 11 11 8 加算加算 Shift Register 11 11 8 加算加算 Shift Register line buffer box filter box filter box filter box filter

Box ﬁltering

(15)

超解像回路構成図

c' = c +

α

(c −

4c + w + e + n + s

8 )

3

= c +

α

2

9

(4c − w − e − n − s)

3 15 リミッタ２リミッタ１入力画像出力画像拡大エッジ抽出高周波生成加算 s s s n n n e e e c c c w w w Input data

line buffers (2N pixels) x 2 8 8 8 8 8 高周波生成リミッタ１エッジ抽出加算リミッタ２ output 10+1 30+1 8+1 8 9 (4c-s-n-w-e) (4c-s-n-w-e) 3 8+1 EXT0 : パイプラインレジスタ

(16)

•  FPGAについて

–  ボード：PowerMedusa,MU300-DVI,

StartiX II (Altera)

–  ソフトウェア: Quartos II

•  拡大部

–  開発言語：Verilog HDL

•  超解像部

–  開発言語：VHDL、Verilog HDL

–  DVI入出力

–  60fps, VGA

16

FPGA実装結果

Register ALUT Fmax

18,628 2,521 43.5MHz

Register ALUT FPGA CLK

31,732 16,651 90MHz

(17)

17

画像出力結果

入力画像 (200 × 200) バイキュービック補間＋超解像出力 (400 × 400) 超解像出力 (400 × 400) ・8bitグレースケール・_{200*200画素の画像} ・提案手法とバイキュービック補間　による超解像を比較

学生 23 省メモリ指向一枚超解像 アーキテクチャとその FPGA 実装 北海道大学大学院情報科学研究科 大平貴徳 真田祐樹 築田聡史 五十嵐正樹 池辺将之 浅井哲也 本村真人 1

省メモリ指向一枚超解像

アーキテクチャとその

FPGA実装

大平 貴徳

、

真田 祐樹

、

築田 聡史

、

五十嵐 正樹

、

池辺 将之

、

浅井 哲也

、

本村 真人

北海道大学大学院 情報科学研究科

研究背景

・映像機器の高機能化に伴う映像の高解像化

解像度を高める研究（超解像）

・省メモリ指向ハードウェアアーキテクチャ

・一枚超解像の

FPGA

実装

・低解像度の映像コンテンツが数多く存在

超解像の分類

再構成型

学習型

①映像や連写から複数枚の画像を用意

②それぞれの位置を合わせる

③画素を情報を対比させ繰り返しの処

理を行う

①予め画像のパターンを学習

②入力画像とパターンを比較

③パターンにより画素情報を復元し出力

実装するアルゴリズムの位置づけ

従来の超解像

本研究で用いた一枚超解像

とても奇麗な出力が得られるが・・・

一枚超解像アルゴリズム

一枚超解像アルゴリズムフロー

[1]ではLanczos補間を用いて

画像の拡大を行っている

本研究ではこれを提案手法へ拡張

拡大

• Lanczos補間

sinc関数に基づく補間法

– Lanczos2フィルタ

• ４行の入力ラインバッファ

• バイキュービック補間に類似

– Lanczos3フィルタ

• 7行の入力ラインバッファ

• 理想的な補間

拡張した拡大部の説明

• 考案手法

・ ４行の入力ラインバッファ

・ ボックスフィルタリングに基づく処理

・ 整数演算

・ハードウェア指向

・境界部におけるジャギーが少ない

・低コストかつ高精度な補間が可能

・

Lanczos2

ではジャギーが無視できない

・

Lanczos3

は高精度であるが計算コスト

や資源量が大きい

拡大アルゴリズムのフロー

①バイリニア補間を用いて入力画像を４倍する

②拡大した画像の最隣４画素の最大値と最小値を算出

③拡大した画像に７×７の移動平均フィルタをかけ、ジャギーを除去

④算出した最大値、最小値を用いてジャギーを除去した画像のエッジを復元

⑤画像を半分に縮小し、最終的に入力画像の２倍の画像を出力

拡大：バイリニア拡大

・線形補間を用いた拡大法

・再近傍の平均を取り画素を補間

・加算器、セレクタ、シフタにより構成

回路セル

学生 23 省メモリ指向一枚超解像アーキテクチャとその FPGA 実装北海道大学大学院情報科学研究科大平貴徳真田祐樹築田聡史五十嵐正樹池辺将之浅井哲也本村真人 1

大平　貴徳

真田　祐樹

築田　聡史

五十嵐　正樹

池辺　将之

浅井　哲也

本村　真人

北海道大学大学院　情報科学研究科

③画素を情報を対比させ繰り返しの処　　　　　　　　　

　　理を行う

•  Lanczos補間

–  Lanczos2フィルタ

•  ４行の入力ラインバッファ

•  バイキュービック補間に類似

–  Lanczos3フィルタ

•  7行の入力ラインバッファ

•  理想的な補間

•  考案手法

・　４行の入力ラインバッファ

・ボックスフィルタリングに基づく処理

・　整数演算

_Lanczos2

_Lanczos3

　や資源量が大きい