2006 年度 卒業研究
画像補間法を用いた拡大画像の比較
岡山理科大学
総合情報学部
情報科学科
澤見研究室
I03I042 兼安 俊治
I03I050 境 永
目次 1 はじめに・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 2 ラスタ画像・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 3 画像補間法・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 3.1 ニアレストネイバー法・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 3.2 バイリニア法・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 3.3 バイキュービック法・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 4 DCT を用いた拡大画像手法・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 5 FIR 法・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 6 評価・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 6.1 SNR・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 6.2 PSNR・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 7 実験・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 7.1 主観評価・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 7.2 客観評価・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 8 まとめ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 9 今後の課題・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 参考文献・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・
1 はじめに 近年高性能な携帯電話,デジタルカメラ,パソコン,等の普及により,様々な大きさの画像が 必要となっている.携帯電話のカメラ機能やデジタルカメラで撮った画像をパソコンで表示 する表示する場合や逆にパソコンからの画像を携帯電話で表示する場合には画像を拡大,縮 小する必要がある. 本研究では,画像の拡大に焦点をあて,画像補間法として頻繁に用いられる代表的な手法 (ニアレストネイバー法,バイリニア法,バイキュービック法)と DCT に加え,FIR 法による拡 大画像の主観評価,客観評価し比較する.
2 ラスタ画像 ラスタ画像とは,一般的にビットマップ(BMP:Bitmap)と呼ばれるものであり,画像を2次 元格子上に並んだ点の集合として表現する方式である.このひとつの点であるを画面を構成 する最小の単位をピクセルと呼ぶ.コンピュータ上ではこのピクセルに対して,色や明るさ などの情報を持つことになる.ディジタル写真などのカラー画像は縦方向のピクセル数横方 向のピクセル数,そして個々のピクセルの色深度(表示色数)で表すことができる.例えば25 6×256の画像であれば縦方向ピクセル256個と横方向ピクセル256個で構成され ている.また,ラスタ画像は画素を 2 次元配列で扱うことができる.本研究では,2 次元配列を 左上を原点とする2 次元座標平面として扱うことにする. 図1 ラスタ画像
3 画像補間法 一般的に画像を拡大する場合,元画像と元画素との間に推定した画素を与える補間法が用 いられる.本章では画像補間法として代表的な手法であるニアレストネイバー法,バイリニ ア法,バイキュービック法の説明をする. 3.1 ニアレストネイバー法 高速だが精度の低い方法である.画像内の最隣接ピクセルを複製する.この方式は,アンチ エイリアス処理されていないエッジのあるイラストにおいて,鮮明な線を保持する場合に使 用する.ただしこの方法では,画像を変形したり,拡大縮小したり,一つの選択範囲に対して複 数の処理を実行すると,修正部分がギザギザになり画質の劣化することがある. 求めたい座標を(x,y)とすると,その位置の画素値 I を次式で表す.
])
5
.
0
[
],
5
.
0
([
)
,
(
x
y
=
f
x
+
y
+
I
式1 ニアレストネイバー法 図2 ニアレストネイバー法3.2 バイリニア法 周辺のピクセル値四個の重み付け平均をしてピクセルを追加する方式である.Windows のプレビューの拡大などに使われている.バイリニア補間法では求めたい座標(x,y)の画素値 I(x,y)を,周りの 4 点を使い次式で表す.
)
1
]
[
,
1
]
([
)
]
)([
]
([
])
[
,
1
]
([
)
,
1
]
)([
]
([
)
1
]
[
],
([
)
]
)([
1
]
([
])
[
],
([
)
1
]
)([
1
]
([
)
,
(
+
+
−
−
+
+
+
−
+
+
−
−
+
+
−
+
−
+
=
y
x
f
y
y
x
x
y
x
f
y
y
x
x
y
x
f
y
y
x
x
y
x
f
y
y
x
x
y
x
I
式2 バイリニア 図3 バイリニア3.3 バイキュービック法 周辺のピクセル値十六個の重み付け平均をしてピクセルを追加する方式である,計算量が 多いため時間はかかるが,より精度の高い方式である.現在最も一般的に用いられている方 法である. バイキュービック法補間では求めたい位置(x,y)の画素値 I(x,y)の周りの 16 点を使い次式で 表す.
⎥
⎥
⎥
⎥
⎦
⎤
⎢
⎢
⎢
⎢
⎣
⎡
⎥
⎥
⎥
⎥
⎦
⎤
⎢
⎢
⎢
⎢
⎣
⎡
=
)
4
(
)
3
(
)
2
(
)
1
(
44
43
42
41
34
33
32
31
24
23
22
21
14
13
12
11
))
4
(
)
3
(
)
2
(
)
1
(
(
)
,
(
y
h
y
h
y
h
y
h
f
f
f
f
f
f
f
f
f
f
f
f
f
f
f
f
x
h
x
h
x
h
x
h
y
x
I
式3y
y
y
x
x
x
y
y
y
x
x
x
y
y
y
x
x
x
y
y
y
x
x
x
−
+
=
−
+
=
−
+
=
−
+
=
−
=
−
=
−
+
=
−
+
=
2
]
[
4
2
]
[
4
1
]
[
3
1
]
[
3
]
[
2
]
[
2
]
[
1
1
]
[
1
1
式4 図4 バイキュービック法4 DCT を用いた拡大画像手法 DCT は離散フーリエ変換の特殊なものであり,実数からなる信号からの実数からなる係 数への変換を行う.DCT では元の関数に対し鏡像部分を加え,偶関数に変換した上で処理す るので,係数が実数になる上,特定の成分での集中度が上がる.DCT には標準的な方法が 8 通 りあり,そのうち 4 通りが一般的に用いられる.本章では DCT-I と DCT-II について説明する. 尚本研究ではDCT-I を用いる. 4.1 DCT-I DCT-I は全体のスケールファクタが 2 までの場合,2N-2 個の実数をもつ偶対称関数の DFT と全く同じものである.例えば,DCT-I で N=5 とし,5 個の実数を abcde とすると,これは 8 個の実数 abcdedcb(偶対称)に対する DFT を 2 で割ったものになる.DCT-I は,N≧2で ないと定義できないことに注意する.
( )
{
}
∑
− = −⎭
⎬
⎫
⎩
⎨
⎧
−
+
−
+
=
2 1 1 01
cos
1
2
1
N n n n k knk
N
x
x
x
X
π
式 DCT-I 2D-DCT 2D-IDCT 0値を追加 元画像 拡大画像 画素値 DCT係数 0値4.2 DCT-II DCT-II は最も広く用いられている方法で,単に DCT と呼ばれることもある。この方法は 全体のスケールファクタが2 までの場合,入力される実数の数が4N 個であり,偶対称で且つ 偶数番目の要素が0である場合のDFT と全く同じもである.
∑
− =⎭
⎬
⎫
⎩
⎨
⎧
⎟
⎠
⎞
⎜
⎝
⎛ +
=
1 02
1
cos
N n n kn
k
N
x
X
π
式 DCT-II また,DCT-III,DCT-IV の式については以下のようになる.⎭
⎬
⎫
⎩
⎨
⎧
⎟
⎠
⎞
⎜
⎝
⎛ +
+
=
∑
− =2
1
cos
2
1
1 1 0n
k
N
x
x
X
N n n kπ
式 DCT-III⎭
⎬
⎫
⎩
⎨
⎧
⎟
⎠
⎞
⎜
⎝
⎛ +
⎟
⎠
⎞
⎜
⎝
⎛ +
=
∑
− =2
1
2
1
cos
1 0k
n
N
x
X
N n n kπ
式 DCT-VI5 FIR 法
[ ]
∑
=[
]
=−
=
m N m mx
n
m
h
n
y
0 式 FIR 法 図66 評価 画質の評価には視覚的な評価である主観評価と,数値的な評価である客観評価がある. 本研究ではSNR および PSNR により数値比較を行う. 6.1 SNR SNR は信号対雑音比ともいい信号量 S(Signal)の雑音量 N(Noise)に対する比率(S/N).SN 比ともいう.SNR は雑音を基にした画質の評価尺度であり誤差の 2 条平均値を表している. 式は以下のように表す.
(
)
∑
∑
−
=
2 ' 2 10log
20
k k ky
y
y
SNR
式 SNR 6.2 PSNR PSNR は信号の理論ピーク値と誤差の2乗平均値を用いて評価した値であり,値 255(最大 濃淡値)を誤差の標準偏差で割った値である.これらの常用対数により表し,単位は dB である. 式は以下のように表す.(
)
∑
−
=
2 ' 10255
log
20
k ky
y
PSNR
式 PSNR7 実験 7.1 実験方法 主観比較と客観比較を行う.主観比較では SIDBA 標準画像 Lenna(256×256)を用いて,元 画像の一部を抜きだし,それぞれの画像補間を用いて拡大し,拡大画像の主観評価を行う.客 観比較では,元画像を縮小し,元画像のサイズに拡大後,元画像と比較し数値による比較を行 う.本研究では SNR と PSNR により客観比較を行う. 図7 7.2 主観評価
図8 元画像
図9 ニアレストネイバー法
図11 バイキュービック法
図14 元画像
図15 ニアレストネイバー法
図17 バイキュービック法
図20 元画像
図21 ニアレストネイバー法
図23 バイキュービック法
8 まとめ SIDBA 標準画像 Mandrill を対象に実験を行ったが,今回比較した手法の中では主観評価, 客観評価ともにバイリニア法が最もよい結果を示した. 今回簡単な FIR 法を用いた が,あまり良い結果を得ることはできなかった.全体の色が薄くなり,黒い点が目立ったが, はっきりした原因はわかっていない.しかし,FIR 法は他の画像補間手法に比べて比較的に 処理時間は早かった. 9 今後の課題 今後の課題として,FIR 法による拡大画像にだけ見られた黒い点を除去し画像全体が薄く なるのを防ぐ方法を見つけたい. また,それぞれの画像補間手法の処理時間の比較を行うこと,対象画像を自然画像に限ら ず,非自然画像(CG, 文字,地図など)に広げ,今回行った FIR 法と同じ方法を用い、さらに画 像を保存するときに劣化する現象を防ぐことを可能にするより実用的な FIC 法に取り組み たい. 参考文献 [1] “画像拡大手法に関する考察” 川崎高志 http://mikilab.doshisha.ac.jp/dia/monthly/monthly01/20011222/personal_kawasaki.p df [2] “各種画像拡大手法の評価” 澤見研究室,2005 年 [3] “多重関数基底による高速・高精度画像処理とその応用” 市毛 弘一 http://www.taf.or.jp/publication/kjosei_20/pdf/p266.pdf [4]“基本的な画像処理手法について” http://www.mis.med.akita-u.ac.jp/~kata/image/index-j.html [5]“Sample Images” http://www.mis.med.akita-u.ac.jp/~kata/image/originalsource/index-j.html [6]“HWB(HWB)” http://hwb.ecc.u-tokyo.ac.jp/current/485742.html [7]”ウィキペディア フリー百科事典(2007 年 2 月 26 日)” http://ja.wikipedia.org/wiki/%E9%9B%A2%E6%95%A3%E3%82%B3%E3%82%B5%E3 %82%A4%E3%83%B3%E5%A4%89%E6%8F%9B#DCT-I