算出されたエントロピーと
WMSE
との関係を求める.なお,上記のスキャン法は多数存 在するが,算出されるエントロピーの値は,このスキャン法には依存しない.図5.2(a)〜(e)に示した各画像に対して,
WMSE
とエントロピーの関係を求めた結果を図 5.6(a)〜(e)に示す.同図においては,図5.4と図5.5に示した2種類の帯域分割方式により 得られた帯域分割パターンを適用した場合の特性を比較している.図5.6 において,まず,視覚の空間周波数特性を考慮した本最適帯域分割は," 視覚の 空間周波数特性を考慮しない最適帯域分割方式 " と比べて
WMSE
の値が小さくなってい ることを確認することができる.2種類の帯域分割方式によるこの差は,画像によって若 干異なっており,これは,前節の表5.1に示したG
(W)についての比較評価結果に対応する ものとなっている.また,各画像における2種類の帯域分割方式における両特性は,エン トロピーの値が小さくなったところで漸近する.これは,ビットレートが小さくなる,す なわち,量子化ステップ幅が大きくなることで,分散の小さな信号を多く含む高域の帯 域信号は,そのほとんど全ての値が代表値ゼロに量子化されてしまい,視覚の空間周波 数特性を考慮することの効果が小さくなるためである.この傾向は,信号電力が低域に 集中している,例えば,図5.6(a)にその特性を示した画像"Hada"においてより大きくなっ ている.以上より,視覚の空間周波数特性を考慮することは,特に,ビットレートが比 較的大きい場合に,WMSE
の低減,すなわち,ランダムノイズを低減するために有効であ ることを定量的に評価することができた.3 2
1 0
.01 .1 1 10 100
optimum band partition based on band blocks with human visual sensitivity optimum band partition based on band blocks
entropy [bit/pel]
weighted mean square error (WMSE)
(a) 画像 "Hada"
図 5.6 WMSE対エントロピー
図 5.6 WMSE対エントロピー (b) 画像 "Lenna"
(c) 画像 "Cameraman"
3 2
1 0
.1 1 10 100
optimum band partition based on band blocks with human visual sensitivity optimum band partition based on band blocks
entropy [bit/pel]
weighted mean square error (WMSE)
5 4
3 2
1 0
.01 .1 1 10 100
optimum band partition based on band blocks with human visual sensitivity optimum band partition based on band blocks
entropy [bit/pel]
weighted mean square error (WMSE)
(d) 画像 "Tulip"
(e) 画像 "Wine"
図 5.6 WMSE対エントロピー
5 4
3 2
1 0
.01 .1 1 10 100
optimum band partition based on band blocks with human visual sensitivity optimum band partition based on band blocks
entropy [bit/pel]
weighted mean square error (WMSE)
4 3
2 1
0 .01
.1 1 10 100
optimum band partition based on band blocks with human visual sensitivity optimum band partition based on band blocks
entropy [bit/pel]
weighted mean square error (WMSE)
5.5.2 主観評価実験による画質評価
視覚の空間周波数特性を考慮した本最適帯域分割法の適用によって得られた再生画像 に対して,視知覚特性を考慮した画質の評価を行い,また,JPEGで用いられている(8
×
8) 画素のDCTを適用した場合と比較する.本評価を行う理由は,前節において評価尺度と して導入したWMSE
では,再生画像の画質に対して,ランダムノイズの大小についての みの評価しか行えず,正確な画質評価においては不十分なものと考えたからである.視 覚の空間周波数特性を考慮した本最適帯域分割による再生画像には,その構成上,視知 覚的に最大の画質劣化要因となるブロックひずみは生じないものの,ランダムノイズ以 外の符号化ひずみが含まれていないとは言えない.特に,そのひずみがテクスチャ状の パターンをもっているような場合には,誤差の間に強い自己相関性を有することから,ラ ンダムノイズに比べて,約10倍の視知覚的妨害があるとされている[39],[40].そのため,これら全ての視知覚的妨害を十分考慮した上で,本最適帯域分割による画質の評価を行 う必要がある.
まず,視覚の空間周波数特性を考慮した本最適帯域分割による再生画像において,上 述したテクスチャ状のノイズが含まれているか否かを調査する.図 5.2(a)に示した画像
"Hada" を一例として,ある特定のビットレートにおいて,視覚の空間周波数特性を考慮 した本最適帯域分割法を適用することにより得られた再生画像と原画像との差分画像を 図 5.7に示す.同図においては,比較のために,同じビットレートのもとで," 視覚の空 間周波数特性を考慮しない最適帯域分割"を適用した場合の再生画像と原画像との差分画 像,また,JPEG で用いられている(8
×
8)画素の DCT を適用した場合の再生画像と原画像 との差分画像を示している.図5.7(a)に示した視覚の空間周波数特性を考慮した本最適帯 域分割における差分画像より,その符号化に起因して生じる雑音のほとんどは,ランダ ムノイズであることが分かる.しかし,画像内の人物の顔の部分に強い自己相関性をも つパターン状のひずみが現れている.次に,2つの比較方式の符号化ひずみについても考 察を行えば,図 5.7(b)に示した " 視覚の空間周波数特性を考慮しない最適帯域分割方式 "は,図5.7(a)の場合と同様,その構成上の理由から,差分画像に現れる符号化雑音は,ラ ンダムノイズが大半を占める.図 5.7(c)に示した(8
×
8)画素のDCT による再生画像は,図 5.7(a),(b)のものに比して,ランダムノイズは小さくなっているものの,逆に,ブロック ひずみに代表されるはるかに大きなテクスチャ状のパターンノイズが現れている.このことから,視覚の空間周波数特性を考慮した本最適帯域分割及び比較方式による 再生画像に対して,視知覚特性を考慮した画質を評価するためには,前項のWMSE評価 のみでは完全なものであるとは言えない.また,符号化方式や画像内容が異なる場合に,
それらの全てを網羅して,上記のテクスチャ状のパターンノイズに代表される全ての視 知覚的妨害を含めてオーバーオールの画質を評価し得る客観的画質評価尺度は,未だ明 らかにされていない.そこで,上記の 3 種類の帯域分割方式による再生画像の画質を比 較・評価するために,主観評価実験を行う.
図 5.7 各帯域分割方式における再生画像と原画像との差分画像
(画像 "Hada",0.6[
bit/pel
])(c) (8
×
8)DCT(a) 帯域ブロックをベースとする視覚の空間周波数特性を考慮した最適帯域分割
(b) " 視覚の空間周波数特性を考慮しない最適帯域分割方式 "
主観評価実験は,表5.2に示した条件に基づいて,既に評価訓練を終えた評定者に対し て実験の目的を明示することで行った.表5.2 の条件は,CCIR勧告に記載されたものと 若干異なっているが,画面全体の印象というよりむしろ画像の重要な中心部分における 誤差の影響を解析的に見極めるために誤差が目立つよう周囲を暗室とした.また,
(256