2.5 フィルタバンクの設計
2.5.1 構造・性質の導入
フィルタバンクの設計の最初の手順として,フィルタバンクに対して,必要不可欠な,または満 たされることが望ましい構造や性質を導入する.ここでいう“構造や性質”とは,例えば双直交性
(完全再構成条件),パラユニタリ性,線形位相性などを意味する(2.2.1項,2.2.2項).これらの 構造をフィルタバンクに導入するための制約条件は,
1. 双直交性:E(z)R(z) =z−NI 2. パラユニタリ性:E(z) ˜E(z) =I 3. 線形位相性:h(n) =h(N−n)
である.双直交性は,信号の完全再構成のために必ずフィルタバンクに課される条件であるが,パ ラユニタリ性や線形位相性は,適用する処理の対象によって選択する.
2.5.2 フィルタバンクの設計方式
次の手順として,前項に挙げた制約条件を満たしながら,フィルタ係数を最適化する.ただしこ の段階では,前項に挙げた制約条件を考慮しながら,フィルタ係数を最適化することは難しい.本 節では,より簡易にフィルタバンクを設計するためにしばしば用いられる,M 分割フィルタバン クの代表的な設計方式を述べる.
ハーフバンドフィルタの因数分解(2分割フィルタバンク)
本項では,2分割完全再構成フィルタバンクを構成するフィルタH0(z), H1(z), F0(z), F1(z)の 係数の決定法として,ハーフバンドフィルタの因数分解に基づく手法について述べる.決定すべき H0(z), H1(z), F0(z), F1(z)の条件を詳しく調べる.今F0(z) =H1(−z), F1(z) =−H0(z)とする とH0(z), H1(z), F0(z), F1(z)は式(2.11)を満たす.これはエイリアス除去条件と呼ばれる.
条件1.
F0(z) =H1(−z), F1(z) =−H0(z) (2.46)
ここでP0(z), P1(z)を
P0(z) =F0(z)H0(z), P1(z) =F1(z)H1(z) と定義する.条件1よりP0(z)とP1(z)は
P1(z) =−H0(−z)H1(z) =−H0(−z)F0(−z) =−P0(−z) (2.47) よりP1(z) =−P0(−z)の関係を満たす.式(2.10)は条件1とP0(z), P1(z)を用いて
F0(z)H0(z) +F1(z)H1(z) =P0(z)−P0(−z) = 2z−ℓ (2.48) と書き直せる.更に上式で両辺にzℓをかけてP(z) =zℓP0(z)とおくと
P(z) +P(−z) = 2 (2.49)
図2.19 フィルタバンクのラティス構造による表現
と簡潔に表現できる.式(2.49)を満たすP(z)をハーフバンドフィルタと呼ぶ.式(2.49)は定数 項を除いてP(z)のすべての偶数べきの係数がゼロであることを示している.以上を踏まえ,完全 再構成を満たす2分割フィルタバンクH0(z), H1(z), F0(z), F1(z)の設計手順を整理する.
1. ハーフバンドフィルタP(z)の設計.
2. P(z)をP(z) =zℓF0(z)H0(z)と因数分解する.
3. 条件1よりF1(z), H1(z)を設計する.
また,阻止域減衰量や直流漏れ(2.5.3項参照)に関して高い性能を持つように,ハーフバンドフィ ルタP(z)に対して,レギュラリティと呼ばれる,(1 +z−1)Kを含めることが有効となる[2]. ラティス構造(M 分割フィルタバンク)
フィルタバンクの分割数M,フィルタ長M K(Kは自然数)を満たすフィルタバンクの分割側 ポリフェーズ行列は一般的に,
E(z) = ( 1
∏
k=L
Gk(z) )
E0 (2.50)
と表すことができる.Gk(z),E0をそれぞれビルディングブロック,ファーストブロックと呼ぶ.
このような構造をラティス構造と呼ぶ.また,これを図2.19に示す.ラティス構造を用いて分割 ポリフェーズ行列E(z)を設計することによって以下の利点が挙げられる.
• すべてのビルディングブロックが双直交性を持てば,E(z)は双直交性を保持できる.
• すべてのビルディングブロックがパラユニタリ性を持てば,E(z)はパラユニタリ性を保持 できる.
• すべてのビルディングブロックが線形位相性を保つ性質を持てば,E(z)は線形位相性を保 持できる.
これらの利点から,一般にM 分割フィルタバンクは,ラティス構造に基づく方式によって設計さ れることが多い[9, 28–30].
図2.20 ツリー構造による4分割フィルタバンクの構造.
2分割フィルタバンクのツリー構造(M 分割フィルタバンク)
設計すべきフィルタバンクの帯域分割数が2のべき(M = 2r)のときには,2分割フィルタバン クをツリー構造状に接続することで,実現することができる.例として図2.20に,ツリー構造に 基づく4分割フィルタバンクの構造を示す.同様にして,2r分割のフィルタバンクは,2分割フィ ルタバンクの低域通過フィルタ,高域通過フィルタを逐次接続することで実現できる.結果的に,
ツリー構造による2r分割フィルタバンクの設計は,基本となる2分割フィルタバンクの設計に帰 着される.そのため,前項のラティス構造によるM 分割フィルタバンクの直接設計法に比べ,阻 止域減衰量・符号化利得などの性能が制限されるが,非常に簡易に多分割のフィルタバンクを実現 できる利点がある.更に,2次元フィルタバンクなどでは,Directional filter bank [31–33]など,
一般にラティス構造で簡単には表現できないフィルタバンクが多く存在するため,そのようなフィ ルタバンクの設計手法として有効である.M 分割パラユニタリフィルタバンク,もしくはM 分割 線形位相フィルタバンクの設計のためには,基本となる2分割フィルタバンクにパラユニタリ性,
もしくは線形位相性を課せばよい.
プロトタイプフィルタの変調(M 分割フィルタバンク)
M 分割フィルタバンクの設計方式のもう一つの代表的な例として,プロトタイプフィルタ(図 2.21)の変調を用いた方法がある[5].図2.22が示すように,M 分割フィルタバンクのサブバンド フィルタH0(z), . . . , HM−1(z)は,プロトタイプフィルタの周波数応答を,周波数領域上で平行 移動させることによって実現できる.2分割フィルタバンクのツリー構造による設計方式を用いた 場合,実質設計しなければならないフィルタは,低域通過フィルタ,高域通過フィルタの2つであ るが,プロトタイプフィルタの変調による設計方式では,1つの低域通過フィルタを設計するだけ で,M 分割フィルタバンクの全てのサブバンドフィルタが設計できるので,最も簡易な設計手法 であるといえる.
2.5.3 フィルタバンクの性能の指標と最適化
最後に,前項で挙げた設計方式を利用しながら,フィルタバンクの性能が最大となるように,
フィルタの係数を最適化する.本項ではフィルタバンクの性能のための指標と,最適化手法として 代表的である,非線形最適化について説明する.
図2.21 プロトタイプフィルタの周波数応答
図 2.22 プ ロ ト タ イ プ フ ィ ル タ の 変 調 に よ る M 分 割 フ ィ ル タ バ ン ク の 設 計 . (H0(z), . . . , HM−1(z)はM 分割フィルタバンクのサブバンドフィルタ)
フィルタバンクの性能の指標
• 阻止域減衰量
阻止域減衰量は,信号の所望の周波数帯域成分を選択して抽出する性能を評価する,最も基 本的な指標である.阻止域減衰量CST OP は,具体的に以下の式で表すことができる.
CST OP =
M∑−1 k=0
∫
ω∈Ωs
|Hk(ejω)|2dω (2.51)
阻止域減衰量が十分小さいとき,信号の所望の周波数帯域成分のみを精度良く抽出すること が可能となり,高性能なフィルタバンクとなる.
• 符号化利得(Coding Gain)
符号化利得は,画像圧縮符号化に用いるフィルタバンクを設計する際にしばしば使用される 指標であり,阻止域減衰量と同じくフィルタバンクの変換性能を評価する尺度である.具体 的には,PCM符号化と比べた変換符号化のSN比によるエネルギー圧縮比を表しており,
フィルタバンクが高い符号化利得を持つ変換ならば,低ビットレートでも高品質な復元画像 が得られる.符号化利得は次式で示される.
CCG=
1 M
∑M−1 k=0 σ2yk
∏M−1 k=0 σyk2 M1
(2.52)
CCGは信号の統計的性質によっても異なるので,ある統計モデルを考える.自然画像に近 い統計モデルとして,1次元の1次自己回帰(AR)過程x(n)に基づく可分型モデルがよく
用いられ,期待値0の白色雑音w(n)と相関係数ρにより,次式のように定義される.
x(n) =w(n) +ρx(n−1) (2.53) ρが1に近い程隣り合う信号同士で似た値をとり,一般的な自然画像ではρ= 0.95と仮定 できることが知られている[2].CCGを算出するためのσyk2 はN 次元の1次AR過程の共 分散行列を用いて求めることができる.Rxxを
Rxx=
1 ρ ρ2 · · · ρN−1 ρ 1 ρ · · · ρN−2 ρ2 ρ 1 · · · ρN−3
... ... ... . .. ... ρN−1 ρN−2 ρN−3 · · · 1
(2.54)
とし,更にあるN次元ベクトルに対し,M×Nの変換行列Pによる変換を施すと,その変 換係数ベクトルの共分散行列,及びσyk2 は次式で表される.
Ryy =PRxxRxxPT, σyk2 = [Ryy]k,k (2.55)
• 直流漏れ
DC(直流)成分が,分割側の低域のサブバンド以外にどれだけ漏れているかを示す評価量 であり,特に画像圧縮符号化で重要である.高域のサブバンド信号を低ビットレートで符号 化する際に,そのサブバンド信号にDC成分が含まれていると,再構成画像にチェス盤状の 歪みが生じる.この直流漏れCDCは,以下の式で表すことができる.
CDC=
M∑−1 k=1
N∑−1 j=0
hk(i) (2.56)
CDCは十分小さいことが望ましい.
非線形最適化
一般に阻止域減衰量,符号化利得,直流漏れなどの指標に対して最適となるような,フィルタバ ンクの設計パラメータを決定することを最適化と呼ぶ.しかし阻止域減衰量,符号化利得,直流漏 れなどの指標を定義する関数は,一般に非線形であるため,解析的に最適解を求めることができな い.このような場合の最適化は一般に“非線形最適化”と呼ばれ,数値計算的に最適解を導くこと になる.より具体的には,まず阻止域減衰量,符号化利得,直流漏れを表すCST OP,CCG,CDC を
C=αCST OP+βCCG+γCDC (2.57)
のように重み係数α,β,γを含めて線形結合の形に表し,このCに対して初期パラメータを与え る.その際,初期パラメータにおける勾配を算出し,その勾配を基に解を更新する.そして最終的 に収束した解を最適解とする.本論文で用いられる非線形最適化では,Matlab⃝R,optimization toolboxの関数fminuncを使用する.通常α,β,γは,重視する性能に応じて経験的に調整する.
(a) (b)
図2.23 (a)Lena (b)Lenaの離散ウェーブレット変換出力画像(3レベル)