階層的雑音抑圧方式

第 3 章雑音抑圧方式 27

3.2 階層的雑音抑圧方式

3.2.1 _{方式の概要}

本稿では高田らが提案している指向性雑音，拡散性雑音が混在する環境において音声強調を行う枠組み [21]を拡張し，階層的に指向性雑音，拡散性雑音を抑圧する．

全体の処理の流れは図3.1の通りである．本研究で採用する雑音抑圧システム

28 第3章雑音抑圧方式

beamforming DFT

selectionband

Calculate multi-channel

Wiener filter

voice activity detection Calculate single-channel

Wiener filter

IDFTOLA )

ˆ ( k

S_dir ω

) ,

( k

H_m ω

phase information

)

1(t x

)

2(t x₃(t) x

)

4(t x

) ,

( k

S_i ω

) ,

( k

C_i ω

) ,

ˆ ( k

S_m ω Sˆ(ω,k)

) ,

( k

H_s ω

) ,

( k

B_i ω

) ˆ(t beamforming S

DFT

selectionband

Calculate multi-channel

Wiener filter

voice activity detection Calculate single-channel

Wiener filter

IDFTOLA )

ˆ ( k

S_dir ω

) ,

( k

H_m ω

phase information

)

1(t x

)

2(t x₃(t) x

)

4(t x

) ,

( k

S_i ω

) ,

( k

C_i ω

) ,

ˆ ( k

S_m ω Sˆ(ω,k)

) ,

( k

H_s ω

) ,

( k

B_i ω

) ˆ(t S

図 3.1 雑音抑圧方式．

は，指向性雑音除去部，拡散性雑音除去部，残留雑音除去部から構成される．以下では，その各々について述べる．

3.2.2 _{指向性雑音抑圧}

指向性雑音抑圧の流れは図3.2の通りである．

時刻tにおいてチャンネルiのマイクロホンで観測された信号をx_i(t)とする．また，フレームkにおいて短時間フーリエ変換されたスペクトルをX_i(ω, k)と表す．

まず目的音源方向に対し縦にならんだMic1，Mic3から，遅延処理と減算処理による死角制御型ビームフォーマーに基づく信号c₁，c2と，減算処理による減算型ビームフォーマーに基づく信号s₁を形成する．ここで付加する遅延は，マイクロホン間隔を音声が伝達するのに要する時間に相当する．遅延時間τ_crossは，音速を V_ac，対角方向のマイクロホン間隔をd_crossとしたとき，τcross = d_cross/V_acで与えられる．この遅延時間を用い，c1とc₂は

c₁ = x₃(t−τ_cross)−x₁(t) (3.1)

c2 = x1(t−τcross)−x3(t) (3.2)

3.2 階層的雑音抑圧方式 29 で得られる．s1は下記のように書ける．

s₁ =x₁(t)−x₃(t) (3.3)

また，目的音源方向に対し横に並んだMic2，Mic4より減算型ビームフォーマーに基づく信号s₂は，下記のように書ける．

s₂ =x₄−x₂(t) (3.4)

c₁は0^◦方向に死角を持ち，c₂は180^◦方向に死角を持つ指向特性を形成する．また，s1は0^◦,180^◦方向に最大のゲインを持ち±90^◦方向に死角を持つ指向特性を形成し，s2は±90^◦方向に最大のゲインを持ち，0^◦,180^◦方向に死角を持つ指向特性を形成する．c1，c1のゲインパターンを図3.3に，s1，s2によるゲインパターンを図3.4に示す．

これら4つの信号を用いて帯域選択を行うことにより，正面方向へ向けた指向特性によりこの方向から到来する信号のみが選択され，信号Sˆ_dirが得られる[24]．

この帯域選択は以下のように行われる．

Sˆ_dir(ω, k) =







S₁(ω, k),

if|S₁(ω, k)|>|S₂(ω, k)| and |C₁(ω, k)|<|C₂(ω, k)| β, otherwise

(3.5)

ここで，βはフロアリング定数を表す．

この帯域選択は正面，後ろ方向にゲインを持つ信号のスペクトルS₁(ω, k) と横方向にゲインを持つ信号のスペクトルS₂(ω, k)を比較し，正面，後ろ方向にゲインを持つ信号の方が大きい時間・周波数成分のみを残すことで横方向から到来する指向性雑音を抑圧している．さらに，正面方向にゲインを持つ信号のスペクトルC₂(ω, k)と後ろ方向にゲインを持つ信号のスペクトルC₁(ω, k)を比較し，正面方向にゲインを持つ信号の方が大きい時間・周波数成分のみを残すことで先の選択で選ばれた時間・周波数成分のうち，後方から到来する指向性雑音を抑圧している．

30 第3章雑音抑圧方式

+ -+

-+ +

+ +

+ + DELAY

DELAY DF T

DF T

DF T DF T

bandselection

) ,

( k C ω

) ,

( k C ω

) ,

( k S ω

) ,

( k S ω x

x

S ˆ

_dir

( ω , k )

)

( t c

)

( t c

)

( t s

)

( t s

+ -+

-+ +

+ +

+ + DELAY

DELAY DF T

DF T

DF T DF T

bandselection

) ,

( k C ω

) ,

( k C ω

) ,

( k S ω

) ,

( k S ω x

x

S ˆ

_dir

( ω , k )

)

( t c

)

( t c

)

( t s

)

( t s

図 3.2 指向性雑音抑圧方式．

x

θ

0

C¹2

C C2

図 3.3 死角制御型ビームフォーマーのゲインパターン．

3.2.3 _{拡散性雑音抑圧}

指向性雑音が抑圧されたSˆ_dir(ω, k)中に存在する拡散性の雑音を抑圧するため，

マルチチャンネルWienerフィルタを用いる．この拡散性雑音抑圧フィルタH_m(ω, k)

3.2 階層的雑音抑圧方式 31

x

0 S

¹2

S S

θ

図 3.4 減算型ビームフォーマーのゲインパターン．

は，隣接するマイクロホン間距離に相当する遅延時間をτnextとしたとき，

b1 = x2(t−τnext)−x1(t) (3.6) b₂ = x₃(t−τ_next)−x₂(t) (3.7) b3 = x3(t)−x4(t−τnext) (3.8) b₄ = x₄(t)−x₁(t−τ_next) (3.9) のk番目のフレームでのスペクトルB_i(ω, k)を用いて

H_m(ω, k) =

1 2

P[abs{B_l(ω, k)B^∗_m(ω, k)}]

1 4

i=1[B_i(ω, k)B_i^∗(ω, k)] (3.10) と表される．ここでl，mは{(l, m)} ={(1,2),(3,4)}なる組合せで，目的音方向に対して線対称となるゲインパターンを持つ死角制御型ビームフォーマーを選択する．

32 第3章雑音抑圧方式このマルチチャンネルWienerフィルタを用いて拡散性雑音が抑圧された信号の振幅スペクトルは以下のように求まる．

|Sˆ_m(ω, k)|=H_m(ω, k)· |Sˆ_dir(ω, k)| (3.11)

3.2.4 _{残留雑音抑圧}

3.2.2で述べた指向性雑音抑圧と3.2.3で述べた拡散性雑音抑圧を施した信号に対

し，残留している定常的な雑音を抑圧するためシングルチャンネルのWienerフィルタを用いる．ここでは，音声が存在しない区間からノイズを学習し，WienerフィルタH_s(ω, k)を推定し，これをマルチチャンネルのWienerフィルタを適応した信号|Sˆ_m(ω, k)|に施すことで残留雑音抑圧を行う．

音声が存在するかの判定には，マルチチャンネルWienerフィルタのフィルタ係数H_m(ω, k)と，このフィルタを適応した信号|Sˆ_m(ω, k)| を用いて以下のように判定する．

V AD =

( 1 if Pb

ω=a|H_m(ω, k)|²·P

ω|Sˆ_m(ω, k)|² > threshold

0, otherwise (3.12)

ここで，a，bは判定に用いる周波数ビンの下限と上限で，thresholdは判定の閾値である．3.2.2で述べた通りHm(ω, k)は低周波数帯域において理論的に大きな値を持ってしまう．また，高周波数帯域には発話区間検出において重要な情報は多く含まれない。このため，a，b はそれぞれ 1000 Hz，6000 Hzに相当する値とした．

V AD = 1の場合には音声が存在するとしてノイズ学習を停止し，V AD = 0の場合を非音声区間として，ノイズを忘却的に学習する．この学習は忘却係数λを用いて以下のように行われる．

3.3 雑音抑圧実験 33

ドキュメント内小林哲則教授 (ページ 35-41)

第 3 章 雑音抑圧方式 27

3.2 階層的雑音抑圧方式

3.2.1 方式の概要

3.2.2 指向性雑音抑圧

) ,

( k C ω

) ,

( k C ω

) ,

( k S ω

) ,

( k S ω x

x

x

x

S ˆ

( ω , k )

)

( t c

)

( t c

)

( t s

)

( t s

) ,

( k C ω

) ,

( k C ω

) ,

( k S ω

) ,

( k S ω x

x

x

x

S ˆ

( ω , k )

)

( t c

)

( t c

)

( t s

)

( t s

x

x

x

x

θ

0

3.2.3 拡散性雑音抑圧

x

x

x

x

0

S

S

S S

θ

3.2.4 残留雑音抑圧

第 3 章雑音抑圧方式 27

3.2.1 _{方式の概要}

3.2.2 _{指向性雑音抑圧}

3.2.3 _{拡散性雑音抑圧}

3.2.4 _{残留雑音抑圧}