• 検索結果がありません。

Spectral Subtraction

ドキュメント内 U055-3 (ページ 35-39)

第 3 章 正方形マイクロホンアレイを用いた指向性雑音抑圧 23

3.1.2 Spectral Subtraction

28 第3章 正方形マイクロホンアレイを用いた指向性雑音抑圧

Frequency [Hz]

G ai n

図 3.4 SS後の出力|S120 (ω, k)|に生じる周波数軸上の歪の例(τ = 3/32k sec).

= p

2(1cos(ω·τ))· |S(ω, k)| (3.9) 上式において,|S(ω, k)|にかかる項が,歪を生じる項であり,例えば周波数軸上 で図3.4のような振るまいをとる.この歪を以下のようにして補正する.

|Sˆ12(ω, k)|= |S120 (ω, k)|

p2(1cos(ω·τ)) (3.10) こうして得られた真の推定目的音声のスペクトル|Sˆ12(ω, k)|は,時間領域に復元 する際には,入力信号の位相等を用いて推定目的音声信号s(t)ˆ を得る.

3.2 3 個のマイクロホンを用いた指向性雑音抑圧

前節で述べた2ch手法は真横から到来する指向性雑音,例えばマイクロホンア レイの真横等から到来するようなものは効果的に除去することができる.しかし,

目的音声方向以外からの方向であるのに関わらず,マイクロホンに対し,同時に到

ch2

ch3 ch4

y

ch1

4cm

ch2

4cm

ch3 ch4

ch1

図 3.5 正方形マイクロホンアレイのマイク配置

達するような雑音は除去できない.例えば,目的音声とマイクロホンアレイをは さんでちょうど反対の方向から到来するような雑音である.これは原理的に,2ch 手法は2個のマイクロホンに対し,位相差を伴って入力された信号を除去する枠 組であり,そのような信号には対応できないためである.実際の使用環境を考え ると,上述した状況から指向性雑音が到来する場合も大いに考えられ,2ch手法だ けでは十分とは言えない.本節では,2ch手法を4個のマイクロホンを正方形の各 頂点に配置した正方形マイクロホンアレイのうちの3個を使う手法へと拡張する.

なおここで提案する手法を”3ch手法(three-channel method)”と呼ぶものとする.

図3.5に正方形マイクロホンアレイのマイクロホン配置を示す.正方形マイクロ ホンアレイのマイク配置は,前述した指向性雑音抑圧可能方向の制限を克服する 目的のマイク配置がなされている.目的音声が到来する方向は図におけるz軸方 向から到来するものとする.このような配置をすることで,マイクロホンアレイ 平面方向360°から到来する信号の区別をつけることが可能となる.なお,本節で 提案する3ch手法では,実際に用いるマイクロホンは4個の中から3 個を選択す ることになる.

30 第3章 正方形マイクロホンアレイを用いた指向性雑音抑圧

IFFT /OLA phase information

(t) x2

(t) x1

k) , (

Sˆ ω sˆ(t)

ch1 ch2

ch3 x3(t)

k) , ( Sˆ12 ω two-channel method

two-channel method

two-channel method two-channel method

minimization minimization

k) , ( Sˆ23 ω

図 3.6 提案手法ブロック図 (three-channel method).

このようなマイクロホン配置において,2通りのマイクペアで2ch手法を適用す れば,z軸方向から到来する音声のみを抽出することができると考えられる.例え ば,ch1とch2,ch2とch3の組合せが挙げられる.図3.6に3ch手法のブロック図 を示す.|Sˆ12(ω, k)|は,ch1とch2を使用して,推定された目的音声のスペクトル であり,図3.5におけるy-z平面から到来する信号が抽出されたものであると考え ることができる.一方,|Sˆ23(ω, k)|は,ch2とch3を使用して,推定された目的音 声のスペクトルであり,図3.5におけるx-z平面から到来する信号が抽出されたも のであると考えることができる.2ch手法での最小化選択の場合と同様に,音声の スパース性が仮定できるならば,|Sˆ12(ω, k)||Sˆ23(ω, k)|の最小化選択を行うこと で,z軸方向から到来する音声のみを抽出することが可能であると考えられる.

|S(ω, k)ˆ |= min[|Sˆ12(ω, k)|,|Sˆ23(ω, k)|] (3.11) このようにして得られた|S(ω, k)ˆ |は,図3.5におけるz軸方向からの音声のみを抽 出したものであり,携帯端末の使用者の音声のみを抽出できるものと考えられる.

ドキュメント内 U055-3 (ページ 35-39)