• 検索結果がありません。

著者 鈴木 大和, 中山 謙二, 平野 晃宏

N/A
N/A
Protected

Academic year: 2022

シェア "著者 鈴木 大和, 中山 謙二, 平野 晃宏"

Copied!
7
0
0

読み込み中.... (全文を見る)

全文

(1)

スペクトルサプレッション法によるノイズキャンセ ラの音質改善(音響信号処理/一般)

著者 鈴木 大和, 中山 謙二, 平野 晃宏

雑誌名 電子情報通信学会技術研究報告. EA, 応用音響 =

Technical report of IEICE. EA (姫路)

巻 105

号 53

ページ 1‑6

発行年 2005‑05‑01

URL http://hdl.handle.net/2297/18407

(2)

スペクトルサプレッション法によるノイズキャンセラの音質改善

鈴木 大和

Þ

中山 謙二

Ý

平野 晃宏

Ý

Ý金沢大学大学院 自然科学研究科 電子情報科学専攻

! "#" $

Þ金沢大学大学院 自然科学研究科 電子情報工学専攻

あらまし

本論文ではスペクトルサプレッション法を用いた単一 マイクノイズキャンセラの音声品質の改善について検 討する.スペクトルサプレッション法を用いて,単一マ イク方式のノイズキャンセラを実現する際には,雑音抑 圧における音質の劣化と雑音抑圧によって新たに発生 するミュージカルノイズを如何に抑えるかがポイント となる.ミュージカルノイズを抑えるために,その周波 数成分が主として高域にあることを利用して,高域抑圧 を行なった.次に,雑音を過剰に抑圧するために音声に 歪みが発生し音質が劣化する.この劣化を防ぐために,

原音%観測信号&音声'雑音(をある割合だけ付加する 方法を検討した.従来方法に比べて,ミュージカルノイ ズの抑制と音質の改善が得られた.

)

*

+ +

,

*

*

+

* -

*

まえがき

現在,携帯電話などの移動通信が広く普及し,ほとん どの人が携帯電話を持つようになっている.そのため,

街頭や車内など背景雑音が大きい場所において携帯電話 が使用される機会が増えている.このような雑音が利用 者の会話中にマイクに拾われると,相手側では会話が聞 きづらくなり快適な使用の妨げとなる.そこで,雑音を 除去するためにノイズキャンセラが必要である.その方 式には,単一マイクを用いる方式,つまり,音声+雑音 を集音するマイクのみを用いる方式と,複数のマイクを 用いる方式,つまり,音声+雑音を集音するマイク以外 に主に雑音のみを集音するマイクを用いる方式がある.

携帯電話など,小型・低電力が要求される場合には単一 マイク方式のノイズキャンセラが望ましい.

現在,様々なノイズキャンセラの方式が提案されてい るが,)が定める.//における携帯電話用雑音抑 圧技術の標準化においては,ノイズキャンセラの方式は 推奨されておらず,その性能に関する要求条件とその評 価方法のみが定められている.0.1021

本稿では,携帯電話への応用を考えて,単一マイク方 式のノイズキャンセラを対象とし,ノイズキャンセラと しては,スペクトルサプレッション法を採用する.スペ クトルサプレッション法を用いて,単一マイク方式のノ イズキャンセラを実現する際には,雑音抑圧における音 声の劣化と雑音抑圧によって新たに発生するミュージカ ルノイズが問題となり,これらを抑えるかがスペクトル

(3)

サプレッション法のポイントとなる.本稿では,スペク トルサプレッション法における音質の改善とミュージカ ルノイズの抑制について検討を行う.

スペクトルサプレッション法

スペクトルサプレッション法の構成

3にスペクトルサプレッション法のブロック図を 示す.

Speech estimation

SNR

estimation IFFT

FFT y(n)

Y(k)

ξ,γ G(k)

X(k) x(n)

^

^

3! スペクトルサプレッション法のブロック図 音声と雑音ともにスペクトル成分において統計的独 立で平均4であるとする.時間領域でのクリアな音声 を %(雑音を%(,雑音混入音声を%(とおくと,

%(& %('%( %3(

音声信号は一般に非定常であり,その音響的特徴は変 動している.そのために音声のスペクトル分析では,十 分に短い時間の区間において音声は定常状態であると いう仮定の基で,少しずつ,時間区間をシフトさせなが ら窓関数を用いて切り出したフレームの波形のデータ に対して順次,,演算を実行して,スペクトルの時系 列を得ている.よって,雑音混入音声は,サンプル のフレームに分けられて,5サンプルの窓関数を用い て,64%オーバーラップさせることにより,番目の フレームにおける切り出された雑音混入音声7 %(は,

7 %(&

%(

 ½

%( 3

%( %( 5

%5(

と表せる.

この信号の周波数領域での表示を次のように表す.

%(&%(' %( %.(

%(&

%

( %2(

%(&

%

( %6(

雑音の分散を%(とすると,事前8%クリーン音声 対雑音比(,事後8%雑音混入音声対雑音比(はそれぞ れ次の式で表せる.

%(&

¾

%(

%9(

%(&

¾

%(

%:(

実際に利用可能なものは,雑音混入音声のみで,事前

8事後8は推定しなくてはいけない.事前8 %(

は,次式で推定できる031

7

%(&

 ½

%(

¾

 ½

%('%3(0 %(31 %;(

ただし,

0 1&

% 4(

4 %(

%<(

また,雑音の分散は,文献051によって提案された重み 付き雑音推定によって求める.重み付き雑音推定では,

信号対雑音比%8(の推定値に応じて重み付けした雑 音混入音声を用いて,継続的に雑音推定値を更新する.

このため,過大推定を防ぎつつ,非定常雑音に対して 高い追従性を達成する.推定された雑音を基に,事後

8 %(の推定値を求める.このようにして推定され た事前8事後8によりスペクトルゲイン %(

を求めそれを雑音混入音声に掛けることにより雑音を 抑える.

==>法は雑音を含む音声から明確な音声の スペクトル振幅を抽出し,その二乗誤差を最小にする方 式である031.統計モデルとして,音声と雑音ともにス ペクトル成分において統計的独立で平均4のガウス分 布であると仮定する.スペクトルゲインは

%(&

%3' %((

¼

%(

5

' %(

½

%(

5

? %(

3'? %(

%(

5 %(

@

%(

5

%34(

で求められる.式中の各関数は

%(&

%(

3' %(

7

%( %33(

? %(&

3!

!

@% %((

3' %(

%35(

%(&

7

%(

3!

%3.(

で求められる.¼

½はそれぞれ4次と3次のA 関 数,!は雑音混入音声中に音声成分が存在しない確率を 表している.

(4)

==>法は,統計モデルとして,音声と雑音 ともにスペクトル成分において統計的独立で平均4のガ ウス分布であると仮定してスペクトルゲインを求めた.

しかし,音声のスペクトル成分は,スーパーガウス分布 であることが知られている.統計モデルとしてガウス 分布とした場合は,その振幅はレーリー分布をとる061. スーパーガウス分布の確率密度関数%/ ,(は音声の分 散をとして式%32(で表せる.

%(&

"

·½

B%#'3(

·½

@"

%32(

ただし,式中のは音声の振幅を表していて,#"は 変数であり,%(の形状を決定する.# &4$43"&3$6 のとき最も音声をモデル化するのに適している061

C=>/法では,雑音混入音声がという条件での 音声の振幅と偏角における条件付き確率%%( を最大にする振幅と偏角を雑音混入音声中のクリ ア音声の推定振幅,偏角の値77とする061.スペクト ルゲインは,

&&'

&

¾

'

#

5

%36(

&&

3

5

"

2

%39(

で求められる.

ミュージカルノイズの抑制と音質 改善

ミュージカルノイズの抑制

高域抑制

スペクトルサプレッション法を用いてノイズキャンセ ラを行なった場合,雑音抑圧後にミュージカルノイズが 発生する.そこで,ミュージカルノイズを抑えるために ミュージカルノイズの周波数帯域が高域であることか ら,図5のような重み%'(をスペクトルゲインに掛け ることによる高域抑制を行なう.

%'(&4$6%5 '

'

('4$6 %3:(

ただし,'はサンプリング周波数である.

音質改善

原音付加

雑音抑圧の時に,抑圧のしすぎにより音声に歪みが発 生し音質が劣化してしまう.そこで,雑音抑圧後音声に,

事後8%雑音混入音声対雑音比( %(に基づいて,原

−5000 0 −4000 −3000 −2000 −1000 0 1000 2000 3000 4000 5000 0.1

0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

frequency w(f)

5! 重み%'(%高域抑制(

%観測信号&音声'雑音(をある割合だけ付加するこ とにより雑音抑圧によって生じた音声の歪みを補う.

7

%(&

7

%('

½

%( %5( %((

7

%('

¾

%(%( %3( %( 5(

7

%( %(

%3;(

Speech estimation

SNR estimation y(n)

Y(k)

ξ,γ G(k)

X(k) x(n)

^ ^

Weighting

FFT IFFT

.! 原音付加

シミュレーション

文献 051が提案している重み付き雑音推定に基づく

==>法によるノイズサプレッションを従来法 とし,従来法に提案法を用いた場合についてシミュレー ションを行なった.表3にシミュレーション条件を示す.

また,雑音抑圧後の評価として,客観評価として,信 号対雑音比%8(評価を行ない,主観評価として,実 際に音声を聞いてみて,ノイズサプレッション前とノイ ズサプレッション後の音質を比較した.

信号対雑音比%8(評価として,ノイズサプレッショ ン前の信号対雑音比評価として,雑音の無い音声 %(

(5)

の二乗平均と雑音%(の二乗平均の比を83とする.

ノイズサプレッション後の信号対雑音比評価として,雑 音の無い音声 %(の二乗平均と雑音のない音声 %(

とノイズサプレッション後の音声7%(との誤差%(の 二乗平均の比を85とする.それぞれ次式で表せる.

)* 3&34

½¼ %(

¾

%(

¾

%3<(

%(& %(7%( %54(

)* 5&34

½¼ %(

¾

%(

¾

%53(

分析フレーム長 サンプルの オーバーラップ長 サンプル

評価方法 ,主観評価

入力音声 サンプリング周波数の男性の音声 雑音 白色雑音,バブル雑音

3! シミュレーション条件

法によるノイズサプレッ ション

従来法

0 0.5 1 1.5 2 2.5 3

x 10 4

−5 0 5 10

Speech

0 0.5 1 1.5 2 2.5 3

x 10 4

−10

−5 0 5 10

Noisy Speech

0 0.5 1 1.5 2 2.5 3

x 10 4

−5 0 5 10

output

2! 従来法.白色雑音.上から順に雑音の無い音声D 雑音混入音声Dノイズサプレッション後音声.8改善 量%)* 5)* 3(.$33.;0A1

2に示す波形は,文献051が提案している重み付き雑 音推定に基づく==>法によるノイズサプレッ ションを行なった場合の,白色雑音の時の音声波形で,

上から雑音の無い音声波形,雑音混入音声波形,ノイズ サプレッション後の音声波形を表している.同様に,図

6は,バブル雑音の時の音声波形を表している.どちら の場合も実際に雑音抑圧後音声を聞いてみたところ雑音 はかなり消えているが音質が劣化してしまった.特に,

バブル雑音のときの音質の劣化が大きかった.

0 0.5 1 1.5 2 2.5 3

x 10 4

−5 0 5 10

Speech

0 0.5 1 1.5 2 2.5 3

x 10 4

−5 0 5 10

Noisy Speech

0 0.5 1 1.5 2 2.5 3

x 10 4

−5 0 5 10

output

6! 従来法バブル雑音.上から順に雑音の無い音声D 雑音混入音声Dノイズサプレッション後音声.8改善 量%)* 5)* 3(!4$24<50A1

改善法 原音付加,高域抑制

従来法に音質改善%½ &4$.¾ &4$36(を行なった 場合の白色雑音の時の音声波形を図9,バブル雑音の時 の音声波形を図:に示す.どちらの場合も雑音抑圧後音 声を聞いてみたところ音質が従来法よりも改善した.し かし,従来法よりも雑音が少し残る.また,バブル雑音 のとき,雑音抑圧後の音声はこもったように聞こえる.

法によるノイズサプレッシ ョン

重み付き雑音推定に基づく 法 文献051が提案している重み付き雑音推定を用い,C

=>/法061によるノイズサプレッションを行なった場 合の,白色雑音の時の音声波形を図;に,バブル雑音 の時の音声波形を図<に示す.どちらの場合も==

>法よりもノイズを抑えることができ音質も==

>法と比べるとそれほど劣化しない.しかし,音質 はこもった感じに聞こえる.

法によるノイズサプレッシ ョンの音質改善

C=>/法において式%3;(のように閾値を設定し て原音付加を行ない,雑音抑圧音声を聞いてみたところ あまり音質の改善がなかった.図;<より,音声が雑 音より弱いところでは雑音抑圧後に音声がほぼ完全に 抑えられてしまう.そこで,式%55(のように,閾値を 設定せず原音を付加する割合を固定してシミュレーショ ンを行なった.

(6)

7

%(&

7

%('4$36%( %55(

原音を付加する割合を固定したところ,雑音は残る が白色雑音,バブル雑音両方の場合で音質が今回シミュ レーションを行なった中で最も改善した.特に,バブ

ル雑音の場合音質が大きく改善した.しかし,白色雑 音の場合雑音がやや大きくなってしまう.

白色雑音とバブル雑音の双方に適用できる方式とし て,雑音スペクトルの形や時間的な変化により雑音の特 性を推定し,原音付加方式のパラメータを制御する方式 が望ましい.

まとめ

本稿では,スペクトルサプレッション法による単一マ イクノイズキャンセラにおいて,ミュージカルノイズを 抑制する方法と音質を改善する方法について検討を行っ た.まず,ミュージカルノイズを抑えるために,その周 波数成分が高域にあることを利用して,高域抑制を行な う方法を検討した.次に,雑音抑圧後の音声に原音%観 測信号&音声'雑音(をある割合で付加することにより 雑音抑圧によって生じた音声の歪みを補う方法について 検討した.

さらに,従来法051と本稿で改良を加えた方法につい てシミュレーションを行ない,従来法では雑音をかなり 抑えることができるが音質が劣化すること,特に,音声 とスペクトルや非定常性が似ているバブル雑音の場合 劣化が大きいことを確認した.また 本稿で改良を加え た方法を用いると,雑音は少し残るが,従来法より音質 がかなり改善されることを確認した.しかし,白色雑音 のときは雑音がやや大きくなってしまった.

今後の課題として,雑音の有色性や非定常性を評価 し,音源付加を制御する閾値を可変にする必要がある.

また,本稿では,白色雑音とバブル雑音のみで検討を行 なったので,他の種々の雑音を用いて有効性について検 証する必要がある.

参考文献

! !"#$%&# &'(

# ) * + , -

, *. ,

/

0 1'2 33%3'4#%%#

" 加藤正徳,芹沢昌宏,杉山昭彦携帯電話用雑音抑圧技 術の標準化,第3!シンポジウム, 2-1

#%%#

( 加藤正徳,芹沢昌宏,杉山昭彦長谷川厚志,水越明哉

重み付き雑音推定に基づくノイズサプレッサの! 現と"5!!評価,第3!シンポジウム, 2"

-1#%%#

2 6 !7 *-89*4 :

! !

; 5

!< =!/>%(?7 @((3

$% #%%( 金沢大学 工学部 電気・情報工学科 卒 業論文,0.#%%#動作解析,金沢大学 工学部 電気・

情報工学科 卒業論文,0.#%%(

(7)

0 0.5 1 1.5 2 2.5 3 x 10 4

−5 0 5 10

Speech

0 0.5 1 1.5 2 2.5 3

x 10 4

−5 0 5 10

Noisy Speech

0 0.5 1 1.5 2 2.5 3

x 10 4

−5 0 5 10

output

9! 音質改善を行なった==>法.白色雑音.

上から順に雑音の無い音声D雑音混入音声Dノイズサプ レッション後音声.8改善量!26;490A1

0 0.5 1 1.5 2 2.5 3

x 10 4

−5 0 5 10

Speech

0 0.5 1 1.5 2 2.5 3

x 10 4

−5 0 5 10

Noisy Speech

0 0.5 1 1.5 2 2.5 3

x 10 4

−5 0 5 10

output

:! 音質改善を行なった==>法.バブル雑 音.上から順に雑音の無い音声D雑音混入音声Dノイズ サプレッション後音声.8改善量!4$24<50A1

0 0.5 1 1.5 2 2.5 3

x 10 4

−5 0 5 10

Speech

0 0.5 1 1.5 2 2.5 3

x 10 4

−10

−5 0 5 10

Noisy Speech

0 0.5 1 1.5 2 2.5 3

x 10 4

−5 0 5 10

output

;! 重み付き雑音推定に基づくC=>/法.白色 雑音. 上から順に雑音の無い音声D雑音混入音声Dノイ ズサプレッション後音声.8改善量!59;5.0A1

0 0.5 1 1.5 2 2.5 3

x 10 4

−5 0 5 10

Speech

0 0.5 1 1.5 2 2.5 3

x 10 4

−5 0 5 10

Noisy Speech

0 0.5 1 1.5 2 2.5 3

x 10 4

−5 0 5 10

output

<! 重み付き雑音推定に基づくC=>/法.バブ ル雑音. 上から順に雑音の無い音声D雑音混入音声Dノ イズサプレッション後音声.8改善量!3$243<0A1

0 0.5 1 1.5 2 2.5 3

x 10 4

−5 0 5 10

Speech

0 0.5 1 1.5 2 2.5 3

x 10 4

−10

−5 0 5 10

Noisy Speech

0 0.5 1 1.5 2 2.5 3

x 10 4

−5 0 5 10

output

34! 原音付加%固定(を行なったC=>/法.白 色雑音. 上から順に雑音の無い音声D雑音混入音声Dノ イズサプレッション後音声.8改善量!.6;9.0A1

0 0.5 1 1.5 2 2.5 3

x 10 4

−5 0 5 10

Speech

0 0.5 1 1.5 2 2.5 3

x 10 4

−5 0 5 10

Noisy Speech

0 0.5 1 1.5 2 2.5 3

x 10 4

−5 0 5 10

output

33! 原音付加%固定(を行なったC=>/法.バブ ル雑音. 上から順に雑音の無い音声D雑音混入音声Dノ イズサプレッション後音声.8改善量!4$29350A1

参照

関連したドキュメント

上の2例において,その「僖」と「於乎」とは,ともに笑声を表わしているものという点

現在︑歌謡を含めた音楽がバローチ民衆の 日常の中でどのように機能しているのだろう

 我が国においては,長い間,文字言語が尊重され,音

演奏を行う義務や演奏技術等を向上させる義務を教師又は X

本論文は, 地球上に豊富に存在し, 安価で、且つナノスケールの加 工技術が確立されているシリコン(Si)に着目し,Si

音楽科の教育内容論の意義として、それまで音楽教育界において無自覚であった音楽科の教育内容が意識さ

ポンプ側圧力は,流量圧力特性平面 qp 上の管断面 変化部の境界条件となる特性線 p=apq/F l

今後の課題として,一様性や多様性に対する最適解への収束の関係を表現する指標の検討が挙げられ