目的:
目的信号以外にも音声が複数存在する場合、つまり雑音が音声である場合に対する本雑 音除去アルゴリズムの雑音除去精度を検証する。音声の周波数帯域はほぼ同じ場所に集中 するので、これにより目的音と雑音の周波数が重複した場合における雑音除去精度の調査 を行う。
3.4.1
シミュレーション条件
目的信号として、ATR音声データベースに収録されている男性話者mht の日本語文章
「通訳電話国際会議事務局です」を用い、到来方向は正中面とした。また雑音として、女 性話者fafの「それではぜひ送っていただきたいのですが」、女性話者fknの「ご住所をお しえていただけますでしょうか」、男性話者mauの「題目の締め切りを教えてください」
を用い、到来方向はそれぞれ左67°、左30°、右45°とした。これは同時に発話された
4つの文章から、1つの文章だけを抽出することに相当する。データ作成の条件は前節と 同様である。
3.4.2
雑音除去結果
雑音除去結果を図3.8(スペクトル)、図3.9(波形)に示す。図3.8(c)からわかるように、
500 Hz以下の低周波数帯域においては雑音のスペクトルが十分に推定されていない。こ れはマイクロホンアレーの指向特性が、低周波数帯域においては鋭さを欠くためである。
しかしながら、スペクトルおよび波形を見ても、雑音除去後の音声が元のクリーンな音声 に近づいたとは言い難い。
そこで図3.10にスペクトログラムを示す。雑音を付加した音声(b)には様々な周波数に 成分が存在することがわかるが、雑音除去後の音声(c)では余分な成分が除去され、見た 目にも元のクリーンな音声(a)に近づいたことがわかる。また表3.5からもわかるように
LSDの値も約7dB改善され、目的音と雑音の周波数帯域が重複している場合でも本手法 が十分に働くことが確認された。
表 3.5: SNR、LSDによる雑音除去評価 (カッコ内は音声区間のみで計算した値) 雑音除去前 雑音除去後(本手法)
SNR [dB] 3:4 1:0
LSD[dB] 21:4 14:3
50 100 150
200 250
1000 500 2000 1500
3000 2500 2 4 6 8 10 12
x 10 5
(a)noise−free speech
50 100
150 200 250
1000 500 2000 1500
3000 2500 2 4 6 8 10 12
x 10 5
(b)noise−added speech
50 100
150 200 250
1000 500 2000 1500
3000 2500 2 4 6 8 10 12
x 10 5
(c)estimated noise
50 100 150
200 250
1000 500 2000 1500
3000 2500 2 4 6 10 8 12
x 10 5
Frame Number (d)noise−reduced speech
Frequency [Hz]
Amplitude Spectrum
図 3.8: 雑音除去結果hスペクトルi (a)クリーンな音声(b)雑音を付加した音声(c)推定 した雑音(本手法)(d)雑音除去後の音声(本手法)
2 4 6 8 10 12 x 10 4
−2
−1.5
−1
−0.5 0 0.5 1 1.5
2 x 10 4 (a)noise−free speech
2 4 6 8 10 12
x 10 4
−2
−1.5
−1
−0.5 0 0.5 1 1.5
2 x 10 4 (b)noise−added speech
2 4 6 8 10 12
x 10 4
−2
−1.5
−1
−0.5 0 0.5 1 1.5
2 x 10 4 (c)noise−reduced speech
Sampling Point [pt]
Amplitude
図 3.9: 雑音除去結果h波形i (a)クリーンな音声(b)雑音を付加した音声(c)雑音除去後 の音声(本手法)
(a)noise−free speech
0.5 1 1.5 2 2.5
1000 2000 3000 4000 5000 6000
(b)noise−added speech
0.5 1 1.5 2 2.5
1000 2000 3000 4000 5000 6000
(c)noise−reduced speech
Time [sec]
Frequency [Hz]
0.5 1 1.5 2 2.5
1000 2000 3000 4000 5000 6000
図 3.10: 雑音除去結果hスペクトログラムi (a)クリーンな音声(b)雑音を付加した音声
(c)雑音除去後の音声(本手法)
第
4章
実環境下における有効性検証
第2章において本雑音除去アルゴリズムの定式化を行い、第 3章では本手法の基礎的 な性能評価を行った。その結果、本手法は高精度の雑音除去が可能であり、特に複数雑音 に対して水町らの提案法よりも雑音除去能力が高いことを確認した。しかし第 3章の評 価実験は、実環境下において最も問題となる暗騒音や残響が存在しない環境を想定した、
計算機上での実験である。そこで本章では、本手法の実環境適応性を調査するため、実環 境下における雑音除去実験を行う。