第 3 章 正方形マイクロホンアレイを用いた指向性雑音抑圧 23
3.3 指向性雑音抑圧実験
3.3.1 実験状況
32 第3章 正方形マイクロホンアレイを用いた指向性雑音抑圧
4 m 2 m
2 m 5.5 m
Disturbance
Target MIC ARRAY
1 m
25cm
図 3.7 目的音声と指向性雑音の収録環境.θ = 0◦, 30◦, 60◦, 90◦, 120◦, 150◦, 180◦.
φ
θ
ch2 ch1ch4 ch3
a
b
target speech disturbance speech
図3.8 目的音声,指向性雑音,マイクロホンアレイの位置関係.θ = 0◦, 30◦, 60◦, 90◦, 120◦, 150◦, 180◦, φ = 30◦.
行った.
音声認識に用いる音響モデルには,ASJ-JNASの男性話者133人が接話型マイク ロホンによって収録した連続発話音声20414文から学習した状態共有トライフォン を使用し,認識器には当研究室開発のワンパストライグラムデコーダSKOOD [30]
を使用した.なお,目的音のみをマイクロホンが観測した場合の単語正解精度は
88.6 %であった.PESQによる評価では,目的音声を参照信号とし,雑音抑圧処
理後音声,または無処理音声を被試験信号とした. 雑音抑圧処理時には分析フレー
ム長32 msのハミング窓を使用し,フレームシフトは8 ms,空間フィルタを形成
する際の遅延量τの値は3/32 k secとした.なお,本稿にて考慮する音声の帯域 は,全ての実験において300-7500 Hzとした.
3.3.2 2ch 手法と 3ch 手法による指向性雑音抑圧実験結果
提案手法の指向性雑音抑圧効果を調べるため,2ch手法と3ch手法による処理後 音声の単語正解精度とPESQ-MOSを算出した.評価項目は,1) 雑音抑圧処理 を施していない音声(mic input),2) 図3.8におけるch1とch2を使用した2ch手 法(ch1 & ch2),3) ch2とch3を使用した2ch手法(ch2 & ch3),4) ch1,ch2,
ch3を使用した3ch手法(ch1 & ch2 & ch3) の4通りである.
単語正解精度とPESQ-MOSを図3.9,図3.10 にそれぞれ示す. まず,図3.9に 着目する.2ch手法を適用した場合,理論通りの角度から到来する指向性雑音が 抑圧できていることがわかる.例として,図3.8におけるch1とch2を使用した
場合,θ = 90°方向から到来する信号が最も2個のマイク間に位相差がつくため,
雑音抑圧効果が大きいと考えられるが,図3.9におけるθ = 90°の単語正解精度 を見ると,mic inputがほぼ0 %であるのに対し,ch1&ch2で62.3 %と大幅に向 上しているのがわかる.対称的に,図3.8におけるch2とch3を使用した場合,同
様にθ = 180°方向から到来する信号に対する雑音抑圧効果が最も大きいと考えら
れ,実際に図3.9におけるθ = 180°の単語正解精度を見ると,mic inputでほぼ 0 %から,ch2&ch3で68.6 %と大幅に向上している.この結果から,2ch手法が効
34 第3章 正方形マイクロホンアレイを用いた指向性雑音抑圧
"!#!%$'&()*
+,,-.,/
01
2 3 4 5 6 5 5 6 5 5 6 75 6 5
図 3.9 2話者同時発話における単語正解精度.
果的に指向性雑音を抑圧できていることが確認できる.しかし,2ch手法では結果 からもわかる通り,指向性雑音がうまく抑圧できていない到来方向が存在するこ とがわかる.2ch手法を3個のマイクロホンへ拡張した3ch手法の結果を見ると,
ほぼ全ての指向性雑音の到来方向に対応できていることがわかる.また図3.10の
PESQ-MOSの結果もほぼ同等の傾向が見られ,単語正解精度だけでなく,音質の
面でも大きく向上が見られる.このことから,提案した3ch手法によって,ほぼ 全ての方向から到来する指向性雑音を効果的に抑圧できることが可能であること がわかる.