• 検索結果がありません。

従来の指向性雑音抑圧手法との比較結果

ドキュメント内 U055-3 (ページ 42-45)

第 3 章 正方形マイクロホンアレイを用いた指向性雑音抑圧 23

3.3 指向性雑音抑圧実験

3.3.3 従来の指向性雑音抑圧手法との比較結果

34 第3章 正方形マイクロホンアレイを用いた指向性雑音抑圧

"!#!%$'&()*

+,,-.,/

01

2 3 4 5 6 5 5 6 5 5 6 75 6 5

図 3.9 2話者同時発話における単語正解精度.

果的に指向性雑音を抑圧できていることが確認できる.しかし,2ch手法では結果 からもわかる通り,指向性雑音がうまく抑圧できていない到来方向が存在するこ とがわかる.2ch手法を3個のマイクロホンへ拡張した3ch手法の結果を見ると,

ほぼ全ての指向性雑音の到来方向に対応できていることがわかる.また図3.10の

PESQ-MOSの結果もほぼ同等の傾向が見られ,単語正解精度だけでなく,音質の

面でも大きく向上が見られる.このことから,提案した3ch手法によって,ほぼ 全ての方向から到来する指向性雑音を効果的に抑圧できることが可能であること がわかる.

"!$##&%(') *+

,-./0

12. 3 "4 5

6

5

5 6

5

5 6

5 6

5

図 3.10 2話者同時発話におけるPESQ-MOS.

は図3.8において,θ = 90°とした.比較を行った手法は,図3.8における4個の マイクロホンを用いたDelay & sum法 (DS),図3.8においてch1とch2を用いて,

Griffiths-Jim型のビームフォーマーを施したもの (2ch-GJBF) [4],浅野らによる2 チャンネルのマイクロホンに基づくSSを施したもの(2ch-SS) [5],マイクロホン間 の位相差に基づいて時間-周波数マスキングを施したもの(2ch-TFmasking) [7]であ る.なお,Griffiths-Jim型のビームフォーマーでの適応フィルタのタップ数は512 tapとし,2ch-SSでの雑音の到来方向は真値を与えた.さらに,2ch-TFmaskingで は目的音声とする角度をマイクロホンアレイ正面に対して±20°の範囲とした.単 語正解精度とPESQ-MOSによる結果を表3.1に示す.

この結果より,マイクロホンアレイによるビームフォーミングが基になってい る,DS,2ch-GJBF,2ch-SSは若干の性能の向上は見られるものの効果的とは言 えない.これはマイク間隔が非常に狭いため,急峻な死角またはビームが向けら

36 第3章 正方形マイクロホンアレイを用いた指向性雑音抑圧 表 3.1 他の指向性雑音抑圧手法と提案手法との比較結果.

method word accuracy [%] PESQ-MOS

non-proess 0.25 1.89

DS 6.23 1.99

2ch-GJBF [4] 9.66 2.04

2ch-SS [5] 24.9 2.29

2ch-TFmasking [7] 62.2 2.72

ch1&ch2&ch3 63.2 2.75

れていないためであると考えられる.一方,2ch-TFmaskingや提案手法では,大 幅な単語正解精度,PESQ-MOSの向上が見られる.これは,マイクロホンアレイ によるビームフォーミングが,一つの要素として用いられているが,最終的には 時間-周波数マスキングや,SS等の非線形処理を加えることで,効果的に雑音を抑 圧しているためである.なお,2ch-TFmaskingと提案手法の性能がかなり近い値 を達成しているが,両手法とも音声のスパース性の仮定に基づいた手法であるた め,時間-周波数マスキングによるアプローチという点では,この実験環境下での 性能限界にほぼ達しているためであると考えられる.

以上,本章では,正方形マイクロホンアレイを用いた新しい指向性雑音抑圧に ついて述べた.提案手法は少ないマイクロホン数,具体的には最小で2個のマイ クロホンがあれば,効果的に指向性雑音を抑圧できる.さらに,3個のマイクロホ ンへの拡張も容易に可能で,それによってほぼ全ての方向から到来する指向性雑 音に対応できる.また,雑音抑圧性能面でも他の指向性雑音抑圧手法と比較して,

音声認識精度,PESQ-MOSの二つの面で,優れていることを確認した.

4 章 正方形マイクロホンアレイを

ドキュメント内 U055-3 (ページ 42-45)