• 検索結果がありません。

二重母音の音声の抽出

ドキュメント内 JAIST Repository (ページ 45-49)

CF TEMPO2

5.4 二重母音の音声の抽出

0 5 10 15 20 0

2 4 6 8 10 12 14 16 18 20

SNR [dB]

SNR [dB]

5.18: 二重母音の雑音抑圧精度(SNR)

0 5 10 15 20

0 2 4 6 8 10 12 14

SNR [dB]

SD [dB]

No Process Proposed Method

5.19: 二重母音の雑音抑圧精度(SD)

0 5 10 15 20 0

5 10 15

SNR [dB]

ASD [dB]

No Process Proposed Method

5.20: 二重母音の雑音抑圧精度(ASD)

5.5

考察

まず、白色雑音を付加された音声の雑音抑圧結果から考える。

単母音ではSNRSDASD全ての評価方法で第3章のクリーンな音声から得られた基 本周波数による雑音抑圧の場合とほぼ同様の結果が得られた。第3章のものよりもSNR はやや精度が下がっているが、これは音声の立ち上がり/立ち下がりでは振幅が小さくな るためにその区間のSNR が小さくなり、音声の立ち上がり/立ち下がりの基本周波数が 正確に得られないことによるものであると考えられる。抑圧前のSNR15dB以上のと きに抑圧後のSNRが悪くなるのは第3章で述べたように雑音と共に音声成分の一部も除 去してしまうことが原因である。

連続母音では単母音に比べて大きくSNRの精度が低下している。今回のシミュレーショ ンでは帯域幅可変くし形フィルタのパラメータは常に=0:5と一定の値としたが、実際 には最適なSNRが得られるの値は音韻や高調波の時間的変動によって異なる。特に高 調波成分が周波数軸上で幅広くなっていると高調波成分が多く除去されてしまうことで

SNRの悪化が生じると考えられる。除去される高調波成分が韻律性に強く関わらない部 分であれば、やや音色が変わって聴こえることがあるものの聴感上は雑音感の軽減が感じ られる。これは聴覚特性を考慮した尺度である では と異なり精度の向上が見

られることに対応していると考えられる。

次に、ピンク帯域雑音を付加された音声の雑音抑圧結果について考察する。

単母音については雑音抑圧前のSNRが小さい場合はSNRASDにおいて雑音抑圧処 理による改善が見られる。目的音の成分の一部を除去してしまうためにSDは悪くなって いるが、聴覚マスキングによって聴こえない部分であるためASDでは改善を示している と考えられる。処理前のSNR10dB以上の音声に対しては雑音抑圧処理によって評価 値が悪くなってしまう。これも音声の立ち上がり/立ち下がりにおける基本周波数推定エ ラーによるものと高調波成分の除去によるものであると考えられる。特にピンク帯域雑音 では音声と同じ低周波数域でのパワーが強いため、目的音の基本周波数やその高調波と同 じ周波数帯域の雑音が除去できないことがSNRSDASDの悪化に繋がっている。

連続母音についてもほぼ同様の傾向が見られる。

二重母音の雑音抑圧結果からは、雑音が大きい場合はSNRSDASD共に改善が見ら れる。特に二重母音では白色雑音やピンク帯域雑音に比べ、聴感上の雑音感がかなり軽減 しているように感じられる。これはSDが悪化していてもASDが改善されていることに 対応しており、二重母音に対しても本研究が有効であると考えられる。

以上の結果から、本研究で提案した雑音環境における基本周波数推定法及び雑音抑圧法 が、雑音が白色雑音であるときや二重母音の場合において、有効であることが分かった。

しかし、雑音がピンク帯域雑音の場合には、音声の高調波成分の除去や目的音と同じ周波 数帯域の雑音の影響により、充分な性能は見られなかった。

6

ドキュメント内 JAIST Repository (ページ 45-49)

関連したドキュメント