Noise estimation based on generalized gamma distribution
著者 Dang Xin
year 2013‑06
出版者 Shizuoka University
URL http://doi.org/10.14945/00007933
(課程博士・様式9)
審 査 要 旨
本論文は、音声強調のための雑音パワー・スペクトラム密度の推定について述べ ている。音は一つのマイクロホンで収録され、実時間で処理することを目標として いる。実時間で処理するには、過去のデータのみが使用できるという拘束条件があ る。分析では、短時間 FFT(高速フーリエ変換)を用いて、その周波数ビンごと に分布を求めている。
音声は、有声音と無声音という2つの異なる性質を持つ音で構成されており、こ の2つの分布密度関数が異なることを示している。一方、雑音は、音声に比べて定 常的で、一般化ガンマ分布密度関数によってより良く表現される。まず、4種類の 非白色雑音を、通常使用されている4つのラプラス、レイリー、ガウスとガンマ分 布密度関数を使用して、雑音スペクトラムの統計モデルについて検討している。そ の結果、ガンマ分布密度関数が適合していることを示している。さらにより適合さ せるために、適応パラメータを持つ2つの一般化ガンマ分布密度関数を提案し、非 白色雑音により適合することを示している。この結果と変形されたウィナー・フィ ルタを用いて音声強調、すなわち音声の雑音軽減について検討している。雑音は、
ある大きさでほぼ一定である場合だけでなく、時々刻々変化する場合も検討してい る。一般化ガンマ分布密度関数を用いて、ML(最尤推定)と MAP(最大事後確率)に 基づいてパワー・スペクトラム密度を推定している。これらのパワー・スペクトラ ム密度の推定は、対数誤差、SN比改善量、音声の主観および客観評価において、
従来法であるMMSE(最小二乗誤差)、MS(最小統計)やSAP(音声不在確率)
による推定よりも改善されることを示している。2つの一般化ガンマ分布密度関数 による推定は、一方はSN比0dBで、もう一方はSN比5dB以上でより改善され ることを示している。
また、音声の位相スペクトル推定に関して、分析修正合成(Analysis Modification Synthesis)、位相スペクトル補償(Phase Spectrum Compensation)、高分解能離散 フーリエ変換(High Resolution Discrete Fourier Transform)の3つの推定につい て、雑音パワー・スペクトラム密度推定と変形されたウィナー・フィルタを用いて 作成し、評価している。SNRが0dBや5dBのように雑音が大きいときは、いずれ の方法も位相を推定しない場合より改善されることを示している。「分析修正合成」
が音声の主観および客観評価で一番よく、「高分解能離散フーリエ変換」が最大の SNR改善量を示している。
以上のように、雑音の大きさと位相を推定する手法と、それにより音声の雑音軽 減ができることを示しており、博士(工学)の学位を授与するに十分な内容を有す るものと認める。
(1,000字程度)