4.1 評価方法
本章では,本研究で提案する基本周波数推定法の耐残響性能を評価する.
残響の付加は第2章での従来法の評価と同じである.評価に使用した音声データは第2 章と同じデータベースを用いた.評価尺度についても第2章と同じく,推定誤差5%以内 の正答率とSNRを用いた.また,比較のため従来の手法のうち最も残響に頑健であった ケプストラム法と,クリーンな状況では最も精度の高かったTEMPO も併せて示す.ま た,提案法の前半部の処理の残響に対する有効性を調べるため,自己相関法を用いた結果 も併せて表示し,提案法の内,後半部の処理に自己相関法を用いた手法と比較する.
4.2 評価結果
図4.1,図4.2に評価結果を示す.まず,正答率を見ると,提案法の内,複素ケプストラ
ム分析を用いて抽出した音源情報の振幅スペクトルからCombフィルターで基本周波数 を推定した場合の正答率は,すべての時間においてケプストラム法を上回っている.残響
時間が0.5 s以上の比較的長い場合では,3%程の改善となっている.また,残響時間が非
常に短い場合(ほぼ残響の影響がない場合)でも,TEMPOより2%程度低いほどで,ク リーンな状況においても推定精度の低下がほとんどないことが分かる.提案法の内,複素 ケプストラム分析を用いて抽出した音源情報の時間波形から自己相関法を用いて基本周 波数を推定した場合の正答率は,ケプストラム法に比べほぼすべての残響時間において 3%ほど下回る性能であった.しかし,時間波形の自己相関法と比べると若干の改善があ り,複素ケプストラム分析を用いた音源情報の抽出の効果があることが分かる.
SNRで見ると,残響時間が短い場合では,TEMPO,自己相関法よりも精度が悪いが,
残響時間が長い場合は,提案法の内,両方の手法とも,従来法を僅かながら上回る精度で あった.
以上のことから,提案法の内,複素ケプストラム分析により抽出した音源情報からComb フィルタを利用して推定する手法は従来法に比べ残響に対して頑健であり,また残響の有 無に関わらず適用できる手法であることが分かった.また,提案法の内,複素ケプストラ ム分析により抽出した音源情報から自己相関法を利用して推定する手法と,時間波形か
0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2 0
10 20 30 40 50 60 70 80 90 100
TR (s)
Correct rate (%)
Propose(Comb) Propose(ACorr) Cepstrum TEMPO ACorr
図 4.1: 提案法の評価(正答率)
らの自己相関法とを比較すると,提案法のほうが残響に対して頑健であったことから,両 者の違いである提案法の前半部の処理は残響に対して有効な処理であることが分かった.
従って,音源・フィルターモデルを仮定し,ケプストラム上で音源情報を抽出する処理は 残響の影響を取り除く有効な処理と言える.
4.3 考察
前節の結果から,提案法は従来法に比べて残響に頑健であることが分かった.しかし,
提案法は従来法に比べて劇的に精度が良いわけではなかった.残響のインパルス応答は通 常の基本周波数推定法で用いられる窓長よりも長い場合が多いため,過去のフレームの 情報が現在のフレームに影響を与えているが,提案法はこの影響を考慮していない.従っ て,提案法は分析フレーム内の残響の影響はある程度取り除けてはいるが,過去のフレー
0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2 30
32 34 36 38 40 42 44 46 48 50
TR (s)
SNR (dB)
Propose(Comb) Propose(ACorr) Cepstrum ACorr TEMPO
図 4.2: 提案法の評価(SNR)
ムの影響が大きいため劇的な改善とはならなかったと考えられる.この影響を考慮するた め,過去のフレームの情報を積極的に利用する処理や,残響のインパルス応答長よりも長 いフレーム長での処理を検討することで大きく精度が向上すると考えられる.次章では,
この過去のフレームの影響を考慮し,さらに頑健に残響音声から基本周波数を推定する手 法を考察する.