AA AAAA
6.4 客観的評価尺度による雑音除去アルゴリズムの評価
0 1 2 3 4 5 6 0
20 40 60 80
Frequency [kHz]
Amplitude [dB]
図 6.3: ASD 算出過程の解説図
により歪み量を計算する。ここで、Starg et(!)、Sclean(!) は、評価対象音声、クリーンな音 声の振幅スペクトルとする。また、周波数 i は、評価対象周波数の 100 Hz から 6kHz の うち、評価対象音声の振幅スペクトル Xtarg et(!) が、マスキング閾値を越える周波数であ る。従って、評価に用いられる周波数は、各短時間フレームごとに異なる。評価対象音声 の客観的な歪み量ASD値は、各フレームごとに式 (6.1)で求められる歪み量の音声区間に おける平均値と定義する。
相対可聴閾値算出の詳細は付録 A 1 に記しており、ASD の間隔尺度としての妥当性に ついては付録A 2 で検証している。
実験条件:
客観的評価尺度 ASD を基準とした雑音除去実験に用いた音声は、ATR音声データベー ス[54] に収録されている男性話者mht氏発話の日本語連続母音/ao/ である。このクリー ンな音声 /ao/ の /a/ から/o/ へのわたり部に、2kHz-3 kHz のランダム帯域雑音を突発 的に、SNR が10 dBになるように付加する。このデータは、客観的評価尺度 ASD の妥当 性検証(付録 A 2) に用いたものと同様である。
実験は、サブトラクション係数 を 0 から 0.1 刻みで 2.0 まで変化させ、客観評価尺 度 ASD を基準とした場合のサブトラクション係数 の最適値を求める。これが、主観評 価値 MOSを評価基準とした場合と同様の傾向を示せば、本実験からも客観評価尺度ASD の妥当性が証明できる。
また、聴感上の歪み感低減能力に関する提案法と従来法との性能比較として、第2.4節で用 いた2つの突発性雑音を付加した単母音/a/に対する雑音除去音声をASDにより評価する。
実験結果:
聴感上の印象を考慮した客観的歪み評価尺度 ASD を評価基準とし、サブトラクション 係数 を変化させ、雑音除去を行なった結果を図 6.4 に示す。この場合、サブトラクショ ン係数 の最適値は 1.2 である。
また、SNR0dB の雑音付加音声に対し、第2章で解説した1ch 雑音適応型 SS、2ch雑 音推定型 SS、3ch遅延和アレー、3chGriths-Jim 適応型アレーにより雑音除去を行なっ た音声に対する ASD 値を図6.5 に示す。
考察:
本節の実験において、ASD を評価基準とした場合のサブトラクション係数 の最適値 は、主観評価値 MOSを評価基準にした場合(1:1 1:3 に最適値は存在するが明確で はなく、1:3 < 2:0 でも歪みは比較的小さい)と類似しており、ASR のフロントエン ド としての最適値(明確に 1.0 が最適値) とは異なることがわかった。つまり、聴感上の歪
0 0.5 1 1.5 2 0
2 4 6 8 10
Subtraction Coefficient α
ASD [dB]
図 6.4: サブトラクション係数 と ASD 値との関係
1 2 3 4 5 6 0
2 4 6 8 10 12 14 16 18
ASD [dB]
Proposed No process.
1ch adapt. SS 2ch SS
3ch DS 3ch GJ
ASD [dB]
0 4 6 8 10 12 14 16 18
2
図 6.5: 客観的評価尺度 ASD に基づいた提案法と従来法との雑音除去能力の比較(左から 順に、雑音付加音声の ASD 値(No process.)、1ch 雑音適応型 SS(1chadapt. SS)、2ch雑 音推定型 SS (2ch SS)、3ch 遅延和アレー(3ch DS)、3ch Griths-Jim 適応型アレー(3ch
GJ)、提案法(Proposed)による雑音除去音声のASD 値)
み感を評価するためには、SNR や第 5 章で定義した LPC-SED ではなく、本章で作成し た ASD を用いることが望ましい。評価尺度ASD の妥当性に関しては、付録 A 2におい て、聴覚特性を考慮しない客観的歪み評価尺度SD との比較により、ASD が聴感上の歪み 感をより忠実に評価できることも検証している。以上より、加法性雑音により生じた聴感 上の歪み感の評価において、客観的評価尺度 ASD が適していることがわかる。また同時 に、ASD による評価において、提案法が非定常雑音を除去できることを確認した。
提案法と従来法の聴感上の歪み感低減能力の比較に関しては、ASD 値による各雑音除 去アルゴリズムの評価結果 (図 6.5) より、提案法が最も優れていることがわかる。図 6.5 において、2ch 雑音推定型 SS により雑音除去を行なった結果、歪み量が 2倍以上に増大 している。これは 2ch 雑音推定 SS が、音声区間中で発生する突発的な雑音を推定でき なかっただけでなく、目的信号である音声に新たに歪みを生じさせたためである。また、
LPC-SED 値による評価 (図 5.7) では、遅延和アレーと Griths-Jim 適応型アレーはほ
ぼ同等の雑音除去能力を示していたが、聴感上の歪み印象に対応した評価尺度 ASD に より評価を行なうと、遅延和アレーの方が雑音除去能力が優れていることがわかる。これ は、適応型アレーが、我々が敏感に反応する雑音の立ち上がり部を除去できないためである。
客観的評価尺度 ASD の妥当性は、以下の考察により証明することも可能である。目的 信号と一つの雑音のみが存在する状況において、サブトラクション係数 が 1.0 よりも 大きい場合、雑音除去音声の振幅スペクトルは本来の大きさよりも小さくなる。これより、
我々の聴覚系は、雑音による極わずかな歪みにも敏感に反応する一方、振幅スペクトル形 状の若干の崩壊には鈍感であろうことが予想される。雑音スペクトルを本来の大きさより も大きく見積もって引き去ることは、スペクトルのピーク部、デ ィップ部に無関係に、全 周波数帯域に等しく影響を及ぼす。しかし、スペクトルのデ ィップ部あるいはスペクトル レベルが小さな周波数帯域に関しては、マスキングの影響により我々がそれらを知覚する ことは困難である。以上より、マスキングの影響を受けない振幅スペクトルのピーク部に 生じた歪みのみを評価する ASD は、我々の聴覚系に近い評価尺度であると言える。
6.5
まとめ
本章では、主観評価実験、聴感上の歪み印象に対応した歪み評価尺度ASD による客観的 評価により、提案法が非定常雑音により生じた聴感上の歪み感を低減できることを確認し た。提案法と従来法との聴感上の歪み感低減能力の差異に関しては、特に突発性雑音の除去 においては提案法の優位性を確認することができ、適応フィルタを利用するGriths-Jim 型アレーは、突発性雑音の立ち上がり部を除去できないため、聴感上の印象を向上させる ことが困難であることを確認した。
サブトラクション係数の最適値は、評価基準としてLPC-SED値を用いた場合(=1:0) と、MOS あるいは ASD 値を用いた場合(1:1 1:3) とでは異なることがわかった。
提案法は、一つのパラメータ値 の変更により、ASRの雑音除去フロントエンド、聴感上 の歪み感低減の両目的に応用できるため、汎用性が高い雑音除去アルゴリズムである。
第
7章
実環境における有効性検証
7.1
はじめに
第 3 章において雑音除去アルゴリズムの定式化を行ない、それ以後の章では提案法の基 礎的な性能評価、ASR のフロントエンドとしての有効性、聴感上の歪み感低減能力につい て検証してきた。その結果、あらゆる評価実験において、提案法は高精度の雑音除去が可 能であり、特に突発雑音のような従来法が苦手としてきた非定常雑音の除去に関しては、
提案法は従来法よりも雑音除去能力が高いことを確認した。但し、前章までの評価実験は、
暗騒音や残響が存在しない環境を想定した計算機上での雑音除去実験の結果である。
本章では、提案法の実環境適応性を調査するために、実環境における雑音除去実験を行 なう。雑音除去実験に用いた実環境は、暗騒音はほとんど存在せず残響時間が非常に短い 環境、我々が日常生活で使用するような一般的なオフィス、暗騒音が多く残響時間も非常 に長い劣悪な環境の 3 種類である。