• 検索結果がありません。

音声認識実験による有効性検証

ドキュメント内 JAIST Repository (ページ 64-67)

AA AAAA

5.2 音声認識実験による有効性検証

5.1

はじめに

本章では、雑音除去の応用例として自動音声認識器(AutomaticSpeechRecognizer;ASR)

を想定し、提案法の ASR のフロントエンド としての有効性を検証する。

検証実験は、ASR に雑音除去アルゴリズムを実装し、フィールド テストによる性能評価 を行なうことも可能である。しかし、これは評価を行なう度に莫大なコストを要し、評価 結果が認識アルゴリズム、実験に用いるデータへ大きく依存する危険もある。より効率的 かつ定量的に評価を行なうためには、客観的な歪み評価尺度の使用が望ましい。本章では、

まず簡単な音声認識実験を行ない、次に雑音除去アルゴリズムの ASR のフロントエンド としての有効性を評価するために相応しい客観的歪み評価尺度を定義する。客観評価尺度 による評価結果と、先に行なった認識実験の結果とを比較し、客観評価尺度の妥当性を検 証する。

そして、客観的歪み評価尺度を用い、提案法の ASR のフロントエンド としての有効性 を調査する。本章では提案法の評価として、非定常雑音に対する従来法との性能比較、定 常雑音に対する遅延和アレーと提案法との性能比較を行ない、提案法の優位性について多 角的に検討する。

HMM の学習に用いたデータは、ATR音声データベース[54] に収録されている男性話 者 mht 発話の重要語 5240 単語から抜粋した 1048 単語のクリーンな音声とする。テスト データは、同データベースに収録されている同話者発話の音韻バランス 216 単語に、計算 機上で 125 Hz{6 kHz の定常的なランダム帯域雑音を付加した音声、あるいはそれに対し て雑音除去を行なった音声とする。

雑音除去アルゴリズムとしては、提案法と、目的信号である音声の到来方向を既知と最 適化した 3 ch遅延和アレーとを用いる。

実験結果:

SNR の雑音付加音声、それに対して遅延和アレーあるいは提案法により雑音除去を 行なった音声のそれぞれに対する音韻認識率を図5.1、誤認識率を図5.2 に示す。なお、ク リーンな音声に対する認識率は84.6 % であった。

考察:

提案法は、音声の歪みの程度 (SNR)に関わらず、雑音の影響により低下した認識率を 大幅に向上させることが可能であることがわかる。同一マイクロホン配置の遅延和アレー との比較においては、提案法の方が圧倒的に雑音除去能力が高く、その差は非常に大きい。

誤認識率を示した図5.2 より、雑音除去前と比較し、遅延和アレーでは誤認識率を高々5%

程度しか低減できていないが、提案法では誤認識率を最大で約20% も低減できている。こ れは、目的音源と雑音源とが移動せず、遅延和アレーは信号到来方向を既知と最適化した場 合の実験結果である。遅延和アレーで方向を自動推定する場合、特に音源が移動する状況 においては、提案法と遅延和アレーとの雑音除去能力の差はより大きくなると考えられる。

20 15 10 5 0 0

20 40 60 80 100

Recognition Rate [%]

SNR [dB]

No processed Delay−and−Sum Proposed method

5.1: 音韻認識実験結果 (雑音除去付加音声、遅延和アレーによる雑音除去音声、提案法 による雑音除去音声)

20 15 10 5 0

0 5 10 15 20 25 30 35

Error Rate [point]

SNR [dB]

No processed Delay−and−Sum Proposed method

5.2: 雑音の影響による誤認識率(雑音除去付加音声、遅延和アレーによる雑音除去音声、

提案法による雑音除去音声)

ドキュメント内 JAIST Repository (ページ 64-67)