• 検索結果がありません。

音声認識における特徴量の非同期性と音素環境依存性

N/A
N/A
Protected

Academic year: 2021

シェア "音声認識における特徴量の非同期性と音素環境依存性"

Copied!
2
0
0

読み込み中.... (全文を見る)

全文

(1)

Japan Advanced Institute of Science and Technology

JAIST Repository

https://dspace.jaist.ac.jp/

Title

音声認識における特徴量の非同期性と音素環境依存性

のモデル化に関する研究

Author(s)

松田, 繁樹

Citation

Issue Date

2003‑03

Type

Thesis or Dissertation

Text version

author

URL

http://hdl.handle.net/10119/937

Rights

Description

Supervisor:下平 博, 情報科学研究科, 博士

(2)

音声認識における特徴量の非同期性と音素環境依存性の モデル化に関する研究

松田 繁樹

北陸先端科学技術大学院大学 情報科学研究科

¾¼¼¿

¾

½¼

あらまし

本研究では,音響特徴ベクトル時系列における個々の音響特徴量の振舞いに着目した音声認識性能の 改善に関する検討を行う.音声認識システムの音響モデルとして広く用いられている隠れマルコフモデル

ÀÅÅ)は,音声の観測量がベクトルであることを仮定している.本研究は,このような常識を覆し,「個 別特徴量の集合」として捉えることにより,従来になかった次に述べる¾つの仮説について検討を行った.

½の仮説として,「個々の特徴量の時間非同期性」に着目した.音響特徴ベクトル時系列の個々の音響 特徴量の値は必ずしも同じタイミングで変化していない.従来型ÀÅÅは,音響特徴ベクトルを構成して いるすべての特徴量の値がÀÅÅの状態遷移と同じタイミングで変化することを仮定したモデルである.

従って,このような信号を従来型ÀÅÅでモデル化した場合,大量の時間方向状態数が必要となる.しか し,大量の時間方向状態数は,モデルパラメータの多大な増加を招くため,モデルの統計的信頼性の低下 に繋がる.そこで本検討では,個々の特徴量の値がお互いに異なるタイミングで変化するモデルの検討を 行う.本検討の結果,特定話者音声認識において,本手法の有効性を確認した.

¾の仮説として,「個々の特徴量の音素環境依存性」に着目した.従来提案されたパラメータ共有法の 幾つかは,音素環境依存性を考慮したクラスタリングを行なっている.この従来のパラメータ共有法は,全 ての特徴量に対して共通のパラメータ共有構造を割り当てる手法である.しかし,音声の観測量である音 響特徴ベクトルは,お互いに異なった振舞いを持つ音響特徴量の集合であり,お互いに異なった複雑性や 音素環境依存性を持つと考えられる.そこで本検討では,個々の特徴量に依存したパラメータ共有構造を,

音素環境依存性を考慮して決定することにる,音声認識性能の改善を検証した.本検討の結果,比較的少 ないパラメータ数を持つモデルで,その有効性を確認した.

以上のように,従来の音声認識においては「特徴ベクトル」という概念のもとに特徴量が一括して扱わ れて来たのに対し,本研究では,個別特徴量の扱いを提唱し,時間特性と環境依存性の¾つの側面から検 証し,モデルや学習及び,認識アルゴリズムを提案し,実験を通して有効性を実証した.

キーワード 音声認識,音響モデル,非同期遷移型隠れマルコフモデル,時間方向共有法,

特徴量依存音素環境クラスタリング,特徴量依存逐次状態分割法

­

参照

関連したドキュメント

The Association for the Geological Collaboration in Japan (AGCJ).. NII-Electronic

C =>/ 法において式 %3;( のように閾値を設定し て原音付加を行ない,雑音抑圧音声を聞いてみたところ あまり音質の改善がなかった.図 ;

−104−..

音節の外側に解放されることがない】)。ところがこ

三島由紀夫の海外旅行という点では、アジア太平洋戦争

 TV会議やハンズフリー電話においては、音声のスピーカからマイク

せん断帯の数値解析は、材料の非線形性だけでなく初期形状の非対称性や材料の非均質性

チツヂヅに共通する音声条件は,いずれも狭母音の前であることである。だからと