• 検索結果がありません。

自主課題研究 特殊な音声に対する音声認識の精度に関する調査

N/A
N/A
Protected

Academic year: 2021

シェア "自主課題研究 特殊な音声に対する音声認識の精度に関する調査"

Copied!
1
0
0

読み込み中.... (全文を見る)

全文

(1)

自主課題研究

特殊な音声に対する音声認識の精度に関する調査

情報システム工学科3年 072 志馬弘基

1 はじめに

ヒトの話す音声言語をコンピュータによって解析 し、話している内容を文字データとして取り出す処 理を音声認識という。近年の音声認識技術の向上に より、音声入力を用いた実用的な対話システムの実 現を目指した研究が進められている。しかしながら、

実用的な音声対話システムの構築には、音声認識誤 りへの対応や音声認識そのものの精度向上が不可欠 な状況である。本稿では、音声認識システム理解の ための基礎的な研究として、既存する音声認識ソフ トウェアを用いて、歌唱音や合成音などといった特 殊な音声に対する認識精度の調査を行うことを目標 とした。具体的には、以下の3つの特殊音声を用意 し、それぞれについて音声認識精度の調査を行った。

1. 音程を変化させた音声 2. 音節間を伸ばした音声

3. 合成音声

尚、今回は音声認識ソフトウェアとしてDragon Naturally Speaking、音声合成ソフトウェアとして Aques Talkを用いた。

2 実験

2.1 音程を変化させた音声に対する認識率

まず、男性が「金沢大学」と発声し録音した音声 ファイルに対して全体の音程を変化させた場合の認 識率について調査を行った。その結果、-4+5 範囲で音程を変化させた場合、ほぼ正しく認識を行 うことが確認できた(1=半音)。この結果について離 散フーリエ変換(DFT)を適用すると、126[Hz](オク ターブ2B)209[Hz](オクターブ3G#)の範 囲で正しく認識できることが確認できた。

次に、各音節ごとに分割して音程をそれぞれ変化 させた場合の音声認識率について調査した。その結 果、ある程度滑らかに音程を変化させた場合は正し く認識できるが、急激に変化させた場合は認識が困 難であることが確認できた。

2.2 音節間を伸ばした音声に対する認識率

音節間を伸ばして発音した場合の認識率を調べた。

その結果、通常に発声した時に比べて認識率は下がる が、5割程度は正しく認識されることが確認できた。

2.3 合成音声に対する認識率

音声合成ソフトウェアを用いて発音させた場合の 認識率を調べた。その結果、男性合成音では約8 認識可能であったが、ロボット合成音では全く認識 が行えなかった。また、女性合成音でも認識できず、

合成音声に対しては認識が困難であることが確認で きた。

3 まとめ

本研究では、特殊な音声に対する認識率の精度を 調査した。現在の音声認識ソフトウェアは、ユーザ が単語を区切って発音したり、ゆっくり発音するこ となどを前提として提供されているため、やはり意 図的に作成した特殊な音声に対してはそれほど高い 認識率は得られなかった。今後の課題としては、今 回取り上げた3つの特殊な音声を組み合わせた音声 に対しての認識率の調査などが挙げられる。例えば、

音声合成ソフトウェアVOCALOIDを用いた時の認 識率などは調査の余地があると考えられる。また、

実際に音声認識を行うシステムの構築を行うことも 今後の課題として挙げられる。

参照

関連したドキュメント

C =>/ 法において式 %3;( のように閾値を設定し て原音付加を行ない,雑音抑圧音声を聞いてみたところ あまり音質の改善がなかった.図 ;

音節の外側に解放されることがない】)。ところがこ

 TV会議やハンズフリー電話においては、音声のスピーカからマイク

また適切な音量で音が聞 こえる音響設備を常設設 備として備えている なお、常設設備の効果が適 切に得られない場合、クラ

Classroom 上で PowerPoint をプレビューした状態だと音声は再生されません。一旦、自分の PC

具体音出現パターン パターン パターンからみた パターン からみた からみた音声置換 からみた 音声置換 音声置換の 音声置換 の の考察

試験音再生用音源(スピーカー)は、可搬型(重量 20kg 程度)かつ再生能力等の条件

By the method I, emotional recognition rate is 60% for close data, and 50% for open data(8 sentence speech of another speaker).The method II improves drastically the recognition