音声認識エンジンの複数実行の効果
2
0
0
全文
(2) 情報処理学会第 74 回全国大会. ID 1 2 3. モデル. 状態数. 4.結論. 性別. Triphone 3000 3000 Dependent PTM triphone 3000 Dependent PTM triphone 3000 Independent 表1:音響モデル ID A B C D. 第 1 パス 第 2 パス. モデル. 語数. 圧縮率. 20k.1-1 20K 20k.1-1.10p 20K 60k.1-1 60K 60k.1-1.10p 60K 表2:言語モデル. 10% 10%. 単語間 言語 トライフォン モデル 近似的 Bigram 厳密 Trigram 表3:デコーダ. 探索法 最尤近似 N ベスト. 解析する際、無音期間の長さなどのパラメータ を調整できる。我々が今回用いた音響モデル、 言語モデルを表1、2に示す。 Julius に「およそ桃太郎の話を知らない人は いない」という文章を与え、表3のデコーダを 用いて音声認識させた結果が表4である。表4 では、認識された単語のうち原文に含まれてい る単語の数を認識率とした。 それぞれの認識率は 6/10(60%)から 7/10(70%) であったが、多数決原理を用いて共通部分を取 り出すことで 8/9(89%)へと認識率が向上した。. ID. 低い認識率の音声認識エンジンであってでも、 種々の音声認識エンジンを数多く同時並列実行 し、認識結果に対して多数決を行うことで、 少々の誤認識は隠蔽され、結果的に高い認識率 が得られる。このことはコンピュータシミュレ ーションで予想されていたが、実際に音声認識 エンジンで実行して確認した。したがって、 我々の手法は効果的であることが明らかになっ た。 今回得られた最終的な認識率はまだまだ満足 できるものではない。言語モデルにおける辞書 の語彙数を増やすことや、パラメータをさらに 調整することで、さらに認識率を向上させたい。 また、多くの話者の種々の文章を与えてでも、 高い認識率が得られることを目指したい。 謝辞 本研究の一部は日本学術振興会科学研究費基 盤研究 (C) No. 22500519 の助成を受けたもので ある。 参考文献 [1] S. Seto, et.al., The 20th National Conference of Australian Society for Operations Research, Australia (2009) [2] H. Kawabe, et.al., The 40th International Conference on Computers and Industrial Engineering, Japan (2010) [3] A. Lee, et.al., Proc. European Conf. on Speech Communication and Technology, pp.1691-1694, 2001.. 文章. 認識率. 原文. およそ. ももたろう. の. はなし. お. しらない. ひと. わ. いない. -. 1-A 2-A 3-A 1-B 2-B 3-B 1-C 2-C 3-C 1-D 2-D 3-D 共通. およそ およそ およそ およそ およそ およそ およそ およそ およそ およそ およそ およそ およそ. の かん もだん もと のうせん ぼん ぼん の かん もと もと の かん もと の こぶ もと. お. はなし は が はなし はなし はんが はなし はなし はなし はなし はなし はなし はなし はなし. お お も お お も お も も お も も お. しらない しらない しらない しらない しらない しらない しらない しらない しらない しらない しらない しらない しらない. ひと ひと ひと ひと ひと ひと ひと ひと ひと ひと ひと ひと ひと. わ わ わ わ わ わ わ わ わ わ わ わ わ. いない いない いない いない いない いない いない いない いない いない いない いない いない. 7/10 6/10 6/9 7/10 6/10 6/9 7/10 6/9 6/9 7/10 6/9 6/10 8/9. の の の の の の の の の の の. て. しゅう. 表4:認識結果. 4-10. Copyright 2012 Information Processing Society of Japan. All Rights Reserved..
(3)
関連したドキュメント
外声の前述した譜諺的なパセージをより効果的 に表出せんがための考えによるものと解釈でき
私はその様なことは初耳であるし,すでに昨年度入学の時,夜尿症に入用の持物を用
パキロビッドパックを処方入力の上、 F8特殊指示 →「(治)」 の列に 「1:する」 を入力して F9更新 を押下してください。.. 備考欄に「治」と登録されます。
しかし , 特性関数 を使った証明には複素解析や Fourier 解析の知識が多少必要となってくるため , ここではより初等的な道 具のみで証明を実行できる Stein の方法
ダウンロードした書類は、 「MSP ゴシック、11ポイント」で記入で きるようになっています。字数制限がある書類は枠を広げず入力してく
・性能評価試験における生活排水の流入パターンでのピーク流入は 250L が 59L/min (お風呂の
・電源投入直後の MPIO は出力状態に設定されているため全ての S/PDIF 信号を入力する前に MPSEL レジスタで MPIO を入力状態に設定する必要がある。MPSEL
理由:ボイラー MCR範囲内の 定格出力超過出 力は技術評価に て問題なしと確 認 済 み で あ る が、複数の火力