1502【IS2014レビュー】pdf 最近の更新履歴 Ryo Masumura: Web

(1)

Interspeech2014 ^参加報告

言語モデルヷ音辞書

NTT ^メデ ^ンテリ ^ン ^研究所

増村亮

(2)

 ^LSTM ^基 ^{く言語モデリン} ^ツヸル ^紹介 ^性能調査

 ^LSTM ^利点

 ^通常 ^RNN ^{長距離文脈} ^反映可能

 ^LSTM^{言語モデル自体} Interspeech2012 ^筆者 ^提案

 ^ツヸル ^ㆁ様

 ^GPU^ベヸ (RNNLM toolkit CPU )

 ^NNLM ^同様 Projection layer ^導入 ^い

 ^ラ ^導入 ^こ ^高速化

 ^通常 ^RNNLM ^学習可能

 ^性能

 ^Treebank^コヸパ ^評価通常 _RNN 高い性能実現

rwthlm ^– The RWTH Aachen University

Neural Network Language Modeling Toolkit

前 ₁単語入力

(3)

Language Modeling with Sum-Product Networks

 Sum-Product Network (SPN) ^使 ^{言語モデル} ^提案

 ^DNN ^１種 ^{加算ノヸド} ^ㆂ ^{乗算ノヸド} ^持 [Gens+, NIPS 2012]

 ^Treebank^コヸパ ^評価

ロンコンテキト情報用いこく高い性能実現

通常隠層各ユニット出力単語対応語彙サこユニット数一致

1-of-K^表現 ^連続値 ^ベ ^トル化隠層出力 ₂乗加味

(^入力 ^複雑 ^関係 ^さ ^捉え ^い) ほい部分 _y ₁ 立テベヸョン

(4)

Word-Phrase-Entity Language Models:

Getting More Mileage out of N-grams

 ^文脈 ^応 ^フレヸ ^化や ^ラ ^化 ^行 ^n-gram ^構築

 ^{固有表現抽出器} ^活 ^こ ^こ ^研究 ^ポ ^ント

 ^単語系列 ^ラ ^系列 ^同時確率 ^最大 ^う

ラ化やフレヸ化実施

デ “brad+pitt+and+angelina+jolie^” ^いう1^単語 ^録 ^方 “ACTOR and ACTOR” いラ化行うい

^一般的 ^文脈 ACTOR ^ラ ^“angelina+jolie ^” ^入 ^方 ^い

ラ _n-gram

ラ単語や

フレヸ出確率

(5)

One Billion Word Benchmark for Measuring Progress

in Statistical Language Modeling

 ^{大規模テキ} ^ト ^{言語モデル} ^構築 ^際 Comparative Study

 ^Web^サ ^ト ^集 ^デヸタ

 ^約⁸^億単語 ^異 ^語彙数⁸⁰^万

 ^学習用 ^開 ^用 ^テ ^ト用 ^整備さ ^い

 ^n-gram ^最大 ^{ントロピヸモデル} ^RNN ^{パヸプレキテ} ^比較

 ^{大規模デヸタ} ^学習 ^一番 ^ネッ ^あ RNNLM^等 ^高速化 ^工夫 ^実施

(6)

Speech Recognition without a Lexicon ^– Bridging the Gap between Graphemic and Phonetic Systems

 ^音素 ^概念 ^用い ^こ ^く ^音辞書 ^構築 ^方法 ^提案

 ^音声 ^書 ^起こ ⁽^{書記素系列}⁾ ^組 ^あ ^こ ^想定

書記素音初期書記素音響モデル作

デコヸド各単語書記素振

G2P(Grapheme 2 Phoneme Conversion) ^学習 Pronunciation Mixture Model ^複数読 ^推定

A. ^{書記素ベヸ}

D. ^音素ベヸ (^専門家 ^知識あ )

C. ^{音響モデル} ^リ ^ラ ^メント ^再学習 B. ^提案法 ^{音辞書構築}

A. B. C. D.

1502【IS2014レビュー】pdf 最近の更新履歴 Ryo Masumura: Web

Interspeech2014 参加報告

言語モデルヷ 音辞書

NTT メデ ンテリ ン 研究所

増村 亮

 LSTM 基 く言語モデリン ツヸル 紹介 性能調査

rwthlm – The RWTH Aachen University