• 検索結果がありません。

1503【ASJ2015S オーラル】pdf 最近の更新履歴 Ryo Masumura: Web

N/A
N/A
Protected

Academic year: 2018

シェア "1503【ASJ2015S オーラル】pdf 最近の更新履歴 Ryo Masumura: Web"

Copied!
20
0
0

読み込み中.... (全文を見る)

全文

(1)

n-gram 混合モデル RNN 混合モデル 同時併用

基 く言語モデル教師 適応 検討

NTT メデ ンテリジ ンス研究所

○増村 亮 , 浅見太一 , 大庭 隆伸 , 政瀧浩和 , 阪内澄宇

(2)

1-1.

言語モデル 分 、

Recurrent Neural Network 言語モデル

近年大流行

(3)

1-2. RNN LM

前 単語

1-of-N 表現

直前

隠 層 出力

音響モデル け GMM-HMM -> DNN-HMM

言語モデル N-gram -> RNN 言わ

次 入力 保持

単語

予測確率分布

hidden(t)

Output(t)

input(t)

hidden(t-1)

再帰的 ネットワヸク構造 効率的 長距離文脈 考慮

文脈情報 連続値表現 捉え デヸタスパヸスネス 回避

ポ ント

(4)

1-3. N-gram RNN 関係

50

60

70

80

90

100

Test 1 Test 2 Test 3

N-gram RNN N-gram+RNN

RNN N-gram 両者 併用

高い性能 実現 こ 知 い

学習デヸタ

N-gram RNN

N-gram

+RNN

線形補間

(5)

1-4. 本研究 動機

教師 適応 行うこ 想定 場合、

N-gram RNN う扱

言語モデル教師 適応

一方 、 N-gram RNN 併用 前提 教師 適応

( 両者 同時 教師 適応 ) 検討さ

 N-gram RNN 教師 適応 効くこ 既知

[Bellegarda+, 2003.] [Kombrink+, 2011.]

音声認識結果

言語モデル

デコヸデ ング

教師 適応

(6)

1-5. 本研究 概要

N-gram RNN 併用 前提 教師 適応

取 組 課題

プロヸチ

N-gram 混合モデル RNN 混合モデル 同時併用

 N-gram RNN 土俵 同時適応可能

両者 併用 適応 こ 有効 ?

適応後 N-gram RNN 相補的 関係 ?

明 いこ

(7)

ジ ンダ

3. 評価実験

4.

1. 研究背

2. 具体的 プロヸチ

(8)

2-1. 混合モデル く教師 適応

ヷヷヷヷヷヷヷ

音声認識結果 混合モデル 生成さ 仮定

� � |� , � , ⋯ , � = � � |� , � � �

log � � = ⋯ + log � � , � + log � �

+ log � � �+�+ , � �+1 + log � � �+ + ⋯

混合 可変パラメヸタ あ 、

調整 こ 適応化 可能

log � � 最大化 � �) EM ルゴリズム 推定

こ 教師 適応 実現

� � �

混合モデル

コンポヸネントモデル

(9)

2-2. RNN 混合モデル

前 単語

1-of-N 表現

hidden(t,1)

予測確率分布

ヷヷヷヷ

input(t) hidden(t,2)

hidden(t,Z)

ヷヷヷヷ

Output(t,1)

Output(t,2)

Output(t,Z)

各コンポヸネント RNN 再学習 こ い 、

教師 適応 適 枠組 あ

Output(t)

RNN 層 独立

確率分布 計算 統合

[Mikoliv+, 2011.][Shi+, 2013.]

(10)

2-3. 提案 教師 適応

N-gram RNN 土俵

両者 組 合わ 際 最適 適応化 実現

ヷヷヷ

適応後モデル

RNN RNN

N-gram N-gram RNN

コンポヸネントモデル

N-gram

+RNN

N-gram

ヷヷヷ

N-gram RNN 関係 く、

全体 音声認識結果

最適 う 混合

(11)

2-4. コンポヸネントモデル 構築方法

学習デヸタ

ヷヷヷヷ

RNN RNN ヷヷヷヷ RNN

N-gram N-gram N-gram

ドキュメントクラスタリング

Latent Dirichlet Allocation

基 くトピックへ 寄与度基準

� = arg max

� �|�

� �

コンポヸネント RNN

学習デヸタ全体 学習 RNN

リトレヸニング こ 構築

コンポヸネント N-gram

学習デヸタ全体 学習

N-gram 線形補間 構築

様々 話題 対応可能 コンポヸネントモデル

同一 語彙サ ズ 構築可能

語彙サ ズ 同一

コンポヸネントモデル

(12)

ジ ンダ

3. 評価実験

4.

1. 研究背

2. 具体的 プロヸチ

(13)

3-1. 実験条件

学習デヸタ CSJ: 2472 講演 ( 700 万形態素 )

テストデヸタ 1 CSJ: 学会 10 講演

テストデヸタ 2 CSJ: 学会 10 講演

テストデヸタ 3 CSJ: 模擬 10 講演

デコヸダ VoiceRex (WFST-based)

音響モデル

Context dependent DNN-HMM

7 hidden layers of 2048 nodes

LDA クラスタサ 50

パヸプレキシテ 単語誤 率 評価

( RNN ASR 利用 リスコ リング 適用 )

(14)

学習デヸタ全体

構築 N-gram

N-gram

+ RNN

3-2. ベヸスラ ンモデル 評価

こ 報告通 、 N-gram RNN 相補的 関係

(

)

50

60

70

80

90

100

Test 1 Test 2 Test 3

15

17

19

21

23

25

Test 1 Test 2 Test 3

学習デヸタ全体

構築 RNN

(15)

3-3. 混合モデル く教師 適応 評価

(

)

N-gram RNN

Adapted N-gram Adapted RNN

N-gram + RNN

50

55

60

65

70

Test 1

22

22.5

23

23.5

24

24.5

25

Test 1

Adapted N-gram + RNN

RNN N-gram 全体 適応化 最高性能、

適応後 N-gram RNN 相補的 関係

(16)

3-4. 考察

適応後 N-gram RNN 相補的 関係 持 ?

50

52

54

56

58

60

62

64

66

Test 1

Adapted N-gram

Adapted N-gram + Baseline RNN

Adapted N-gram + Adapted RNN

長距離文脈 反映さ 状態

RNN 効く

N-gram 適応

= 長距離文脈 反映さ 効果

相補的 関係 理由 、

RNN 連続値表現 くスムヸジング 起因

(17)

ジ ンダ

3. 評価実験

4.

1. 研究背

2. 具体的 プロヸチ

(18)

N-gram RNN 片方 適応

両者 同時併用 適応 こ 最高性能 実現

N-gram 混合モデル RNN 混合モデル 同時併用

基 く教師 適応 検討

LDA 利用 N-gram RNN 混合モデル化

両者 組 合わ 混合モデル 混合 最適化

(19)

ジ ンダ

3. 評価実験

4.

1. 研究背

2. 具体的 プロヸチ

(20)

N-gram LM RNN LM 違い

組 合わ こ 改善効果 、

観点 起因 い 分 い

スムヸジング 観点

N-gram 基本的 単語カ ント 最尤推定

コンテキスト 考慮 スムヸジング項 付与

RNN 単語 連続表現 捉え スムヸジング

長距離文脈 考慮 観点

N-gram N-1 単語 ( 日本語 通常、前 2 単語 ) 考慮

RNN 再帰的 ネットワヸク

長いコンテキスト 考慮可能

参照

関連したドキュメント

Key Word: Reconfigurable Processor, Single Plane Multiple Function, Single Function Multiple Plane, Reconfigurable Part, Dynamic Loading, Fibonacci numbers..

対象地は、196*年(昭和4*年)とほぼ同様であ るが、一部駐車場が縮小され、建物も一部改築及び増築

※固定片は 配管セットに同梱.. 転用する配管セット品番 必要な追加部品品番 対応可能排水芯 CH160FW.

従来から iOS(iPhone など)はアプリケーションでの電話 API(Application Program

再エネ電力100%の普及・活用 に率先的に取り組むRE100宣言

 工学の目的は社会における課題の解決で す。現代社会の課題は複雑化し、柔軟、再構

Faced with the phenomenon that should be called “the trend away from the papers”, which is spreading rap- idly across generations, particularly among youth in their twenties,

敷地からの距離 約48km 火山の形式・タイプ 成層火山..