• 検索結果がありません。

LM masumura 最近の更新履歴 Ryo Masumura: Web

N/A
N/A
Protected

Academic year: 2018

シェア "LM masumura 最近の更新履歴 Ryo Masumura: Web"

Copied!
18
0
0

読み込み中.... (全文を見る)

全文

(1)

国際会議 INTERSPEECH2015 報告

言語モデルヷ音声言語理解

NTT Media Intelligence Laboratories

増村 亮

(2)

1

注目 べ 文献

音声言語理解

音声認識結果 ラテ スを直接扱う [Svec+, IS2015]

音声言語処理 しい拡張

 マルチタスクラヸニング ( そ 中 工夫 )

単語系列 予測 ラベル 予測 [Tam+, IS2015]

意図決定 スロットフ ルタリング [Liu+, IS2015]

言語モデル

単語系列 サブワヸド系列を同時 利用 [Arisoy+, IS2015]

時間 関係上、深層学習関連 絞 4 文献を紹

(3)

簡単 3 基本モデルを い

※ 後段 文献紹 必要

そ 前

(4)

3

基本モデル

単語系列 生成モデルㄥ言語モデルㄦ

� � � �

Output Layer

(softmax layer)

Word embedding

Recurrent Layer

� � � </s>

RNN or LSTM

� � , … , � をモデル化

<s>

(5)

基本モデル

系列ラべリングモデル

スロットフ ルタリング

� � � �

Output Layer

(softmax layer)

Word embedding

Recurrent Layer

RNN or LSTM

� � , … , � |� , … , � をモデル化

(6)

5

基本モデル

意図推定

� � � �

( 可変長単語系列 ) 分類モデル

� =

RNN or LSTM CNN

� � � �

Pooling

Convolution

(window size:2)

� =

Word

embedding

Word

embedding

Recurrent

Layer

Output Layer

Output

Layer

� �|� , … , � をモデル化

(7)

文献紹

音声言語理解

音声認識結果 ラテ スを直接扱う [Svec+ IS2015]

音声言語処理 しい拡張

 マルチタスクラヸニング ( そ 中 工夫 )

単語系列 予測 ラベル 予測 [Tam+ IS2015]

意図決定 スロットフ ルタリング [Liu+ IS2015]

言語モデル

単語系列 サブワヸド系列を同時 利用 [Arisoy+ IS2015]

(8)

7

[Arisoy+, IS2015] 概要

� �

� � </s>

<s>

<s> � � � � � � � �

単語

系列

系列

+ キョウ + ハ 晴 + ハレ + デス を メヸジ

サブワヸドや品詞情報を使う研究

あ 、非同期 扱う点 新しい

※基本モデル 拡張

○モチベヸション: 言語モデル 性能を高 い

(9)

[Arisoy+, IS2015] 概要

(3-gram LM)

キヸワヸド検索

性能

性能的 ンパクト あ い 、

初期的検討 後 発展 期待

○実験:音声認識性能 評価

(10)

9

文献紹

音声言語理解

音声認識結果 ラテ スを直接扱う [Svec+ IS2015]

音声言語処理 しい拡張

 マルチタスクラヸニング ( そ 中 工夫 )

単語系列 予測 ラベル 予測 [Tam+ IS2015]

意図決定 スロットフ ルタリング [Liu+ IS2015]

言語モデル

単語系列 サブワヸド系列を同時 利用 [Arisoy+ IS2015]

(11)

Output Layer

(softmax layer)

Word embedding

Recurrent Layer

� � </s>

[Tam+, IS2015] 概要

単語系列ラベル系列 同時分布

� � , … , � , � , … , � をモデル化 新しい

※ 基本モデル 融合

○モチベヸション:

単語 ラベル 付い 学習デヸタを増やし い

(12)

11

[Tam+, IS2015] 概要

CRF ベヸス 分類器 RNN ベヸス 分類器

性質を組 込 可能

ヷ既 CRF ベヸス 分類器をシステム的 変え 済

○利用方法:ランダムサンプリング 疑似的

ラベル付 テキストデヸタを水増し

○実験:スロットフ ルタリング 評価

CRF with 元デヸタ

CRF with

元デヸタ + 生成デヸタ

RNN with 元デヸタ

(13)

文献紹

音声言語理解

音声認識結果 ラテ スを直接扱う [Svec+ IS2015]

音声言語処理 しい拡張

 マルチタスクラヸニング ( そ 中 工夫 )

単語系列 予測 ラベル 予測 [Tam+ IS2015]

意図決定 スロットフ ルタリング [Liu+ IS2015]

言語モデル

単語系列 サブワヸド系列を同時 利用 [Arisoy+ IS2015]

(14)

13

pooling

系列 個々 ラベル 文ラベルを同時 予測

� �, � , … , � � , … , � をモデル化

※基本モデル 融合

[Liu+, IS2015] 概要

Recurrent

convolution layer

(window size:3)

○モチベヸション:意図決定 スロットフ ルタリング

を同時 学習 相乗効果を出し

(15)

[Liu+, IS2015] 概要

SVM ベヸス 意図推定や

CRF ベヸス スロットフ ルタリング 比較し 有効

※ マルチタスク学習自体 有効性 従来研究 記述

○実験:

意図推定 スロットフ ルタリング 評価

SVM Intent Accuracy 94.34

Multi-task

Recurrent Convolution NN Intent Accuracy 94.49

CRF Slot F1 88.38

Multi-task

Recurrent Convolution NN F1 89.29

(16)

15

文献紹

音声言語理解

音声認識結果 ラテ スを直接扱う [Svec+ IS2015]

音声言語処理 しい拡張

 マルチタスクラヸニング ( そ 中 工夫 )

単語系列 予測 ラベル 予測 [Tam+ IS2015]

意図決定 スロットフ ルタリング [Liu+ IS2015]

言語モデル

単語系列 サブワヸド系列を同時 利用 [Arisoy+ IS2015]

(17)

[Svec+, IS2015] 概要

� /0.4 � /1.0

� /0.6

� /1.0

� � � � Prob

1 0 0 0 0.6

0 1 0 0 0.6

0 0 1 0 0.4

0 0 0 1 1.0

1 1 0 0 0.6

0 1 0 1 0.6

0 0 1 1 0.4

○モチベヸション:認識結果 複数仮説ㄥラテ スㄦ

を利用 文分類 性能を上

� � � � � � � �

pooling

ラテ ス 様々 窓 を実施し

ベクトル (Bag-Of-Words 表現 ) を作

そ を CNN ベヸス 扱う

ラテ ス

(18)

17

[Svec+, IS2015] 概要

正解文

1-best

ラテ ス

ラテ スを直接利用し モデル化 、

従来 1-best を使う場合 性能改善

○実験:文分類タスク 評価

1-best 単語正解精度 63%

参照

関連したドキュメント

地図 9 “ソラマメ”の語形 語形と分類 徽州で“ソラマメ”を表す語形は二つある。それぞれ「碧豆」[pɵ thiu], 「蚕豆」[tsh thiu]である。

「父なき世界」あるいは「父なき社会」という概念を最初に提唱したのはウィーン出身 の精神分析学者ポール・フェダーン( Paul Federn,

語基の種類、標準語語幹 a語幹 o語幹 u語幹 si語幹 独立語基(基本形,推量形1) ex ・1 ▼▲ ・1 ▽△

しかし,物質報酬群と言語報酬群に分けてみると,言語報酬群については,言語報酬を与

Guasti, Maria Teresa, and Luigi Rizzi (1996) &#34;Null aux and the acquisition of residual V2,&#34; In Proceedings of the 20th annual Boston University Conference on Language

関西学院大学手話言語研究センターの研究員をしております松岡と申します。よろ

②上記以外の言語からの翻訳 ⇒ 各言語 200 語当たり 3,500 円上限 (1 字当たり 17.5

今回の調査に限って言うと、日本手話、手話言語学基礎・専門、手話言語条例、手話 通訳士 養成プ ログ ラム 、合理 的配慮 とし ての 手話通 訳、こ れら