• 検索結果がありません。

サーベイ資料pdf 最近の更新履歴 Ryo Masumura: Web

N/A
N/A
Protected

Academic year: 2018

シェア "サーベイ資料pdf 最近の更新履歴 Ryo Masumura: Web"

Copied!
33
0
0

読み込み中.... (全文を見る)

全文

(1)

Deep Learning ×自然言語処理

増村 亮

サーベイ資料

(2)

Copyright©2015 NTT corp. All Rights Reserved.

1

ザックリし いけ 、

そ 話 面 そう!

思 うこ

本発表 目的

(3)

本日 話題

Deep Learning ×自然言語処理全般

Embedding 最近

Deep Learning ×機械翻訳

Neural Machine Translation 最近

基盤技術編

応用技術編

(4)

Copyright©2015 NTT corp. All Rights Reserved.

3

Deep Learning ×自然言語処理全般

Embedding 最近

基盤技術編

(5)

Deep Learning ×自然言語処理全般

• Distributed Sentence Representation, Sentence Embedding

可変長 系列 固定長ベクトル 表現

複数文 ドキュメントへ

系列 系列へ ( 今日 後半 )

• Distributed Representation of Word, Word Embedding

いわゆ Word2Vec

単語 意味 固定長ベクトル 表現

ここ数 く聞くフレーズ 言え 、

Distributed Representation ( 散表現 )

Embedding ( 情報 )

 2 前く 話題 中心

~最近 話題 中心

本日 こ 範囲

最新 話題

(6)

Copyright©2015 NTT corp. All Rights Reserved.

5

Word Embedding 研究

• NN Embedding [Bengio+, Journal of MLR 2003]

• RNN Embedding [Mikolov+, NAACL 2013]

• CBOW, Skip-gram [Mikolov+, NIPS 2013 ]

• GloVe [Pennington+, EMNLP 2014]

教師 し学習

NN: Neural Network

RNN: Recurrent NN (not Recursive in this presentation)

ベクトル 向

意味

載 い

(7)

Word Sentence 狙い

 Word Embedding 狙い

[ , , , , , ,…, ]

[ , , , , , ,…, ]

課題視し い :スパース性

=> 1-hot ベクトル 固定長 連続値ベクトル

 Sentence Embedding 狙い

� � � �

� � � �

課題視し い :スパース性、可変長性、系列性

=> 可変長 系列 情報 固定長 連続値ベクトル

Embedding

Embedding

(8)

Copyright©2015 NTT corp. All Rights Reserved.

7

Sentence Embedding 研究

• Recursive Auto Encoder [Socher+, NIPS 2011]

• Average of Word Vector [Socher+, EMNLP 2013]

• Paragraph Vector [Le and Mikolov, ICML 2014]

• Semi Supervised LSTM [Dai+, Arxiv 201511]

• Recursive NN [Socher+, EMNLP 2013]

• LSTM-RNN [Tai+, ACL 2015]

• CNN [Kalchbrenner+, ACL 2014 ][Kim, EMNLP 2014]

• Tree LSTM [Tai+, ACL 2015][Zhu+, ICML 2015]

教師あ 学習 (Sentence Classification 過程 学習 )

教師 し学習

CNN: Convolutional NN

LSTM: Long Short Term Memory

(9)

Sentence Embedding 教師あ 学習

CNN

RNN or LSTM

Recursive NN

� � � �

� � � �

softmax

softmax

pooling

convolution

(window size:2)

Word

embedding

Word

embedding

softmax

� � � �

Word

embedding

文 類ㄥ例え Sentiment 類ㄦ う 学習

(10)

Copyright©2015 NTT corp. All Rights Reserved.

9

Method Data Dim Tuning

[Zhang+, EMNLP 2015] Word2Vec Other 128 Fine-tuned

[Mou+, EMNLP 2015] Word2Vec In-Domain 300 Fixed

[Lei+, EMNLP 2015] GloVe Other 512 Fixed

[Kim, EMNLP 2014] CBOW Other 300 Fine-tuned

[Liu+, EMNLP 2015] Word2Vec Other 100 Fine-tuned

[Tang+, EMNLP 2015] Skip-Gram In-Domain 200 Fixed

[Zeng+, EMNLP 2015] Skip-Gram In-Domain 50 Fixed

Word Embedding for Sentence Embedding

Sentence Embedding 学習す Word Embedding 必須

=> Word Embedding 自体 事前学習し くこ 多い

Sentence Embedding 学習データ データ

Word Embedding 事前学習し 場合 Fine-Tuning 必須

Word Embedding 事前学習 方例

(11)

Sentence Document

• Restaurant Review: 1 ドキュメントあ 9 文、 150 単語

• Movie Review: 1 ドキュメントあ 14 文、 325 単語

• Stanford Sentimental Treebank 1 文、 19 単語

• TREC question Dataset: 1 文、 10 単語

 Sentence Embedding 扱う範囲

 Document Embedding 扱う範囲

 1 文、単語数少

複数文、単語数多い

(12)

Copyright©2015 NTT corp. All Rights Reserved.

11

Document Embedding 研究

• Hierarchical Neural Auto Encoder [Li+, ACL 2015]

教師あ 学習 (Document Classification 過程 学習 )

教師 し学習 ( 言語モデル )

• Hierarchical RNNLM [Li +, EMNLP 2015]

• Word RNN-Sentence RNN [Tang+, EMNLP 2015]

• Document Context LM [Ji+, Arxiv 201511]

• Large Context LM [Wang and Cho, Arxiv 201511]

• Skip-Thought Vectors [Kiros+, Arxiv 201506]

今日 後半 話 大 く関わ 研究 多い 詳細 省く

(13)

Document Embedding 教師あ 学習

� � � � � � � � � � � �

softmax

Word

embedding

Sentence

embedding

Pooling

Document

embedding

Word RNN-Sentence RNN

文内 単語間

系列性 捉え

文間

系列性 捉え

(14)

Copyright©2015 NTT corp. All Rights Reserved.

13

単語 文、そし ドキュメントへ

今日 話さ 最小単位 扱う

研究 面 い

Embedding 魅力

Embedding 潮流

固定長ベクトル

• Feature Engineering 特徴

基盤技術編

(15)

Deep Learning ×機械翻訳

Neural Machine Translation 最近

応用技術編

(16)

Copyright©2015 NTT corp. All Rights Reserved.

15

Deep Learning ×機械翻訳

フレーズベース翻訳 拡張

 Neural Network Joint Model [Devlin+, ACL 2014]

Microsoft 翻訳 搭載

 Continuous Space Translation Model [Le+, NAACL 2012]

 Recurrent Continuous Translation Model

[Kalchbrenner+, EMNLP 2013]

※原理的 NMT 先駆け

 フルニューラルネットワーク 翻訳

Neural Machine Translation

[Cho+, EMNLP 2014][Sutskever+, NIPS 2014]

(17)

A B C D <EOS>

X Y Z

X Y

<EOS>

Z

Encoder

(Input を固定長ベクトル化 )

Decoder

(beam search)

( ) Input: A B C D

Output: X Y Z

Neural Machine Translation (NMT)

 ニューラルネットワーク

Encoder-Decoder アプローチ 機械翻訳

Encoder Decoder RNN

(18)

Copyright©2015 NTT corp. All Rights Reserved.

17

NMT 利点

言語 トークン区 系列 いう以外

言語依 特定 知識 必要 い

翻訳問題 直接モデル化可能

従来 生成モデルベース デコードし

MERT 仮説 リスコアリング

省メモリ 動作可能

(19)

NMT 課題

長い ( 入力単語数 多い ) 翻訳

=> Attention based NMT [Bahdanau+, ICLR 2015]

未知語 翻訳

=> UNK Replace [Luong+, ACL 2015]

単言語 データ 利用

=> Deep Fusion [Gulcehre+, ACL 2015]

(20)

Copyright©2015 NTT corp. All Rights Reserved.

19

A B C D <EOS>

X

X

0

1

A B C D

Attention-based NMT

A B C D <EOS>

X Y

X

次 単語 生成時 Input 側 単語

注目す 判断

Input 出力

足し合わせ 単語 生成

次 単語

生成

B 要そう

次 単語 生成

有用 情報

(21)

X

0

1

A B C D

Attention 実例

European 生成す

europeenne

注目さ 、

自動 対応 取 い

Attention-baed NMT=

自動アライメント し

翻訳し い こ 相当

(22)

Copyright©2015 NTT corp. All Rights Reserved.

21

Attention 効果

Attenton

長い文章 対し う く翻訳 う

Attention

Attention

(23)

UNK Replace

珍しい単語

A BBBB C D <EOS>

X <UNK>

X

0

1

A BBBB C D

未知語記号

通常、入力 珍しい単語 ( 未知語 ) 対し <UNK> 記号 生成

NMT 現状語彙サイズ 入力出力 5 万語程度

UNK Replace=

Attention <UNK> 対応す 入力単語 け、

入力単語 単純 辞書ベース 置 換え こ

翻訳文 <UNK> 入力文 BBBB 対応す

BBBB <UNK>

(24)

Copyright©2015 NTT corp. All Rights Reserved.

23

UNK Replace 効果

文 頻出度 ランク ( 右 いくほ ほ 出現し い単語 含 文 )

UNK Replace

UNK Replace

UNK Replace

手軽 NMT 未知語問題 解決可能

(25)

Deep Fusion

A B C D <EOS> X

X Y

単言語データ

RNN

隠 層

単言語 RNN

NMT 統合

す 層

パラレルデータ ( 限 あ ) 学習す NMT

単言語データ ( 大 集 ) 直接活 すこ い

Deep Fusion=

NMT 単言語データ 構築し RNN ネットワーク内 統合

(26)

Copyright©2015 NTT corp. All Rights Reserved.

25

Deep Fusion 効果

Deep Fusion

単言語 リッチ 情報 活 し 性能改善可能

Shallow Fusion 対数確率レベル 線形補間

※ パラレルデータ 数 万単語、単言語データ 数十億単語 データ

(27)

 Retraining based Adaptation [Luong+, IWSLT 2015]

NMT 工夫

 Source Reversing [Sutskever+, NIPS 2014]

 Ensemble Modeling [Sutskever+, NIPS 2014]

※ 提案さ いうほ い 工夫 位置 け

(28)

Copyright©2015 NTT corp. All Rights Reserved.

27

Source Revering

通常 NMT 入力文 翻訳文 順向 入力

Source Reversing =

入力文 逆向 入 こ 、

文頭 関係 捉え すくす こ

A B C D <EOS>

X Y Z

X Y

<EOS>

Z D C B A <EOS>

X Y Z

X Y

<EOS>

Z

順向 入力 逆向 入力

例え 文頭 A X

対応し い 場合 、

A 情報 すい

Source Reversing 効果

BLEU

(29)

Ensemble Modeling

通常 1 回 学習 推定し 単一 NMT モデル 用い

Ensemble Modeling =

初期値 隠 層 大 さ変え 複数 モデル 準備し、

複数 結果 統合 出力

A B C D <EOS> X Y

<EOS>

Z

X Y Z

モデル 1

モデル 2

Ensemble Modeling 効果

1 モデル

5

(30)

Copyright©2015 NTT corp. All Rights Reserved.

29

Retraining based Adaptation

通常 NMT 、ランダム初期化 対象タスク データ 学習

Retraining based Adaptation =

Out-Of-Domain 学習データ NMT

初期モデル し 、対象 Domain 学習データ トレーニング

A B C D <EOS>

X Y Z

X Y

<EOS>

Z

ランダム初期化

Out-Of-Domain 学習

少 対象 Domain 学習

Retraining based Adaptation 効果

工程 入

入 い

(31)

モントリ ール大 [Jean+, WMT 2015]

• En->Cs, En->De 、従来 SMT 以上

• Cs->En, De->En 、い

スタンフ ード大 [Luong+, IWSLT 2015]

• En->Ge 、従来 SMT 向上

• En->Vietnamese (low-resource) 、い

NMT 現状

2015 開催さ 評価型ワークショップ 成績

(32)

Copyright©2015 NTT corp. All Rights Reserved.

31

Encoder-Decoder アプローチ

音声認識 [Chorowski+ NIPS 2014][Chan+, Arxiv 201508]

マルチマイクロフ ン音声認識 [Kim+, Arxiv 201511]

画像キャプション生成 [Xu+, ICML 2015]

動画キャプション生成 [Yao+, CORR 2015]

タスク対話応答生成 [Wen+, EMNLP 2015]

ープン対話応答生成 [Vinyals and Le, ICML 2015]

テキスト要約 [Rush+, EMNLP 2015]

NMT 関わ 研究

マルチタスク Encoder-Decoder アプローチ

• Multi-Task Enocoder-Decoder [Luong+, Arxiv 201511]

(33)

大語彙化 手法 余地

• Deep Fusion 関連 手法 余地

• UNK Replace 実用上有用 技術

枠組 代わ 近い

NMT 現在

NMT 今後

技術 発展し

性能

応用技術編

参照

関連したドキュメント

9 Bross IDJ, Blumenson LE : Metastatic sites that produce generalized cancer : Identification and kinetics of generalizing sites, Fundamental Aspects of Metastasis.. 11 Teplick

[r]

デジタル版カタログ web 版 STIHL カタログ 希望小売価格一覧 最新情報は、上記

12月 米SolarWinds社のIT管理ソフトウェア(orion platform)の

交通事故死者数の推移

基本的金融サービスへのアクセスに問題が生じている状態を、英語では financial exclusion 、その解消を financial

“Intraday Trading in the Overnight Federal Funds Market” FRBNY Current Issues in Economics and Finance 11 no.11 (November). Bartolini L., Gudell S.,

最近一年間の幹の半径の生長ヰま、枝葉の生長量