RNN エンコー 文脈
を考慮し 対話破綻検出
広島市立大学 大学院情報科学研究科
○稲葉通将, 高橋健一
2016 年10月5日
対話破綻検出 ン 2
エンコー エンコー
提案手法 アプ ー
デ LSTM (Long Short-Term Memory) -RNN
エンコー 対話 け 2 系列を処理
単語 系列 (発話)
発話 系列 (文脈)
デ エンコー 結果を用い ラベ 分布を推定
今日 いい 天気 そう
発話ベク 発話ベク
文脈ベク
エンコ
ユ 発話1 ステム発話
ム発話用 LSTMエンコー
ユ 発話� 検出対象 発話� [�� : �� ]
分布推定用RNN
対話破綻ラベル分布 �, �, �の 次元
ユー 発話用 LSTMエンコー
[�� : �� ] [���: ���]
提案手法 概要
文脈
ユ 発話1 ステム発話
ム発話用 LSTMエンコー
ユ 発話� 検出対象 発話� [�� : �� ]
分布推定用RNN
ユー 発話用 LSTMエンコー
[�� : �� ] [���: ���]
提案手法 概要
文脈
対話破綻ラベル分布 �, �, �の 次元
発話 エンコー
1. 形態素解析 発話を単語 分割
2. Word2Vec 単語を分散表現 変換
200GB Twitter ー 学習
3. 分散表現を順 LSTM-RNN 入力
ム発話用 ユー 発話用 2
LSTM-RNN 個別 処理
発話 エンコー 例
今日 寒い
kaze wo hiki
そう
連結
ユー 発話
ム発話
ユー 発話 ム発話
エンコー ベク
: ム用LSTM : ユー 用LSTM
…
ユ 発話1 ステム発話
ム発話用 LSTMエンコー
ユ 発話� 検出対象 発話� [�� : �� ]
分布推定用RNN
ユー 発話用 LSTMエンコー
[�� : �� ] [���: ���]
提案手法 概要
文脈
対話破綻ラベル分布 �, �, �の 次元
ユ 発話1 ステム発話
ム発話用 LSTMエンコー
ユ 発話� 検出対象 発話� [�� : �� ]
分布推定用RNN
ユー 発話用 LSTMエンコー
[�� : �� ] [���: ���]
提案手法 概要
文脈
対話破綻ラベル分布 �, �, �の 次元
分布推定用RNN
デ 入力層側 以下 4層 中間層を持
RNN
LSTM 層を2層
ReLU を活性化関数 ( 通常 )中間層を2層
処理 流
1.
LSTM 中間層を2層重 RNN 発話
系列をエンコー し,文脈ベク を出力
2.
文脈ベク を中間層2層 多層パーセプ
ン 入力し,3次元 ラベ 分布を出力
分布推定用 RNN 構造
[�� : �� ] [�� : �� ] [���: ���] ユ 発話と ステム発話のエンコ ベク ル系列 LSTMの
中間層
ReLUを活性化関数 とする 通常の 中間層
対話破綻ラベル分布
文脈ベク ル を入力
提案手法 使用し 学習 ー
デ 昨年 DBDC 配布 ー 全
1246 対話
デ DCM, IRS, DIT 開発 ー
各30対話 ,計90対話
残 60 対話 選択 使用
デ 独自 収集し 対話 ー
Neural Utterance Ranking [Inaba+ 16]
基 く雑談対話 ム ー
アノ ー 34 名
100 対話
選択
デ 1epoch 選択用 ー 評価
デ 学習 4回実施
1 回300epoch
[ 評価 ]
Run1
デ MSE 最小
Run2
デ X 検出 F値 最大
Run3
デ 4回 学習 MSE 最小 出力 平均
分布一致系統結果 (DCM)
JSD JSD (O,T+X)
JSD
(O+T,X) MSE
MSE (O,T+X)
MSE (O+T,X)
Baseline 0.407 0.224 0.244 0.221 0.194 0.215
Run1
(MSE最小) 0.101 0.073 0.062 0.056 0.075 0.067
Run2
(F値最小) 0.118 0.078 0.073 0.068 0.084 0.078 Run3
(4モデル平均) 0.100 0.072 0.061 0.055 0.074 0.067
分布一致系統結果 (DIT)
JSD JSD (O,T+X)
JSD
(O+T,X) MSE
MSE (O,T+X)
MSE (O+T,X)
Baseline 0.366 0.166 0.313 0.183 0.125 0.281
Run1
(MSE最小) 0.055 0.036 0.037 0.031 0.035 0.044
Run2
(F値最小) 0.078 0.045 0.056 0.045 0.045 0.065 Run3
(4モデル平均) 0.052 0.033 0.035 0.029 0.032 0.041
分布一致系統結果 (IRS)
JSD JSD (O,T+X)
JSD
(O+T,X) MSE
MSE (O,T+X)
MSE (O+T,X)
Baseline 0.433 0.243 0.323 0.239 0.218 0.301
Run1
(MSE最小) 0.118 0.080 0.082 0.065 0.079 0.091
Run2
(F値最小) 0.156 0.100 0.114 0.091 0.102 0.128 Run3
(4モデル平均) 0.118 0.081 0.082 0.066 0.080 0.091
ラベ 一致系統結果 (総合)
一致率 精度(X) 再現率 (X) (X) F値 (T+X) 精度 (T+X) 再現率 (T+X) F値 Baseline 0.490 0.533 0.603 0.560 0.789 0.846 0.817
Run1
(MSE最小) 0.550 0.597 0.620 0.608 0.860 0.551 0.672
Run2
(F値最小) 0.512 0.574 0.590 0.582 0.824 0.766 0.794 Run3
(4モデル平均) 0.544 0.590 0.597 0.594 0.854 0.624 0.621
わ
デ ま め
LSTM エンコー を用い 破綻権出手法を提案
デ LSTM-RNN 発話 文脈をエンコー
独自 対話 ー を学習 使用
実験 結果,4 平均手法 高い性能
デ 今後 課題
エラー分析