The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014
- 1 -
確率的
用い 多人数
ッ 対話
Probabilistic
Multiparty
Dialogue
Management for a Game Master Robot
○高橋
裕己
*1Casey Kennington
*2船越
孝太郎
*3中
幹生
*1*3菅
樹
*1Yuki TAKAHASHI Kotaro FUNAKOSHI Mikio NAKANO Shigeki SUGANO
*1
早稲
大学
*2
Bielefeld University
*3㈱ ン
ン
ン
Waseda University Honda Research Institute Japan Co., Ltd.
We present our ongoing research on multiparty dialogue management for a game master robot that engages multiple human participants to play a quiz game. The robot invites passing people to join the game, instructs participants on the rules of the game, and leads them in the game. The robot has to manage people leaving and coming at arbitrary times. Our approach maintains a dialogue manager for each participant, and a module takes a final action with each decision cycle; responsible to decide “what/whom/when to say” in interaction. We have implemented the dialogue manager with a probabilistic rules approach [Lison 2012] and made preliminary evaluations with our multiparty human-robot game dialogue data that was collected in a Wizard-of-Oz fashion.
1.
じめに
多人数 行わ 対話 ,日常生活 ほ 特
い.例えば,3人以 雑談,学校 授業,会議
,会話 相手 2人以 あ 多い.日常生活
人間 ン ッ 作
考え 時 ,多人数 対話 能力 必要 .
多人数 対話 組 考え 必要 あ ,対話
管理 あ .対話管理 盛 研究 い , 多
研究 対 対話 管理 焦 当 .石崎
対 対話 比較 ,多人数対話 特徴 探 い [Ishizaki
1998].最近 研究 ン キン 側面 含 仮想
対 話 ン 使 多人 数 対話 存 在
[Bohus 2011] [Traum 2012].Keizer 複数人相手 ッ
ン 多人数対話管理 提案 い
[Keizer 2013]. ,中 ,韻 顔向 情報 話者
推定 行い,多人数対話 行う ン 開発 い [中
2014].多人数 対話管理 , 誰 対 何 話
考え い .特 1対1 対話管理 異 ,
話 け 事 出来 相手 複数い ,会話 け手
識 Focus of Attention 以 FOA 必要 あ
[Akker 2009].
本稿 , 対話 いう ン ,人間 参加者
何人い 対応 多人数対話管理 提案 .
,近 い 人間 話 け,彼
誘う いう あ . ,参加者 中
混乱 い う あ ば ン 提供 ,
滑 進 . 実装 ,
参加者毎 個 対話管理 , 出力結果
時間軸 一列 整列 , 行
動 け手 (FOA) 予測 含 .
以降 , 節 提案 明 . , 節
々 集 対話行 ン い
明 .最 節 ,予備的 評価実験 結果 示 .
2.
対話管理モ ル
2.1 多人数対話管理手法
Traum [2004] ,多人数対話管理 い 問題 検討
うえ , 言及 い . 目 ,多人数
対話 対 対話 束 扱う方法 ,2 目
参加者 単一 統合 扱う方法 あ . 者 方
理論的 表現能力的 優 方法 あ , 々
単純 前者 方法 .本研究 対象
ン ,全 参加者 状態 統合 ッ
行動 決定 け ば い状況 多 い 考え .
以 ,1 目 ,参加者 何人 増え
状態空間 指数関数的 増大 対応
いう大 利 あ .
2.2 確率的ルール
々 ,確率的 変換 ン ッ
ワ [Lison 2012] 使用 .確率的 ,Lison 提
案 対話管理 手法 ,確率 手書
組 合わ あ .確率 ,音声 け
や発話 容 確実性 強 ,
最適化 利 あ . 一方 ,
最適化 多 必要
持 い .対話管理 一般 ン依存性 高い ,対
話 ン毎 集 必要 出 問題 あ .確
率的 ,対話管理 予 書
, 最適化 少 い 行う事 .
確率的 用い , 参加者 い 独立
個 対話管理 (IDM) 保持 .確率的 具体
的 実装 い ,4.2節 明 .
々 概略 図1 示 .
,様々 情報 入力 け ,発話 視線 頭 向
出力 .対話管理 参加者毎 個 対話状態 保持
,様々 情報 入力 け . け 情報 ,誰 誰
向 話 い Speaking 視線 Looking 発言 容
Speech/NLU 対話行 DA 参加状態(Participating) あ . 連 絡 先 高 橋 裕 己 , 早 稲 大 学 ,
[email protected] aaasadasda
The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014
- 2 -
図1 概要図
IDM 実装 [Lison 2012]実装 あ OpenDial1 用い .
々 う 要 特徴 ,参加者
毎 IDM 決定 基 い 最終的 行う
行動 ン 決定 ン 存在
あ . ン 優先度付 キ 実装
,IDM 優先度 設定 対話行 け .例
えば, 明 場合, 々 対話行
キ 入 ,順番 発話 . , 明
中 あ 時 発話 繰 返 要求 ,優先度
高い 発言 繰 返 対話行 キ 追加 ,
残 部分 完了 前 直近 発話 繰 返 実行
.
ン 発話行 実行 際 FOA
呼 出 .FOA ,単純 特徴 ッ
使用 , ッ 行 け手 話者
推定 .本稿 話者 推定 最大 ン 法
用い .IDM 応 場合 , IDM 対象 参加
者 話者 決定 方法 あ .本稿 , 応
IDM FOA 対象 方法 単純 定 呼
ぶ. , 方法 FOA 誤 う場合 あ .例え
ば参加者A う一人 参加者B 相談 い ,A 方
ッ 質問 場合 考え ,IDM A 対応
応 ,FOA A,B 両方 対象
い.
研究 進 , 々 い 前提 い い .
参加者 完全 検出 , IDM
必要 情報 入力信号 確 分離
. ,現在 情報 完全 手
入 前提 い ,将来的 ,部分
的 情報 け 動 改良 予定 あ .
3.
多人数対話コーパス
3.1 ータ収録
回用い ,先 石川 集 あ [石川
2013]. 回 ン い,実験
利用 .以 い 明 .
1https://code.google.com/p/opendial/
集 際 互い 知人関係 あ 3 1組 ,30
組90 参加者 集 , 対話 録
.Wizard of OZ法 , ッ NAO 参加者 20
呼ば 1組25分間行 .参加
者 , 監督者 無線 指示 え , 記
行動 行う.
入 , 参加
入 , 参加 ,傍観
離脱 , 出
素通
ッ オ , 記 行動指針 基 い 操作
行う.
新 参加者 入場 , 参加者
顔 向け, 誘う発話 行う
参加者 誘い 承諾 , 参加者
参加者
参加者 初 参加 場合
自己紹 発話 行う
参加者 誘い 拒否 , 応 け ば
参加者 傍観者
オ 則 , 参加 い 参加
者 向け 定型文発話
傍観者 い 場合,一定時間経過
傍観者 誘う
参加者 去 う , 参
加者 ほう 顔 向け,呼 発話 行う
参加者 数 ,監督者 指示 ,1 3 間
増減 . ,英語学習目的 あ , ッ
基本的 英語 話 ,参加者 方 日本語 使用 許
い .参加者 , ッ 発話 聞 場合,直
前 発話 聞 返 . , い 参
加者 士 自 発話 , ッ 発話
容や意図 い 互い 相談 .
3.2 コーパス構築と対話行為 アノ ーション
録 う 10 ッ ン 対 ,ELAN[Auer 2010]
The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014
- 3 -
DA 種類 DA 出現数 DA け 状況
ッ
Accept-Request 2 17
相手 聞 返
要求 ,要求
応 場合.
Accept-Suggestion 92 3
参 加
,相手 提案
承諾 場合
Agreement 187 58 相手 意見 意
場合
Answer 63 683 相手 質問 答え
場合
Apology 6 1 謝罪 場合
Call 5 184
誘 い
呼 け
場合
Confirm 465 3 確 場合.
Congratulation 5 33 賞賛 場合
Decline-Suggestion 15 0 提 案 拒 否 場
合
Express-Emotion 161 22 感 情 表 現 場
合
Good-bye 15 10 挨拶
Greeting 34 125 挨拶 場合
Inform 464 116 新 い情報 話
場合
Introduce 40 35 自己紹
Monologue 514 41 独 言
Opening 4 51 開 始 掛 け
声
Propositional-Question 1009 6
Yes-No 答え
質問 場合
Question 179 51 Propositional 以 外
質問
Request 127 44 聞 返 要求
場合
Return-Greeting 67 7 挨拶 返 場合
Suggestion 43 355 提案 場合
Time-Management 304 0 言い淀
場合
Thanking 25 0 感謝 述 場合
Turn-Taking 37 4 発言 求 発話
Unhearable 202 0 音声
聞 い
表1 DA 一覧 実験中 数
Nao Please ask me an Yes-No question. (Suggestion)
言 ? (Request)
Nao Please ask me an Yes-No question. (Suggestion)
食 物? (Propositional-Question)
Nao Yes (Answer)
図2 DA付 対話例
参加状態, 対話行 関 注釈層 設定 ,
付 .DA 一覧 表1 示 .
Speaking 注釈層 ,参加者 発話対象 表 .参加者 発
話1 ,1 付 .参加者A 参加者B 話
場合 toB ,B C 2人 話 時 ,toBC .
場合 Monologue,笑い 場合 Laughter 付
.
Looking 参加者 注視 い 対象 示 .参加者
ッ 見 い 場合 toNAO,参加者や ッ 以外 見 い
場合 toOthers,視線 確 い場合 ,Invalid 付
.
Participating ,参加者 参加 い う
あ . ッ 会話 参加 い 場 合
Participating, 参加 見 い け 時 Observing,
通 過 け Passing, 離脱
う い 場合 Leaving 付 い .
対話行 い , ン キ 1
あ DIT++[Bunt 2009] 参 考 ,Suggestion(提 案)や ,
Request(要求) 25種類 DA 付 .DA ,
発話 意図 考え,付加 い .例えば,実際 対話
DA 付 例 あ 図2 対話 ,参加者 言
? いう発話 Question 質問 ,繰 返 Request
要求 解釈 ,DA 付 い .
, 進 行 状 態 い ,Phase 注 釈 層
X_situasion注釈層 2 ン .
Phase注釈層 全体 進行 関 , 記 2
状態 あ .人 出入 , 状態 移行
進行 .
Engagement
Game
Engagement ,自己紹 , 明 行 い 状態 ,
原則 参加者全員 自己紹 終わ , 理
解 い 場合 Game 移行 . , 断
WOZ 任 い 絶対 い.
Game い 時 状態 , 人 出入
あ WOZ 断 Engagement 移行 .
X_situation 注釈層 ,各参加者 状態 い 注釈 ,
記 3種類 存在 .
NameGiven=Y 参加者 自分 ッ (Y) 乗
直 状態
IntroCompleted 自己紹 終わ , 明 入
前 状態
RuleInstructed 明 終え 状態
各参加者 状態 段階 沿 付 .
4.
予備的評価実験
4.1 FOA
ン 付 10 ッ う ,01-09番 9
ッ ン 用い FOA 最大 ン 分類器 訓練 ,10
番 ッ ン 用い FOA 定精度 行 .
解 ,1人 3人 参加者 ッ 用意
い .例えば 解 ,2人 参加者 集合{A,B}
あ ,FOA 出力 {A} あ 場合,
答率 50% . 結果,提案手法 け
FOA 解率 71% あ . 10番 ッ ン
含 ,事例単位 leave-one-out 交差検定 行 結果
78% あ 01-09番 訓練
用い い い .
ン 解率 33%,2.2節 明
The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014
- 4 - <case>
<condition>
<if var="Participating" value="Participating" /> <if var="answer" value="correct" />
<if var="DA" value="Propositional-Question" /> <if var="Speaking" value="toNAO" />
</condition>
<effect util="11.8555">
<set var="dialogue-act" value="Answer" />
<set var="ds-speech" value="you right! congratulations!" /> <set var="correctAnswer" value="true" />
</effect> </case> <case>
図3 学習
使わ 変数 種類
変数 明
Answer 答え あ い う
IntroCompleted 自己紹 終わ い
RuleInstructed 明 終わ い
dialogue-act ッ 行うDA
ds-speech ッ 発話 容
表2 使わ 変数 例
4.2 DM
訓練 OpenDial 用い 抽出 ,
用い 確率 学習 行 .抽出
一部 図3 示 . 用い 変数 ,
注釈 状態 Speaking ,IntroCompleted
進行 関連 変数 存在 .変数 全部 13
個あ , 一部 表3 示 FOA 評価 様 10番
ッ ン 用い ,OpenDial 対話行 選択 評価 行
. 評価 全 参加者 個 対話管理
使用 .合計 19個 対話行 あ 中 ,52%
解率 得 . ン 37%,
ン 51% あ .
5.
まとめ
本稿 ,確率的 用い 多人数 対話 行う ッ
対話管理 提案 行 . ,予備的実験
,FOA 推定 ,DM DA 推定 行 .結果
,人間 多人数対話 ン ン 実現 ,
提案 対話管理 有効 あ 示唆 .FOA
推定 ,最大 ン 法 用い ン
解率 超え, 増や 解
率 可能性 示唆 .DA 推定 ,
ン 解率 差 わ あ ,
改善 見 . 増や 改善 可能
性 あ . ,DA 解 い場合 ,実際 会話
問題 い場合 あ . 方 , 実際 会話
い, ン 評価 行う予定 あ .
, 詳 い評価 ,人間
ン ン 行う必要 あ . , 状態
部分 ッ 実際 動作 行わ 部分 実装 必
要 . , 動作 ,入力 ン
基 意思 決定 け ,簡単 明 処理,
合 発話 生 必要 あ . 々 , 多
使い,IDM 対話行 予測 改善 ,発話 ン
含 複雑 状況 対処 ン
改善 い .
謝辞
本研究成果 一部 ,科学研究費補助金基盤研究(S)25220005
助成を受けたも あ ,また,早稲田大学理工研プロジェクト
研究 自然 共生す 知能情報機械系に関す 基盤研究 一環
し 行わ たも あ .ここに謝意を表す.
参考文献
[Bohus 2011] D. Bohus and E. Horvitz. Multiparty Turn Taking in Situated Dialog : Study , Lessons , and Directions. In Proceedings of SIGDIAL 2011, , pages 98–109. , 2011. [Ishizaki 1998] M. Ishizaki and T. Kato. Exploring the
characteristics of multi-party dialogues. In Proceedings of the 17th international conference on Computational linguistics Volume 1, pages 583–589. , 1998.
[Keizer 2013] S. Keizer, M. E. Foster, O. Lemon, A. Gaschler, and M. Giuliani. Training and evaluation of an MDP model for social multi-user human-robot interaction. In Proceedings of SIGDIAL 2013, pages 223–232, Metz, France, Aug. 2013. [Akker 2009] R. op den Akker and D. R. Traum. A comparison
of addressee detection methods for multiparty conversations. In Proceedings of the 13th Semdial Workshop on the Semantics and Pragmatics of Dialogue, pages 99–106, Stockholm, Sweden, 2009.
[Traum 2004] D. Traum. Issues in multiparty dialogues. In Advances in agent communication, pages 201–211. Springer, 2004.
[Traum 2012] D. Traum, D. DeVault, J. Lee, Z. Wang, and S. Marsella. Incremental dialogue understanding and feedback for multiparty, multimodal conversation. In Intelligent Virtual Agents, pages 275–288. Springer, 2012.
[Lison 2012] P. Lison. Probabilistic Dialogue Models with Prior Domain Knowledge. In Proceedings of SIGDIAL 2013, pages 179–188, Seoul, South Korea, July 2012.
[Auer 2010] E. Auer,A. Russel., H. Sloetjes, P. Wittenburg, O. Schreer, S. Masnieri, D. Schneider, and S. Tschpel :ELAN as Flexible Annotation Framework for Sound and Image Processing Detectors, in LREC’10, Valletta, Malta (2010), European Language Resources Association(ELRA).
[中 2014] 中 有紀子,馬場直哉,黄宏軒,林佑樹 非言語
情報 基 話者推定機構 用い 多人数会話
,人工知能学会論文 ,Vol.29, No.1, pp.69-79,2014.
[石川 2013] 石川真也,船越孝太郎,篠 浩一,中 幹生 多
人数対話 ッ 実現 向け 対話
集 分析,人工知能学会全国大会,2013.