自己開示発話を取り入れた雑談型対話システムの提案
Suggestion of the Non-task-oriented Dialogue System
that Adopted Self-disclosure Utterance
北川智裕
1*土屋誠司
2渡部広一
2Tomohiro Kitagawa
1, Seiji Tsuchiya
2, and Hirokazu Watabe
21
同志社大学大学院理工学研究科
1
Graduate School of Science and Engineering, Doshisha University
2同志社大学理工学部
2
Faculty of Science and Engineering, Doshisha University
Abstract: Recently, intellectual computers that become partners of people in society are required. Therefore, computers need to be able to communicate smoothly with people. Therefore, we need a system capable of dialogue with human beings in natural language. Because people use language dialogue as the main means of communication. However, until now, such a system has not been realized. Therefore, in this paper, we propose a dialogue system that can make utterance to self-disclose. People interact while not only asking questions but also disclosing their own ideas to the partner in the dialogue. For this reason, Human-like dialogue with the system can be realized by making utterance that self-discloses the system like a human being.
1 はじめに
近年,ロボットが教育や福祉等の様々な分野で人 間のパートナーとしての活躍することへの期待が高 まりつつある.そのためには,ロボットと人間との 円滑な意思疎通の実現が必要になる.人間は日常的 なコミュニケーションの手段として主に自然言語に よる対話を用いている.よって,ロボットが人間と 同様に自然言語を用いた対話を行える必要があり, 雑談型の対話システムは人間のパートナーとして活 躍するロボットの実現に向けて重要な研究分野であ ると言える.これに関連する研究として金子稜らに よって発表された,“話題を考慮した自然な会話シス テムの構築[1]”がある.(以降これを既存システムと する.)このシステムは,人間が対話をする際,いつ, どこで,何を等の情報を重視することが多い[2]こと に着目し,対話を展開する.しかし,7W1H の情報 について話者に質問する発話の割合が非常に大きい ため,話者は一方的に質問を受けることになり,不 自然な対話になることがある. そこで本研究では,人間が対話をする際に行う自 己開示の発話に注目した.人間は対話の相手から話 を聞く際に,単に質問を行うだけでなく自身の考え を相手に対して開示しながら対話をする.システム もそのような発話ができるようになれば,より自然 な対話ができると考えられる.本研究ではそれを自 己開示応答として実装した対話システムを提案する. 自己開示応答は,ある語に対して抱く感覚を発話に 取り入れることで,話者への質問とシステムからの 自己開示の両方ができるようになる.これによりシ ステムは人間とより自然な対話ができ,円滑なコミ ュニケーションの実現に貢献できると考える.2 関連技術
2.1 意味理解システム
意味理解システム[3]は,入力文の情報を 7W1H と 述語のフレームに分割して格納するシステムである. 7W1H とは英語の疑問視に用いられる 6W1H(いつ, どこで,誰が,何を,誰に,何故,どのように)に 「誰と」を表す Who+フレームを追加したものであ る.図 1 に意味理解システムの実行例として「昨日, 私は友達と水族館でイルカを観た.」という文を入力 した場合の結果を示す.) *連絡先:同志社大学大学院理工学研究科 〒610-0394 京都府京田辺市多々羅都谷1−3 E-mail:[email protected] 人工知能学会研究会資料 SIG-KBS-B509-03Who Who+ What When Where Whom How Why 述語 私 友達 イルカ 昨日 水族館 観た 図 1: 意味理解システムの実行例 提案システムにおいて,ユーザからの入力を解析 し,システムがユーザの発言内容を理解するために 用いる.
2.2 京大格フレーム
京大格フレーム[4]は,Web 上に存在するテキスト 16 億文から構築された大規模データベースである. 用言は約 4 万語が登録されており,それぞれの用言 に対して共起する名詞を格ごとに整理し,その頻度 を取得することができる.以下の表 1 に,京大格フ レームに動詞「泳ぐ」を入力した結果を示す. 表 1: 「泳ぐ」に対する京大格フレームの出力 名詞 格 頻度 魚 ガ 1483 プール デ 1195 視線 ヲ 1118 提案システムにおいて格頻度知識ベース(3.1.2 項)を作成する際に,京大格フレームのデータを用 いる.2.3 感覚判断システム
感覚判断システム[5]は,名詞を入力すると,人間 が常識的に想起する感覚を取得するシステムである. 感覚語とは,形容詞・形容動詞のうちから日常的に 用いられている語を人手で抽出した 95 語である.例 として「林檎」を入力した場合,感覚語として{赤い, 丸い,甘い}を取得できる.提案システムにおいて自 己開示応答を行う際に,名詞から感覚語を取得する ために用いる.3 提案する対話システム
本研究では,システムが人間と同様に自己開示を する発話を行うこと,また対話の展開にランダム性 を取り入れ多様性を持たせることで,人間とのより 自然な雑談型対話の実現を目指している.提案する 対話システムは,既存システムをベースにして構築 する.既存システムでは話者に対して質問をする発 話の割合が多く,システムから自己開示をする発話 の割合が少ないという問題があった.そこで,自己 開示応答(3.3 節)を新たな応答手法として対話シス テム内に組み込む.また,既存システムでは条件分 岐により応答手法を決定するため,入力が同じであ れば常に同じ応答がされ,対話の展開が単調になり やすかった.そこで,複数の応答手法が可能な場合 には,それぞれの応答に対して確率を付与し,それ に基づいて応答を選択し出力する.以下の図 2 に提 案する対話システムの全体フローを示す. 図 2: 提案する対話システムの全体フロー このシステムでは 3.2 節および 3.3 節で述べる応答 手法を用いて,ユーザの入力に応答を行う.3.1 システムの動作に用いるもの
ここでは,提案システムの動作に用いる会話履歴 フレーム,格頻度知識ベースについて述べる. 3.1.1 会話履歴フレーム 会話履歴フレームとは話者の会話履歴を,意味理 解システムを用いて 7W1H と述語に分割して格納, したものである.さらに,システムの質問に対する ユーザの回答を用いて順次追記が行われる.尚,会 話履歴フレームの 7W1H は意味理解システムのフレ ームと対応している.以下の図 3 に会話履歴フレー ムへの格納の様子を示す.図 3 中の Why,Whom, How フレームは空欄のため省略している.Who Who+ What When Where 述語
私 蕎麦 昼 食堂 食べた
Who Who+ What When Where 述語
私 友達 蕎麦 昼 食堂 食べた
図 3: 会話履歴フレームへの格納
私は昼、食堂で蕎麦を食べた
誰と食べましたか? 友達とです
3.1.2 格頻度知識ベース 格頻度知識ベースは京大格フレームを情報源とし て,国語辞書に登録されている全用言 18046 語につ いて共起する名詞と助詞を取得し,取得した名詞の シ ソ ー ラ ス[6]に お け る 親 ノ ー ド と 助 詞 に よ っ て 7W1H に機械的に分類し,その頻度をまとめたもの である.ここで分類時のルールを以下の表 2 に示す. 表 2: 7W1H への分類ルール 助詞 親ノード 分類格 で 乗り物,道具 How 建造物,施設,場所 Where 形容詞 Why と 人物,人名 Who+ を 建造物,施設,場所 Where 道具 What に 時間 When まで 時間 When から 時間 When 形容詞 Why が 人物,人名 Who 無生物 What に 人物,人名 Whom 時間 When 建造物,施設,場所 Where へ 人物,人名 Whom 建造物,施設,場所 Where 例えば用言「行く」に対し京大格フレームで一緒 に用いられている名詞と助詞を獲得すると「店に, 時間に,学校に,…」となり,下線部の語を分類し ていくと,店は親ノードに「場所」を持っており, 助詞「に」を伴っているので Where 格,時間は親ノ ードに「時間」を持っており,助詞「に」を伴って いるので when 格,学校は親ノードに「施設」を持 っており,助詞「に」を伴っているので Where 格… と分類された数をカウントする.図 4 に作成した格 頻度知識ベースの一部を示す.
用言 Who Who+ What When Where Why Whom How
行く 223 183 110 230 1812 17 108 123 食べる 428 252 3198 182 645 11 1 2 図 4: 格頻度知識ベースの一部
3.2 応答手法
本節では提案する対話システムで用いる自己開示 応答以外の応答手法について述べる. 3.2.1 挨拶応答 挨拶応答[7]は,入力文が挨拶語である場合に用い る.挨拶の種類の判断と応答は,挨拶語知識ベース を利用する. 挨拶語知識ベースとは,190 の挨拶語 が格納されている知識ベースである.挨拶語知識ベ ースには挨拶語(例:おはよう)とそれに対応する状 況(例:朝の挨拶)がセットで格納されている.また, その状況に対応する応答語(例:おはよう)が格納さ れている.挨拶語知識ベースの一部を図 5 に示す. 挨拶語 状況 応答語 おはよう 朝の挨拶 おはよう,やあ おはよ 朝の挨拶 おはよう,やあ ありがとう 感謝の応答 どういたしまして おい 呼びかけ はい さようなら 別れの挨拶 さようなら,また今度 図 5: 挨拶後知識ベースの一部 挨拶応答の応答文生成条件はユーザの入力が,知 識ベース内の挨拶語と表記一致することである. 3.2.2 未登録語応答 未登録語とはシソーラスに登録されていない名詞 と定義する.会話において新語や固有名詞などの知 らない語や分からない語が登場することは多くあり, 人間はそれに対して相手にその語について聞き返す ことがある.その手法をモデル化したものが未登録 語応答である. 話者の発言中に未登録語が含まれていた場合,ま ず未登録語知識ベースを参照する.以下の図 6 に未 登録語知識ベースの一部を示す. 未登録語 対応登録語 ポケットモンスター ゲーム うまい棒 菓子 ハリアー 車 図 6: 未登録語知識ベースの一部 ここで,知識ベースにその未登録語が存在すれば, 対応する登録語を知識ベースから取得できるため未 登録語応答は行われない.知識ベースにない場合, 未登録語応答を行う.例として,ユーザが「ポケモ ンを買いました」と入力をすると,「ポケモン」はシ ソーラスに存在しないため「ポケモンとは何です か?」という応答文が生成される.それに対してユ ーザが「ポケットモンスターのことです」と回答を すると,ポケットモンスターは未登録語知識ベース にあるため,未登録語応答で応答文生成されず,「ポ ケモン」と,「ポケットモンスター」の対応登録語である「ゲーム」との対応を新たに知識ベースに登録 する. 3.2.3 感情判断応答 感情判断応答は入力文から話者の感情を判断しそ れを用いて応答を行う.例えば人間同士の会話であ れば A さんの「風邪を引いた」という発言に対して B さんが「大丈夫ですか?」と応答することがある. これは B さんが A さんの発言から A さんの悲しい 感情を判断し応答していると考えられる.感情判断 応答はこのような人間の発話をシステムに実現させ るものである. 感情判断応答は,ユーザの入力文から感情判断シ ステム[8]によって感情を取得できた際に応答文を生 成する.感情とそれに応じた応答を表 3 に示す. 表 3: 感情判断応答の応答文 取得した感情 応答文 安心,喜び 良かったですね 恐れ 恐いですね 怒り 腹が立ちますね 恥,悲しみ 大丈夫ですか? 後悔 悔しいですね 落胆 元気出してください 罪悪感 おいおい 3.2.4 7W1H 応答 7W1H 応答は,会話履歴フレームの該当する格に 語が格納されていない場合,その格について質問す る応答である.以下の図 7 にユーザが「私は今日、 食堂で食べた」を入力した際の 7W1H 応答による応 答文生成の例を示す.
述語 Who Who+ What When Where Why Whom How
食べた 私 今日 食堂
用言 Who Who+ What When Where Why Whom How
食べる 428 252 3198 182 645 11 1 2 図 7: 7W1H 応答の応答文生成 7W1H 応答では,述語に格納された動詞について 格頻度知識ベースの値が,総和の 0.01 以上の格につ いて会話履歴フレームが空であれば応答文を生成す る.図 7 の例では,「何を食べたのですか?」,「誰と 食べたのですか?」という応答文が生成できる. 3.2.5 掘下げ応答 掘下げ応答は,ある語について詳細を尋ねる応答 である.例えば「動物園に行ってきた」に対して「ど この動物園なの?」,「料理を食べた」に対して「ど んな料理なの?」等の質問をすることが,人間同士 の対話においてみられ,それを再現するのが掘下げ 応答である.掘下げ応答は,会話履歴フレームの Who+格,What 格,Where 格の語についてのみ行う. これは格頻度知識ベースにおいて What 格,Who+格, Where 格の順に頻度が大きかったからであり,これ は人間の発話において,何を,誰と,どこでについ て述べる表現が頻繁に使われていると考えられる. 掘下げ応答を行うための条件は会話履歴フレーム の Who+格,What 格,Where 格に語が格納されてお り,且つその語がシソーラスのノードに存在するこ とである.これは,シソーラスのノードに存在して いる場合,その語をシソーラスにおけるリーフのレ ベルまで掘下げ可能だと考えられるからである. 3.2.6 場所判断連想応答 場所判断連想応答は,会話履歴フレームの Where 格の語について場所判断システム[9]を用いて連想を 行い,質問文を生成する.会話履歴フレームの Where 格の語から場所判断システムにより以下の表 4 に示 す場所目的語が取得できた際に応答文を生成する. 表 4: 場所判断連想応答の応答文生成 場所目的語 応答文テンプレート 運動,泳ぐ,釣る,買う ~に・・・に行ったのですか? 勉強,ゲーム,スポーツ ・・・は好きですか? 遊ぶ ~で何をして遊びましたか? 運動,スポーツ ~でどんな・・・をしましたか? 食う,飲む ~で何を食べ(飲み)ましたか? 観る,鑑賞 ~で何を観ましたか 表 4 中の~は会話履歴フレームの Where 格の 語,・・・は該当する場所目的語である.尚,複数の条 件に該当する場合はそのうち 1 つを一様な確率でラ ンダムに選択する. 3.2.7 話題転換応答 話題転換応答は,他の応答手法が不可能な場合に 用いる話題を変える応答である.以下の図 8 に示す ような 19 種の応答候補からランダムに 1 つ選択し, 応答文を生成する. 図 8: 話題転換応答の応答例 会話履歴フレーム 格頻度知識ベース 今日はどんなことをしましたか? 昨日はどんなことをしましたか? 明日は何をしますか? 先週はどんなことがありましたか? 今週はどんなことがありましたか? 最近楽しかったことは何ですか?
3.3 自己開示応答
自己開示応答は,話者の発話に含まれる語につい てシステム側から主観を含んだ表現を行う応答であ る.例えば,自己開示応答ではユーザの「水族館で ペンギンを見てきた」という発話に対して「私はペ ンギンが可愛くて好きです」という応答を行う.感 覚判断システムにおける 95 種の感覚語に対して好 き嫌いを設定し,これを用いて応答文を生成する. 好き嫌いの設定の仕方は本研究においては,事前に 手動で行う. 3.3.1 自己開示応答の必要性 既存システム発話と人間同士の対話における発話 の種類の割合を比較した結果を以下の表 5 に示す. 表 5: 既存システムと人間の発話の比較 発話者 自己開示の割合 質問の割合 既存システム 0.031 0.744 人間 0.575 0.297 人間は対話において自己開示の発話を行うことが 多いのに対して,既存システムでは自己開示を行う 発話は少ない.そのため,より自然な対話の実現に は自己開示をする発話が必要と考えられる. 3.3.2 話者主観知識ベース 話者主観知識ベースは,話者の発話に感覚語が含 まれる場合に,それを新たな知識として獲得し自己 開示応答における感覚語取得の際に利用する.以下 の図 9 に話者主観知識ベースの一部を示す. 修飾語 対象 感覚語 ― 猫 可愛い 水族館の ペンギン 可愛い 南極の ペンギン 逞しい 図 9: 話者主観知識ベースの一部 話者主観知識ベースで話者の発言から新たな知識 を獲得する際の条件は,会話履歴フレームの述語に 感覚語が格納されていることである.その際に主格 (Who 格)に格納されている語を,その感覚語を持 つ対象として知識を獲得する. 3.3.3 自己開示応答の応答文生成 自己開示応答は会話履歴フレームの語から感覚語 を取得できる場合,または述語に感覚語を含む場合 に応答文を生成する.感覚語の取得には,話者主観 知識ベースおよび感覚判断システムを用いる.取得 した感覚語とそれに設定された好みを用いて,次の 表 6 に示すような応答文を生成する. 表 6: 自己開示応答の応答文例 応答型 応答文 相槌 なるほど,夕陽は綺麗なのですね 形容詞連想 私はペンギンが可愛くて好きです 相槌+形容詞連想 なるほど,ペンギンは可愛いと思 っていましたが,逞しいのですね 会話履歴フレームの述語に感覚語がある際に相槌 型,会話履歴フレームの語から感覚語を取得できる 際に形容詞連想型で応答文を生成する.また,述語 に感覚語があり且つ会話履歴フレームの語から感覚 語を取得できる際は相槌+形容詞連想型となる.3.4 応答文の選択
応答生成が可能な応答手法が複数あった場合には,各応 答手法に対応する発話の種類によって確率を付与し,それ に基づいてランダムに選択する.尚,提案システムにおけ る各応答手法を分類すると自己開示応答は自己開示,感情 判断応答は共感,挨拶応答は挨拶,それ以外の応答は質問 となる.発話の種類ごとの確率は名大会話コーパス[10]を用 いて人間の発話を分類したときの割合から設定しており, 自己開示 0.575,質問 0.297,共感 0.080 である.提案シス テムにおいて挨拶応答は話者の入力が挨拶の時に必ず行 い,相槌にあたる応答はないため,これら 2 つには設定確 率はない.各応答手法が選択される確率について,7W1H 応答(質問),自己開示応答(自己開示),が可能だった場 合で例を挙げる.それぞれの質問と自己開示の設定確率で ある 0.575 と 0.297 を,その和で割った値がそれぞれの選 択確率となる.この例では,自己開示応答が 0.659,7W1H 応答が 0.341 の確率で選択される. 尚,7W1H 応答,掘下げ応答,自己開示応答が選択され た場合,どの格の語について応答文を生成するかは格頻度 知識ベースの値を用いて,頻度に比例した確率を付与し, ランダムに選択する.4 評価
被験者はシステムとテキスト対話を行い,一つ一 つの応答に対してその応答文が自然であるかの評価, また対話全体について自然な流れの対話であったか 評価した.それらの結果を既存システムと提案シス テムとで比較する.尚,被験者は 5 名であり,対話 10 往復を 1 セットとして,被験者 1 人あたり既存シ ステムは 10 セット,提案システムは 5 セットの評価 を行った.評価はそれぞれ「自然である」,「不自然 ではない」,「不自然である」の三段階で行った.次 の表 7 に評価結果を示す.表 7: 評価結果 システム 応答文 1 つずつ 対話全体 〇 △ × 〇 △ × 既存システム 42.4% 26.8% 30.8% 16% 26% 58% 提案システム 49.6% 27.2% 23.2% 24% 32% 44%