自己開示発話を取り入れた雑談型対話システムの提案

(1)

自己開示発話を取り入れた雑談型対話システムの提案

Suggestion of the Non-task-oriented Dialogue System

that Adopted Self-disclosure Utterance

北川智裕

1*

_土屋誠司

2

_渡部広一

2

Tomohiro Kitagawa

1

, Seiji Tsuchiya

2

, and Hirokazu Watabe

2

1

_{同志社大学大学院理工学研究科}

1

_{Graduate School of Science and Engineering, Doshisha University}

2

_{同志社大学理工学部}

2

_{Faculty of Science and Engineering, Doshisha University}

Abstract: Recently, intellectual computers that become partners of people in society are required. Therefore, computers need to be able to communicate smoothly with people. Therefore, we need a system capable of dialogue with human beings in natural language. Because people use language dialogue as the main means of communication. However, until now, such a system has not been realized. Therefore, in this paper, we propose a dialogue system that can make utterance to self-disclose. People interact while not only asking questions but also disclosing their own ideas to the partner in the dialogue. For this reason, Human-like dialogue with the system can be realized by making utterance that self-discloses the system like a human being.

1 はじめに

近年，ロボットが教育や福祉等の様々な分野で人間のパートナーとしての活躍することへの期待が高まりつつある．そのためには，ロボットと人間との円滑な意思疎通の実現が必要になる．人間は日常的なコミュニケーションの手段として主に自然言語による対話を用いている．よって，ロボットが人間と同様に自然言語を用いた対話を行える必要があり，雑談型の対話システムは人間のパートナーとして活躍するロボットの実現に向けて重要な研究分野であると言える．これに関連する研究として金子稜らによって発表された，“話題を考慮した自然な会話システムの構築[1]_{”がある．}_{（以降これを既存システムと} する．）このシステムは，人間が対話をする際，いつ，どこで，何を等の情報を重視することが多い[2]_ことに着目し，対話を展開する．しかし，7W1H の情報について話者に質問する発話の割合が非常に大きいため，話者は一方的に質問を受けることになり，不自然な対話になることがある．そこで本研究では，人間が対話をする際に行う自己開示の発話に注目した．人間は対話の相手から話を聞く際に，単に質問を行うだけでなく自身の考えを相手に対して開示しながら対話をする．システムもそのような発話ができるようになれば，より自然な対話ができると考えられる．本研究ではそれを自己開示応答として実装した対話システムを提案する．自己開示応答は，ある語に対して抱く感覚を発話に取り入れることで，話者への質問とシステムからの自己開示の両方ができるようになる．これによりシステムは人間とより自然な対話ができ，円滑なコミュニケーションの実現に貢献できると考える．

2 関連技術

2.1 意味理解システム

意味理解システム[3]_{は，入力文の情報を 7W1H と} 述語のフレームに分割して格納するシステムである． 7W1H とは英語の疑問視に用いられる 6W1H（いつ，どこで，誰が，何を，誰に，何故，どのように）に「誰と」を表す Who+フレームを追加したものである．図 1 に意味理解システムの実行例として「昨日，私は友達と水族館でイルカを観た．」という文を入力した場合の結果を示す．） *連絡先：同志社大学大学院理工学研究科〒610-0394 京都府京田辺市多々羅都谷１−３ E-mail：[email protected] 人工知能学会研究会資料 SIG-KBS-B509-03

(2)

Who Who+ What When Where Whom How Why 述語私友達イルカ昨日水族館観た図 1: 意味理解システムの実行例提案システムにおいて，ユーザからの入力を解析し，システムがユーザの発言内容を理解するために用いる．

2.2 京大格フレーム

京大格フレーム[4]_{は，Web 上に存在するテキスト} 16 億文から構築された大規模データベースである．用言は約 4 万語が登録されており，それぞれの用言に対して共起する名詞を格ごとに整理し，その頻度を取得することができる．以下の表 1 に，京大格フレームに動詞「泳ぐ」を入力した結果を示す．表 1: 「泳ぐ」に対する京大格フレームの出力名詞格頻度魚ガ 1483 プールデ 1195 視線ヲ 1118 提案システムにおいて格頻度知識ベース（3.1.2 項）を作成する際に，京大格フレームのデータを用いる．

2.3 感覚判断システム

感覚判断システム[5]_{は，名詞を入力すると，人間} が常識的に想起する感覚を取得するシステムである．感覚語とは，形容詞・形容動詞のうちから日常的に用いられている語を人手で抽出した 95 語である．例として「林檎」を入力した場合，感覚語として{赤い，丸い，甘い}を取得できる．提案システムにおいて自己開示応答を行う際に，名詞から感覚語を取得するために用いる．

3 提案する対話システム

本研究では，システムが人間と同様に自己開示をする発話を行うこと，また対話の展開にランダム性を取り入れ多様性を持たせることで，人間とのより自然な雑談型対話の実現を目指している．提案する対話システムは，既存システムをベースにして構築する．既存システムでは話者に対して質問をする発話の割合が多く，システムから自己開示をする発話の割合が少ないという問題があった．そこで，自己開示応答（3.3 節）を新たな応答手法として対話システム内に組み込む．また，既存システムでは条件分岐により応答手法を決定するため，入力が同じであれば常に同じ応答がされ，対話の展開が単調になりやすかった．そこで，複数の応答手法が可能な場合には，それぞれの応答に対して確率を付与し，それに基づいて応答を選択し出力する．以下の図 2 に提案する対話システムの全体フローを示す．図 2: 提案する対話システムの全体フローこのシステムでは 3.2 節および 3.3 節で述べる応答手法を用いて，ユーザの入力に応答を行う．

3.1 システムの動作に用いるもの

ここでは，提案システムの動作に用いる会話履歴フレーム，格頻度知識ベースについて述べる． 3.1.1 会話履歴フレーム会話履歴フレームとは話者の会話履歴を，意味理解システムを用いて 7W1H と述語に分割して格納，したものである．さらに，システムの質問に対するユーザの回答を用いて順次追記が行われる．尚，会話履歴フレームの 7W1H は意味理解システムのフレームと対応している．以下の図 3 に会話履歴フレームへの格納の様子を示す．図 3 中の Why，Whom， How フレームは空欄のため省略している．

Who Who+ What When Where 述語

私蕎麦昼食堂食べた

Who Who+ What When Where 述語

私友達蕎麦昼食堂食べた

図 3: 会話履歴フレームへの格納

私は昼、食堂で蕎麦を食べた

誰と食べましたか？友達とです

(3)

3.1.2 格頻度知識ベース格頻度知識ベースは京大格フレームを情報源として，国語辞書に登録されている全用言 18046 語について共起する名詞と助詞を取得し，取得した名詞のシソーラス[6]_{における親ノードと助詞によって} 7W1H に機械的に分類し，その頻度をまとめたものである．ここで分類時のルールを以下の表 2 に示す．表 2: 7W1H への分類ルール助詞親ノード分類格で乗り物，道具 How 建造物，施設，場所 Where 形容詞 Why と人物，人名 Who+ を建造物，施設，場所 Where 道具 What に時間 When まで時間 When から時間 When 形容詞 Why が人物，人名 Who 無生物 What に人物，人名 Whom 時間 When 建造物，施設，場所 Where へ人物，人名 Whom 建造物，施設，場所 Where 例えば用言「行く」に対し京大格フレームで一緒に用いられている名詞と助詞を獲得すると「店に，時間に，学校に，…」となり，下線部の語を分類していくと，店は親ノードに「場所」を持っており，助詞「に」を伴っているので Where 格，時間は親ノードに「時間」を持っており，助詞「に」を伴っているので when 格，学校は親ノードに「施設」を持っており，助詞「に」を伴っているので Where 格… と分類された数をカウントする．図 4 に作成した格頻度知識ベースの一部を示す．

用言 Who Who+ What When Where Why Whom How

行く 223 183 110 230 1812 17 108 123 食べる 428 252 3198 182 645 11 1 2 図 4: 格頻度知識ベースの一部

3.2 応答手法

本節では提案する対話システムで用いる自己開示応答以外の応答手法について述べる． 3.2.1 挨拶応答挨拶応答[7]_{は，入力文が挨拶語である場合に用い} る．挨拶の種類の判断と応答は，挨拶語知識ベースを利用する．挨拶語知識ベースとは，190 の挨拶語が格納されている知識ベースである．挨拶語知識ベースには挨拶語(例：おはよう)とそれに対応する状況(例：朝の挨拶)がセットで格納されている．また，その状況に対応する応答語(例：おはよう)が格納されている．挨拶語知識ベースの一部を図 5 に示す．挨拶語状況応答語おはよう朝の挨拶おはよう，やあおはよ朝の挨拶おはよう，やあありがとう感謝の応答どういたしましておい呼びかけはいさようなら別れの挨拶さようなら，また今度図 5: 挨拶後知識ベースの一部挨拶応答の応答文生成条件はユーザの入力が，知識ベース内の挨拶語と表記一致することである． 3.2.2 未登録語応答未登録語とはシソーラスに登録されていない名詞と定義する．会話において新語や固有名詞などの知らない語や分からない語が登場することは多くあり，人間はそれに対して相手にその語について聞き返すことがある．その手法をモデル化したものが未登録語応答である．話者の発言中に未登録語が含まれていた場合，まず未登録語知識ベースを参照する．以下の図 6 に未登録語知識ベースの一部を示す．未登録語対応登録語ポケットモンスターゲームうまい棒菓子ハリアー車図 6: 未登録語知識ベースの一部ここで，知識ベースにその未登録語が存在すれば，対応する登録語を知識ベースから取得できるため未登録語応答は行われない．知識ベースにない場合，未登録語応答を行う．例として，ユーザが「ポケモンを買いました」と入力をすると，「ポケモン」はシソーラスに存在しないため「ポケモンとは何ですか？」という応答文が生成される．それに対してユーザが「ポケットモンスターのことです」と回答をすると，ポケットモンスターは未登録語知識ベースにあるため，未登録語応答で応答文生成されず，「ポケモン」と，「ポケットモンスター」の対応登録語で

(4)

ある「ゲーム」との対応を新たに知識ベースに登録する． 3.2.3 感情判断応答感情判断応答は入力文から話者の感情を判断しそれを用いて応答を行う．例えば人間同士の会話であれば A さんの「風邪を引いた」という発言に対して B さんが「大丈夫ですか？」と応答することがある．これは B さんが A さんの発言から A さんの悲しい感情を判断し応答していると考えられる．感情判断応答はこのような人間の発話をシステムに実現させるものである．感情判断応答は，ユーザの入力文から感情判断システム[8]_{によって感情を取得できた際に応答文を生} 成する．感情とそれに応じた応答を表 3 に示す．表 3: 感情判断応答の応答文取得した感情応答文安心，喜び良かったですね恐れ恐いですね怒り腹が立ちますね恥，悲しみ大丈夫ですか？後悔悔しいですね落胆元気出してください罪悪感おいおい 3.2.4 7W1H 応答 7W1H 応答は，会話履歴フレームの該当する格に語が格納されていない場合，その格について質問する応答である．以下の図 7 にユーザが「私は今日、食堂で食べた」を入力した際の 7W1H 応答による応答文生成の例を示す．

述語 Who Who+ What When Where Why Whom How

食べた私今日食堂

用言 Who Who+ What When Where Why Whom How

食べる 428 252 3198 182 645 11 1 2 図 7: 7W1H 応答の応答文生成 7W1H 応答では，述語に格納された動詞について格頻度知識ベースの値が，総和の 0.01 以上の格について会話履歴フレームが空であれば応答文を生成する．図 7 の例では，「何を食べたのですか？」，「誰と食べたのですか？」という応答文が生成できる． 3.2.5 掘下げ応答掘下げ応答は，ある語について詳細を尋ねる応答である．例えば「動物園に行ってきた」に対して「どこの動物園なの？」，「料理を食べた」に対して「どんな料理なの？」等の質問をすることが，人間同士の対話においてみられ，それを再現するのが掘下げ応答である．掘下げ応答は，会話履歴フレームの Who+格，What 格，Where 格の語についてのみ行う．これは格頻度知識ベースにおいて What 格，Who+格， Where 格の順に頻度が大きかったからであり，これは人間の発話において，何を，誰と，どこでについて述べる表現が頻繁に使われていると考えられる．掘下げ応答を行うための条件は会話履歴フレームの Who+格，What 格，Where 格に語が格納されており，且つその語がシソーラスのノードに存在することである．これは，シソーラスのノードに存在している場合，その語をシソーラスにおけるリーフのレベルまで掘下げ可能だと考えられるからである． 3.2.6 場所判断連想応答場所判断連想応答は，会話履歴フレームの Where 格の語について場所判断システム[9]_{を用いて連想を} 行い，質問文を生成する．会話履歴フレームの Where 格の語から場所判断システムにより以下の表 4 に示す場所目的語が取得できた際に応答文を生成する．表 4: 場所判断連想応答の応答文生成場所目的語応答文テンプレート運動，泳ぐ，釣る，買う～に･･･に行ったのですか？勉強，ゲーム，スポーツ･･･は好きですか？遊ぶ～で何をして遊びましたか？運動，スポーツ～でどんな･･･をしましたか？食う，飲む～で何を食べ（飲み）ましたか？観る，鑑賞～で何を観ましたか表 4 中の～は会話履歴フレームの Where 格の語，･･･は該当する場所目的語である．尚，複数の条件に該当する場合はそのうち 1 つを一様な確率でランダムに選択する． 3.2.7 話題転換応答話題転換応答は，他の応答手法が不可能な場合に用いる話題を変える応答である．以下の図 8 に示すような 19 種の応答候補からランダムに 1 つ選択し，応答文を生成する．図 8: 話題転換応答の応答例会話履歴フレーム格頻度知識ベース今日はどんなことをしましたか？昨日はどんなことをしましたか？明日は何をしますか？先週はどんなことがありましたか？今週はどんなことがありましたか？最近楽しかったことは何ですか？

(5)

3.3 自己開示応答

自己開示応答は，話者の発話に含まれる語についてシステム側から主観を含んだ表現を行う応答である．例えば，自己開示応答ではユーザの「水族館でペンギンを見てきた」という発話に対して「私はペンギンが可愛くて好きです」という応答を行う．感覚判断システムにおける 95 種の感覚語に対して好き嫌いを設定し，これを用いて応答文を生成する．好き嫌いの設定の仕方は本研究においては，事前に手動で行う． 3.3.1 自己開示応答の必要性既存システム発話と人間同士の対話における発話の種類の割合を比較した結果を以下の表 5 に示す．表 5: 既存システムと人間の発話の比較発話者自己開示の割合質問の割合既存システム 0.031 0.744 人間 0.575 0.297 人間は対話において自己開示の発話を行うことが多いのに対して，既存システムでは自己開示を行う発話は少ない．そのため，より自然な対話の実現には自己開示をする発話が必要と考えられる． 3.3.2 話者主観知識ベース話者主観知識ベースは，話者の発話に感覚語が含まれる場合に，それを新たな知識として獲得し自己開示応答における感覚語取得の際に利用する．以下の図 9 に話者主観知識ベースの一部を示す．修飾語対象感覚語 ― 猫可愛い水族館のペンギン可愛い南極のペンギン逞しい図 9: 話者主観知識ベースの一部話者主観知識ベースで話者の発言から新たな知識を獲得する際の条件は，会話履歴フレームの述語に感覚語が格納されていることである．その際に主格（Who 格）に格納されている語を，その感覚語を持つ対象として知識を獲得する． 3.3.3 自己開示応答の応答文生成自己開示応答は会話履歴フレームの語から感覚語を取得できる場合，または述語に感覚語を含む場合に応答文を生成する．感覚語の取得には，話者主観知識ベースおよび感覚判断システムを用いる．取得した感覚語とそれに設定された好みを用いて，次の表 6 に示すような応答文を生成する．表 6: 自己開示応答の応答文例応答型応答文相槌なるほど，夕陽は綺麗なのですね形容詞連想私はペンギンが可愛くて好きです相槌＋形容詞連想なるほど，ペンギンは可愛いと思っていましたが，逞しいのですね会話履歴フレームの述語に感覚語がある際に相槌型，会話履歴フレームの語から感覚語を取得できる際に形容詞連想型で応答文を生成する．また，述語に感覚語があり且つ会話履歴フレームの語から感覚語を取得できる際は相槌+形容詞連想型となる．

3.4 応答文の選択

応答生成が可能な応答手法が複数あった場合には，各応答手法に対応する発話の種類によって確率を付与し，それに基づいてランダムに選択する．尚，提案システムにおける各応答手法を分類すると自己開示応答は自己開示，感情判断応答は共感，挨拶応答は挨拶，それ以外の応答は質問となる．発話の種類ごとの確率は名大会話コーパス[10]_を用いて人間の発話を分類したときの割合から設定しており，自己開示 0.575，質問 0.297，共感 0.080 である．提案システムにおいて挨拶応答は話者の入力が挨拶の時に必ず行い，相槌にあたる応答はないため，これら 2 つには設定確率はない．各応答手法が選択される確率について，7W1H 応答（質問），自己開示応答（自己開示），が可能だった場合で例を挙げる．それぞれの質問と自己開示の設定確率である 0.575 と 0.297 を，その和で割った値がそれぞれの選択確率となる．この例では，自己開示応答が 0.659，7W1H 応答が 0.341 の確率で選択される．尚，7W1H 応答，掘下げ応答，自己開示応答が選択された場合，どの格の語について応答文を生成するかは格頻度知識ベースの値を用いて，頻度に比例した確率を付与し，ランダムに選択する．

4 評価

被験者はシステムとテキスト対話を行い，一つ一つの応答に対してその応答文が自然であるかの評価，また対話全体について自然な流れの対話であったか評価した．それらの結果を既存システムと提案システムとで比較する．尚，被験者は 5 名であり，対話 10 往復を 1 セットとして，被験者 1 人あたり既存システムは 10 セット，提案システムは 5 セットの評価を行った．評価はそれぞれ「自然である」，「不自然ではない」，「不自然である」の三段階で行った．次の表 7 に評価結果を示す．

(6)

表 7: 評価結果システム応答文 1 つずつ対話全体〇 △ × 〇 △ × 既存システム 42.4% 26.8% 30.8% 16% 26％ 58％提案システム 49.6% 27.2% 23.2% 24％ 32％ 44％

5 考察

5.1 応答文 1 つずつへの評価

提案システムは既存システムと比較して，〇の割合が 7.2％，〇と△を合わせた割合が 7.6%増えた結果となった．これは新たに提案した自己開示応答が精度向上に貢献したと考えられる．提案システムの評価における自己開示応答を除いた 211 発話への評価では〇が 44.5%，△26.5％であった． ×の評価の割合が最も多かった応答手法は 7W1H 応答で 44％であった．これはユーザが最初に入力する動詞によって，著しく評価が悪くなるパターンが見受けられたことが原因として考えられる．以下の図 10 にその例である評価セットの一部を示す．尚，図中の U：はユーザ，S：はシステムの発話である．図 10 応答文の多くが悪い評価となる例上記はユーザの「今日は家で寝ていました」という発話に対して，7W1H 応答および掘り下げ応答が行われた例である．これは格頻度知識ベースを用いて質問する格を決定しているが，その際に用言だけに注目し文脈を考慮できていないために不自然な応答になったと考えらえる．これを解決するには「家で寝ている」という発話から，発話者の自宅で，発話者が寝ていたことを推測して理解する必要がある．

5.2 対話全体への評価

提案システムは既存システムと比較して，〇の割合が 8％，〇と△を合わせた割合が 24%増えた結果となった．しかし，提案システムにおいて，ユーザの入力から感覚語を取得でき，自己開示応答を行えたのは 25 セット中 13 にとどまった．そのため，システムによる質問が続く対話となり不自然な流れになることがあった．この解決には，感覚語を取得できる語を増やす必要があり，連想によって話者主観知識ベースの語と関連づけて感覚を取得したり，話者に自己開示の発話から，話者の抱く感覚を学習したりという方法があると考える．

6 おわりに

本研究では，対話システムに自己開示を行う応答を取り入れることで，より自然な対話ができるシステムの構築を目指した．質問ばかりでなく，システムからの自己開示が入ることにより対話の自然さが向上する評価結果を得られた．話者の発言の文脈をさらに深く解析した質問生成の手法，話者から主観を引き出す発話を生成する手法等が実現すれば，より人間らしい対話ができるシステムになると考える．

謝辞

本研究の一部は JSPS 科研費 16K00311 の助成を受けて行ったものです．

参考文献

[１] 金子稜，吉村枝里子，土屋誠司，渡部広一，”話題を考慮した自然な会話システムの構築”，研究報告知能システム 2016-ICS-183 2 号 pp1-8，2016． [２] 松本正雄，“コミュニケーション能力”，九州産業大学情報科学会誌，5 巻，1 号，2006. [３] 小谷涼，吉村枝里子，土屋誠司，渡部広一，“入れ子構造による文章の意味理解手法の提案”，情報科学技術フォーラム FIT2016，pp.259–260，2016． [４] 河原大輔，黒橋禎夫，“高性能計算環境を用いた Web からの大規模格フレーム構築”，情報処理学会自然言語処理研究会 171-12，pp.67-73，2006． [５] 渡部広一，堀口敦史，河岡司，“常識的感覚判断システムにおける名詞からの感覚想起手法”，人工知能学会誌，Vol.19，No.2，pp.73-82，2004． [６] NTT コミュニケーション科学研究所，“日本語語彙体系”，岩波書店，1997． [７] 村枝里子, 渡部広一, 河岡司，“知能ロボットにおける挨拶文の自動生成方式”，第 18 回人工知能学会全国大会論文集，2D1-09 ，2004． [８] 土屋誠司, 鈴木基之, 芋野美紗子, 吉村枝里子, 渡部広一，“口語表現に対応した知識ベースと連想メカニズムによる感情判断手法”，人工知能学会論文誌， Vol.29，No.1，pp.11-20，2014． [９] 杉本二郎，渡部広一，河岡司，“概念ベースを用いた常識場所判断システムの構築”，情報処理学会自然言語処理研究会資料，2003-NL-153，pp.81-88，2003． [１０] 藤村逸子・大曽美恵子・大島ディヴィッド義和， 2011，「会話コーパスの構築によるコミュニケーション研究」，藤村逸子，滝沢直宏編『言語研究の技法：データの収集と分析』，pp. 43-72，ひつじ書房． U：今日は家で寝ていました S：どこの家ですか？ × U：自分の家ですよ S：何が寝ていましたか？ × U：私が寝ていました S：どのように寝ていましたか？ ×