雑談対話における話題提示システムの開発
Development of topic presentation system in chat dialogue
5113E013-7 林田 智樹 指導教員 小林 哲則 教授
Tomoki Hayashida Prof. Tetsunori Kobayashi
概要:初対面同士の会話では相手に関する情報が限られているため,何を話せばよいかわからないという問題があ る.本研究では,話者同士が共通に興味を持つトピックを推定し,トピックに付随するタグの関心度,希少度,関連度 を元に推薦するシステムを開発し,推薦トピックの50%が実際に雑談において有効であるという結果を得た. キーワード:対話,推薦システム,コミュニケーション
Keywords: dialogue, recommend system, communication
1.はじめに
人間が社会的な活動を行う上で,雑談は重要な コミュニケーション手段である.しかし,雑談対 話に苦手意識を持つ者は多い.特に,相手と打ち 解けていない段階では,相手に関する情報が少な いため,何を話せばいいのかわからないという問 題がある.
そこで,本研究では初対面の話者同士の会話が 弾みやすい環境を構築することを目的とし,オン ラインの情報を利用し,対話中に各話者の興味の 範囲から対話相手が質問しやすい話題を選択し, 可視化するシステムの開発を行った.
2.提案システム
提案するシステムは,2者間でのコミュニケー ション(一方の話者を話者 A,もう一方の話者を 話者 B とする)を想定した.まず,話者 A,話者 B は それぞれ興味のあるトピックを複数指定してい る.次に,各トピックには図 1 に示すようにそれ ぞれ複数のタグが紐付けられている.まず,話題 として適切だと考えられるのは話者 A と話者 B が共通に持つトピックである.しかし,話者 A と 話者 B が共通に興味をもつトピックが常に十分 にあるとは限らない.そこで,一方の話者しか持 たないトピックのうち,会話を弾ませるのに有効 なトピックを表示する.話者が知らないトピック に対して興味があるか判断する材料として,本論 文ではトピックに付随する属性情報(以下タグ) を用いた.
次に,システムの実行手順の詳細を述べる.
(1)データの収集
DBpedia Japanese を用いてトピックとタグの
図 1.タグとトピック
データを収集し,Facebook を用いてユーザの持 つトピックのデータを収集する.
(2)タグのスコアを計算
Step(1)で構築したデータベースを元に,各タ グのスコアを計算する.タグのスコアは 3 つのパ ラメータで表現する.
一つ目は話者のタグに対する関心度である.あ るタグに対する関心が高いほどそれに紐づくト ピックに対する関心も高いと考えられるため関 心度をパラメータにした. B の持つタグの総数 B(t)と表し,B が持つトピックのうち tiが紐付いてい る話題の個数を B(ti)と表すことにし,以下の式によ って関心度を計算する.
二つ目はタグの希少度である.希少性が高いタグ ほど,話者 A と話者 B が同時に持つ可能性が低い.
つまり,希少度をパラメータとすると,より話者 A,B の組み合わせ特有のトピックが提案できる.
タグ tiが紐付いている話題数を W(ti)と表すこととし, 以下の式によって希少度を計算する.
三つ目はタグとトピックの関連度である.トピ
2
ックとの関連性が高いタグほどトピックの判断 に 有 用 で あ る と 考 え ら れ る か ら で あ る .search(Tj,ti) を ト ピ ッ ク Tj と タ グ ti を Yahoo!の提供する検索エンジンで検索した際に 返ってくる記事数とし,以下の式によって関連度 を計算する.
提案システムではこれら三つのパラメータを トピック毎に算出し,その積をタグのスコアとし た.
(3)トピックスコアの計算
step(2)で求めたタグのスコアを元にトピック のスコアを計算する.トピックのスコアは,その トピックに付随するタグのスコアの総和で表す ものとした.
(4)トピックの表示
Step(3)で求めたトピックのスコアを元に,上 位のトピックをタグとともに画面に表示する.図 2 に示すように,表現の方法はネットワーク図で 表した.
図 2.インタフェース
3.評価 3.1 実験の目的
スコアリングされたタグが期待通りトピック を判断する上で有用であるか,また,タグをスコ アリングする際のパラメータがいかにスコアに 影響しているかを調査するために実験を行った.
3.2 実験条件
被験者数3,実験者のトピック数 56,全トピッ ク数 11283,画面に表示するトピック数 10,画面 に表示するタグ数 10 という条件で実験を行っ た.
3.3 実験内容
実験者(話者 A)の持つトピックと被験者(話者 B)の持つトピックを用いて,話者 A の持つトピッ
クとタグを話者 B の関心度を元にスコアリング した.話者 B にスコアリングに用いるタグの内”
このタグに付いている未知のトピックに興味を 持ちそうなタグ”を 20%選択させ(選択タグ),実 際に画面に表示されるタグとの一致率を調べた.
3.3 実験結果
実験結果を表にまとめる.
各パラメータ単体での表示率では,関連度が一番 高い精度を示した.一方で,稀少度のみの場合は 精度が低く,表示率は 7%にとどまった.
また,関連度をベースにして各パラメータを組み 合わせた場合においては,稀少度を除いた関連度 と関心度の組み合わせが一番高い精度となった.
表 1. 各パラメータの組み合わせにおける選択 タグの画面への表示率
4.まとめ
オンライン上の個人情報を元にした雑談対話 における話題の推薦システムを開発し,提案した.
話題の推薦にあたり,話題に付随する属性情報を 用いた.結果,可視化された話題に,未知の興味が ある話題が表現されている事が確認された.
5.参考文献
[1] 鈴木友也, 上村春貴,and 高間康史. ”ユーザ間の 関係可視化によるコミュニケーション支援システムの 提案”人工知能学会 2014
[2] 神嶌敏弘. ”推薦システムのアルゴリズム(1).”
人工知能学会誌 22.6 (2007): 826-837.
[3] 丹 羽 智 史 , 土 肥 拓 生 , and 本 位 田 真 一 . ” Folksonomy マイニングに基づく Web ページ推薦シス テム(エージェント応用システム,¡ 特集¿ マルチエー ジェントの理論と応用).” 情報処理学会論文誌 47.5 (2006): 1382-1392.