The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014
- 1 -
時系列
タ可視化手法を用い 議論解析
Analyzing discussion using a visualizing method for time series text data
岡
美那子
*1大澤
幸生
*1Minako Hiraoka Yukio Ohsawa
*1
東京大学大学院
工学系研究科
ム創
学専攻
Department of Systems Innovations, School of Engineering, The University of Tokyo
To understand the flow of discussion, or discover new viewpoints, a structured discussion map is more useful than a mere record of the discussion. However, it is hard to compose a discussion map automatically because of the difficulty of extracting logics from natural language. In this paper, we propose an improved visualizing method for time series text data. We focus on the variations in the appearance frequencies of every word in discussion and utilize them to put words in a discussion map like a clock, or a railway map. Also, words are grouped into clusters and displayed together. Some words are linked if speakers said in the same remark. A set of links expresses the rough flow of discussion. We implement this method and apply it to a record of a party leaders’ debate session. The result of application shows that our method is helpful to recognize the flow and viewpoints of discussion.
1.
じめに
過去 行わ 議論 内容 関係者 知識を共
議事録 保管 い 場合 多い 議事録
議論構造 抽出 ば 過去 行わ 議論 把握 新
い論点 視点 発見等 様々 活用
自然言語 記述 個々 発言を自動的 厳密 議論モ
変換 い 々 議論 出現 単
語 時間的 ば 着目 議論構造を抽出 手
法を提案 い [Hiraoka 14] 本稿 、前述 手法を基
議題 変化を考慮 マッ 単語 タ ン
議論マッ 粒 を自 変え 出来 ンタ
ワ 構築 以 点 改良を加え 手法を提
案
2.
関連研究
既存 議論構造 可視化 対 ロ チ 大 く け
以 種類 人 自 タを構造化
方法[Kirschner 03] 中 “手 表現“や 文
接続情報を利用 方法[Satoh 06] 議論 出現 単語
変 議論 構造を推定 方法[Matsumura 3] 本手法
自動的 後 出現頻 を利用 構造化を行 い
点 ロ チ 近い 発言者 違い 着目
い 点 議論マッ い 、個々 単語 標 意味 あ
いう点 既存手法 異 い
3.
提案手法
3.1 議論マップ 作成
本手法 作 議論マッ 形状を 示 提
案 議論マッ 議論 出現 単語 散 均を基
中央 一般的 語 外側 特徴的 語を配置 時
計回 議論 流 追え う 設計 い 以 計算
手法を簡単 示 析対象 議事録 タ
各発言 発言時間 発言者 情報 付与 い
各発言 対 形態素解析を行い 単語文書行列を作
各単語 い 出現時間 標準偏差 均を計算
示 計算式 マッ 配置 出現頻
複数あ 単語 対応 混合 ウ 布
を仮定 EM ゴ ム タ ン を行う 一
発言 含 単語間 ン を結ぶ 以 ッ い
詳 い計算手法 [Hiraoka 14]を参考 い
図
1
議論マップのモ
図
図
2
単語の配置方法
3.2 複数トピックへ 対応
議題 複数含 う 長い議事録 場合 マッ 過密
う 複数 議題 含 う 長い議論
タ い 議題 単語を タ ン 表示
を考え 議題 境目 い 出現単語 組 合わ
せ 大幅 変化 考え タ ン 前節
述べ 単語間 ン 情報を利用 以 計
算 ゴ ムを示 議論全体 時間を適当 時間幅
散化 T={T1,T2,…} 時間 Ti~Ti+1 存在
ン 数を 調べ 時間 ン 頻 布を作
連絡先: 岡美那子, 東京大学 工学系研究科 ム創
学専攻
The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014
- 2 -
時間 ン 頻 布 対 混合 ウ 布 推定を行い
議題 境目 時間を決定 推定 境目
時間を基 単語を タ ン
4.
システム 実装
提案手法を ウ 閲覧可能 Web ン
実装 ム 全体 を 示 本 ム
ンタ マッ 解像 を変更 可能
い マッ 表示 ゴ ムを以 示
表示範 を 択 表示範 含 単語 うち
議論全体 け 出現頻 高い 順 N個 択
択 単語を 含 ン を 択
択 単語 ン を画面 表示
機能 議論 大 流 を追う 議論
中 特定 部 詳細を調べ 出来 単語 複数
発見及び 類 議論全体 話題を考慮 単語 類
統計ソ R Mclustパッ を用い 最大 タ
数を指定 BIC 値 最 高く 結果を採用
図
3
議論可視化シス
ム
5.
適用例
実装 ムを用い 2004 11 10日 行わ
自民両代表 党首討論 議事録[Kokkai 14] い 可視化
を行 議事録 発言時間 情報 議
事録 け 改行を発言 区 発言時間を初 順
番 1 2… 表示 単語 詞 総出現回数 回
以 最大 タ 数 議題 単語 ち
結果を表 4 示 表 議題 境目 正
確 検出 い 事 発言者 使用単語や
ン 結び 主張を読 取 事 出来
6.
おわりに
時系列 タ 議論マッ を作 手法を提案
実際 議論 タ 可視化を行 本手法を用い ば議
事録 効果的 構造化出来 議論マッ 解
釈方法 い 今後検証実験を実施 い 考え い
表
1
ン
情報による議題の
スタ
ン 結果
図
4
党首討論議論マップ
:自民党
:民主党
参考文献
[Hiraoka 14] 岡美那子 大澤幸生: 時系列 タ
議論構造 可視化 情報処理学会第 76 回全国大会
講演論文集 2014
[Kirschner 03] Paul A. Kirschner, Simon J. Buckingham Shum and Chad S. Carr (Eds.): Visualizing Argumentation: Software Tools for Collaborative and Educational Sense-Making, Springer-Verlag: London, 2003
[Satoh 06] 佐藤岳文 堀 昌英:Web マ ニン を用い 因
果 ッ ワ 自動構築手法 開発 社会技術研究論文
集, 2006
[Matsumura 03] 松村真宏, 加藤優, 大澤幸生, 石塚満: 議論構
造 可視化 論点 発見 理解, 知識 情報:日本知
能情報 学会誌, 2003