議論セグメント
3.4 本研究で対象とする会議コーパス 35
図3.6 会議コンテンツ閲覧ページ
が要約を作成する際に,手がかりとして用いており,これに着目することで,活性拡散ア ルゴリズムや従来の語の出現頻度などを手がかりとした自動要約手法よりも,人間の要約 作成作業の要素を取り込んだより質の高い自動要約が実殿できる可能性がある.そのた め,上記の問題に対処するためには,時系列データである会議記録から議論構造を十分に 理解し,より柔軟で正確な知識抽出をおこなう手法が必要である.
会議コーパスのサイズ
本研究の対象データは,ディスカッションマイニングにてWeb上に公開されている全 25件の会議録データ*2および限定公開されている95件の会議録データの計 120件であ る.本コーパスサイズは,総時間長が224時間24分,総議論セグメント数が1977件,総 発言数が9167件である.表3.2は,公開中の会議コンテンツの情報一覧であり,限定公 開されている会議コンテンツも含めた全120件のデータは,表3.3の通りである.
*2入手先⟨http://dm.nagao.nuie.nagoya-u.ac.jp/guest⟩.
表3.2 公開中の会議コンテンツの情報一覧
タイトル 発表日 発表時間 発言数
ATとSUVの連携走行の帰結∼クルマ未来博を終えて∼ 2011-11-30 01:17:30 43 引用情報の記録機能の実装報告と引用についてのガイドライン 2011-11-04 02:48:32 89 ディスカッションの記録と応用 2011-10-26 02:37:13 95 研究活動支援のための音声の記録と利用 2011-10-21 01:21:52 55 ボードコンテンツと関連情報の同時閲覧によるミーティング想起 2011-10-07 01:59:16 45 夏季期間中の活動報告 2011-10-07 01:59:28 60 映像シーン検索の高度化∼Synvie2 (仮)の実装について∼ 2011-06-29 01:49:41 49 ATプロジェクト報告 第8期の目標と計画 2011-05-11 02:46:04 65 カジュアルミーティング支援システムTimeMachineBoard 2011-04-20 02:42:10 69 議論の構造化に関する実験の中間報告 2010-12-17 02:53:36 88 SUVを用いた実験と シミュレーションを用いた実験の中間報告 2010-12-10 02:48:16 111 様々なコンテンツの再利用を可能にする知識活動支援システム 2010-12-03 02:03:32 63 論文読解支援とDocvieについて 2010-11-12 02:00:10 87 小型無人移動体を用いたATの安全走行 2010-05-20 02:25:25 117
TMB + iPadまた1歩ミーティングの理想に近づける 2010-02-10 01:45:41 74
興味推定実験の結果と評価実験について 2009-12-04 02:28:26 88 修士論文執筆に向けて∼評価と論文の構成∼ 2006-11-17 01:18:34 30 カジュアルな会議と記録位置づけ+記録方法 2006-10-13 01:44:14 69 ディスカッションマイニング:会議の再利用に関する検討 2006-10-13 01:37:02 71 議事録に基づく知識活動の活性化 2006-09-29 01:54:59 59
Annotation-based Web Content Mashup 2006-09-22 01:11:52 53
画像と音楽の印象語に基づくマッシュアップ 2006-09-22 01:23:47 41
Googleにおける目的の考察と目的に応じた検索方法の検討 2006-07-14 00:57:11 44
カジュアルな会議の記録と支援 2006-07-07 01:24:23 48 DRIPモデルにおける発表者による有益な議論の促進 2006-04-26 01:17:24 48
表3.3 公開中/非公開の会議コンテンツの情報一覧(120件) 発表時間 発言数 発表者数 議論セグメント数 1議論の平均 2:02:12 76.4 12.5 16.5
120件の合計 244:24:21 9167 1497 1977
37
第 4 章
発言間の階層関係に基づく情報構 造化
概要
本章では,人間の認知過程を反映した情報構造化を実現する枠組みである発言間の階層 関係に基づく情報構造化の提案およびその実装方法について述べる.議論に含まれる意図 を明示的に表現するための新しい情報構造化手法として,発言間の関係や階層的な重要度 を表す木構造 (議論タイムスパン木) を提案する.この議論タイムスパン木により,各発 言における階層的な重要度を表現するため,発言間の関係や集合に基づく議論構造の理解 や,段階を追った簡約化が可能となる.本章では,議論タイムスパン木による発言間の階 層関係に基づく情報構造化手法とその生成方法,さらに本構造化手法を計算機上への実装 に対する問題に対処するためのアルゴリズム,システムの設計方法について詳述する.
4.1 はじめに
本章では,発言間の階層関係に基づく情報構造化の提案として,議論タイムスパン木の 生成方式について述べる.議論タイムスパン木は会議記録の情報を基に,グループ構造の 獲得,重要発言の選定の2段階の処理によって生成される.議論タイムスパン木の自動生 成に向けて,この2段階の処理を実行するルール群を提案する.また議論タイムスパン木 生成の実装において,局所的/大局的な階層構造を獲得する際に生じるルール競合の問題 に対処するため,適切なルールの実行管理をおこなうアルゴリズムを構築した.さらにそ の有効性を評価するため,議論タイムスパン木生成システムを構築する.
4.2 情報構造化のための理論的枠組みの構築
人は会議の各発言の間にある賛成と反対,質問と回答などの関係に基づき,隣接する発 言間だけでなく離れた発言間の関係も考慮して,議論の構造を理解する.その発言列に は,ある観点から見て重要,あるいは瑣末なものがある.その重要度に基づく発言列に関 して,重要な発言を会議録中から取り出すという意味である簡約の概念を定義し,会議の 発言列を分析して簡約の概念を内包する議論の木構造(議論タイムスパン木)を導入する.
議論タイムスパン木は,音楽理論GTTM の楽曲分析のアプローチに基づいて獲得される ものであり,発言時間を各タイムスパンとし,重要な発言に関する階層構造を表現する.
本節では,この議論タイムスパン木の定義やその表現について検討する.
4.2.1 議論タイムスパン木の定義
本節では,議論タイムスパン木(DTS)の帰納的定義を示す(図4.1).時間幅を持つ発言 をUn(n=発言番号)とすると.初期段階では,UnがDTSとして構成される.これは,単 一の発言 Un が議論タイムスパン木を構成することを表す.帰納段階では,生成された DTSが2つの初期段階DTSで構成される2分木であることを表現する.生成される議論 タイムスパン木は,左から昇順に時間幅を持つ発言番号と対応づけられる.
さらに正確な木構造を表現するためには,枝と幹の従属関係を適切に表現する必要があ る.議論タイムスパン木では重要な発言を木の幹,そうでない発言を木の枝として,隣接 する2つの発言の従属関係を表現する.例えば,2つの発言DT S1 とDT S2 (DT S1 が DT S2 よりも先に生じた発言) が存在する場合,DT S1 が重要な場合は, 型の議論タ イムスパン木が生成され,DT S1 が木の幹,DT S2 が木の枝として表現される.対して DT S2が重要な場合は, 型となる.図4.1下段左の例では,DT S1 がDT S2 に対する
4.2 情報構造化のための理論的枠組みの構築 39