Project Next Summarization
Midterm Meeting
高村大也(東工大) 西川仁(NTT) 平尾努(NTT)
あらまし
• 自動要約の評価の現状
– 自動要約とは – 評価の評価 – データ
– 要約器
• 要約タスクグループの現状
– 目標
– プロセス
• まとめ
自動要約
• 原文書における重要な情報を保持しかつ 読みやすい文書を機械的に作成
• 単一文書要約/複数文書要約
自動要約
• 評価のためには3つが必要
– 評価の方法 – 要約器
– データ
要約の評価
• 大きく2つにわかれる
– 内容的品質
• 原文書に含まれる重要な情報を含んでいるか
– 言語的品質
• 文章としてどうか
– これらの誤りは必ずしも独立ではない
• 大まかな評価の方針は知られているが、体 系的ではない
内容的品質 (1/3)
• 参照要約(正解)が必要
– 参照要約に含まれる情報(モノ,コト)を要約 システムが抽出に失敗した原因を探る
• 抽出単位の検討
• どのようなインフラ(解析器)が必要かの検討
– discourse parser, coreference resolver, semantic role labeler …
• テキスト間の類似度尺度の検討
内容的品質 (2/3)
• モノ(entity),コト(event)
• Summary Content Units (Nenkova+ 04)
– 原文書に含まれる述語項構造相当の情報を人 手で注釈づけ
– 言い換えなども吸収
• Basic Elements (Hovy+ 06)
– 名詞句、動詞句を自動で抽出、それを要約の 単位とするもの
内容的品質 (3/3)
• 原文書に含まれる、重要だと思われる単 位が、要約に含まれないのはなぜか?
– 特徴量の不足
• 形態素解析の誤り、NERの誤り
– 不適切な重みの値
• 学習データの不足
言語的品質 (1/3)
• 参照要約は必要ない (と思う)
– DUCのquality questions が参考になる
• 1文内での文法誤り
– 文短縮を利用する場合のみ
• 参照表現解消に関する誤り
– 参照表現の指すモノが原文書と同じか
• 結束性/一貫性に関する誤り
– 原文書と同じ内容を伝えられるか? – 文の順,文頭の接続詞
言語的品質 (2/3)
• 文短縮
– ダボス会議を主催するスイスの民間研究機関、 世界経済フォーラムが3日発表した2014 年版の国際競争力ランキングで、日本の順位 は前年より三つ上がり、6位になった。
(2014年9月3日 YOMIURI ONLINE
http://www.yomiuri.co.jp/economy/20140903‐OYT1T50085.html?from=hochi より引用)
• 係り受け解析の失敗等の理由によって非 文法的な文が生成されることがままある
言語的品質 (3/3)
• 先行詞がない要約
– そこでバルト諸国はあらためて軍事的…
• ゼロ代名詞の問題
– A首相がB国に訪問。C大統領と会談。
– D官房長官は成果を強調。今後の予定を公表。
• 文意が変化する…
– A首相がB国に訪問。今後の予定を公表。
• 自動要約においては致命的
要約器 (1/2)
• 公開されており、広く用いられている何ら かの要約プログラムは(日本語において は)存在しない
– 個別の実装が個々の研究グループによって保 有されている状況
要約器 (2/2)
• 要約タスク参加者の保有する要約器は 様々
– 日本語/英語
– 単一/複数文書要約
– 新聞/レビュー/ツイッター
• 各参加者が保有する要約器をまずはその まま利用して要約を作成
データ (1/2)
• 万人がすぐに入手できるリソースはない
• TSC‐1/2/3
– 日本語の単一/複数文書要約データ
– 毎日新聞コーパス、読売新聞コーパスがデー タの復元に必要
• DUC‐2002/2003/2004
– 英語の単一/複数文書要約データ – 広く使われている
データ (2/2)
• 現時点では同一のデータに対して要約を行 うということはしない
– 参加者内で英語向けに開発された要約器と日 本語向けに開発された要約器が混在
• 単一のデータに対して要約を行い分析を行 うかは今後平行して議論
自動要約の誤り分析
• 誤り分析をどう行うかは難しい課題
– 不明瞭な正解と分析方略の不在
• 評価及び誤り分析のために大量の文書を読む必要
• 何が要約に含められるべきか自明ではない
– 2つのサブタスク
• 単一文書要約と複数文書要約では期待される要約 の性質が異なる
– 前提とする解析器も様々 – 言語、ドメインの問題も
目標
1. 要約器出力の分析方略の確立
– 現時点では要約器出力を分析する体系的な方 法論は存在せず、これを開発したい
2. 要約アルゴリズムの改良方向の究明
– 集中的に改良を行うべき点の特定
3. 自然言語解析へのフィードバック
– 要約生成における自然言語解析の影響の分析
現時点では目標ではないもの
• ベースライン要約器の準備と利用
– 多様な要約器での分析の方が今回の目標には 有効
• 要約コーパスの作成
– BCCWJ の一部記事に対して要約を付与
– 英語を対象に要約研究を行っているメンバー が少なくない
– 要約作成の困難さ
• これらは継続して議論
プロセス
1. 進め方の議論 (6月∼8月) 2. 予備分析 (9月)
3. 本分析 (10月∼11月)
4. 分析方略の作成 (11月) 5. 再分析 (12月∼1月)
6. まとめ (2月)
プロセス (1/6)
• 6月から8月にかけてメールで進め方を議 論してきました
• 今日、お話差し上げるよう内容
プロセス (2/6)
• 予備分析(9月)
• 一部のメンバーで、ごく少数のデータを手 持ちの要約器で要約
• 要約結果をどのように分析できるか検討
• 検討結果をメンバー全体に共有
プロセス (3/6)
• 本分析 (10月∼11月)
• 予備分析の結果を踏まえ、要約器を保有する 全てのメンバーで分析を実施
• 分析の際には各メンバーが手持ちのデータで 分析を実施
– 特に、特定のデータを用意し全員がそれを要約す る、といったことはしない
– タスクも単一/複数文書要約両方を実施 – ドメインは新聞に限定
– 言語は絞らない
プロセス (4/6)
• 分析方略の作成(11月)
• 各メンバーの本分析の結果を突き合わせ、 どのような分析ができるのか、あり得る のかを調査
• それらから分析の方略を作成 (目標1)
– ある種の分析ガイドライン
– どのような順序でどのような分析をすればい いのか
プロセス (5/6)
• 再分析(12月∼1月)
• 再び手元のデータを手元の要約器で要約
• 作成した分析方針で要約結果を分析
プロセス (6/6)
• まとめ(2月)
• 再分析の結果を集計
– 分析方略の精緻化(目標1)
– 集中的に改良を行うべき点を特定(目標2) – それを踏まえ、自然言語解析へのフィード
バックを作成(目標3)
• 3月のワークショップを準備する
メンバー (敬称略)
• 浅原正幸(国語研)
• 小林一郎(お茶大)
• 嶋田和孝(九工大)
• 高村大也(東工大)
• 難波英嗣(広島市大)
• 西川仁(NTT)
• 野本忠司(国文学資料館)
• 平尾努(NTT)
• 森田一(京大)
• 山本和英(長岡技科大)
まとめ
• 要約タスクグループの現状
– 分析の進め方について方針を決定
– 要約器、データについては現状手持ちのもの で対処
• 自動要約の評価の現状
– 内容的品質と言語的品質に分割