Files Project Next NLP

(1)

Project Next NLP

情報検索タスク

2014/9/3

難波英嗣 ( 広島市立大学 ) 酒井哲也 ( 早稲田大学 )

(2)

目的

「より良い情報検索システムを構築するために今後何が必要か」を、情報検索システムの出力結果のエラー分析を通じて議論し、明確にする。

従来の情報検索研究では、「提案手法の検索精度が、従来手法と比べてどの程度向上するのか」という点で議論されることが一般的。

本タスクでは、従来手法と比べてではなく、「現在の検索精度を ^100% に近づけていくにはどんな問題を解決しなければならないのか」を明らかにする。

(3)

目的

検索精度の向上には何が必要か？

• 述語構造解析、含意認識、意味解析などの自然言語処理 (NLP) 関連の諸技術？

• 外部の知識 ( 例えば、各種 Open Data 、オントロジーなど ) ？

エラー分析を通じて明らかにする。

(4)

(5)

(6)

利用可能なデータ

タスク対象文書システム出力

NTCIR-3-6 _{言語横断検索新聞} ◯(NTCIR-3, 5, 6) NTCIR-9, 10 INTENT Web ◯

NTCIR-1, 2 _論文検索 _論文概要

NTCIR-9 _音声検索 _{音声認識結果} ^◯

NTCIR-4, 5, 6 _{特許検索特許} ^◯ NTCIR-11 _{レシピ検索} _{料理レシピ} ^◯

NTCIR-4, 5, 6 Web _{検索 Web} ^◯(NTCIR-5)

(7)

既存データを使う上での検討事

項

• NTCIR 参加システムの実行結果が入手できたとしても、新しい技術で再検索しなおすべき？ ( 例えば、 NTCIR-6 CLIR タスクは 7 年前 )

• NTCIR 参加システムの実行結果が入手できないものについては、既存の複数の検索エンジンで代用？

　　　　　　↓

Terrier や INDRI などの検索エンジンの利用

(8)

テストコレクションの違い (1/

2)

構造が複雑な文書

• 料理レシピ： 3 階層のカテゴリ、料理名、レシピ名、材料リスト、手順

• 特許：発明の名称、請求項、明細（発明の分野、先行技術、課題、発明の効果）　　　　　　↓

　　　　　　　まずは構造が比較的適合度判定の粒度　　　　　　　単純な文書から

• 2 _{段階 ( レシピ )}

• 3 _段階

(9)

テストコレクションの違い (2/

2)

トピックごとの適合文書数の違い

• 1 _〜数文書

• _数十文書その他

• _{クエリの長さ、構造}

• _文書長

(10)

分析対象データ

タスク対象文書システム出力

NTCIR-3-6 _{言語横断検索新聞} ◯(NTCIR-3, 5, 6) NTCIR-9, 10 INTENT Web ◯

NTCIR-1, 2 _論文検索 _論文概要

NTCIR-9 _音声検索 _{音声認識結果} ^◯

NTCIR-4, 5, 6 _{特許検索特許} ^◯ NTCIR-11 _{レシピ検索} _{料理レシピ} ^◯

NTCIR-4, 5, 6 Web _{検索 Web} ^◯(NTCIR-5)

優先度

(11)

エラー分析に向けて

複数システムの結果の比較による分析

• すべてのシステムで検索できない文書を、まずは分析対象に (recall)

• すべてのシステムが間違って検索した文書はどんなもの？ (precision)

精度が一番高いシステムの分析

(12)

レシピ検索の分析

NTCIR-11 レシピ検索タスク（日英）検索クエリの例：

{“topicID”:“JA0003”,“dishName”:“ チキン / 南蛮” ,“foodNames”: [“ 肉類 / にわとり / むね” ,” 小麦粉 / 薄力粉“ ,” 鶏卵“ ,” 酒“ ,” みりん

“ ,” しょうゆ“ ,” 塩“ ,” こしょう“ ,” 酢“ ,” 砂糖“ ,” 赤唐辛子 / 輪切り "," たまねぎ "," ピーマン "," にんじん "],"negation":[" 油で揚げない "],"expla nation":[]}

クエリが異なるけれども間違えて検索される文書の存在

↓トピック横断的な分析

(13)

エラー分析をする上での観点

( _{になりそうなもの )}

• _{形態素解析}

• WSD

• _照応省略

• Entailment

• _情報抽出

…

(14)

RIA との違いを出す、というよりも、「 10 年前に提案された観点で今でも ( そして今後も ) 使えるものは何？」という観点からカテゴリを考えていきたい。

技術の進歩とともに変わる観点（カテゴリ）とそうでないもの

(15)

今後の予定

• 9 月中：検索環境 (Terrier, INDRI) の構築

• 11 月上旬：エラー分析のためのカテゴリの検討

• 12 月中旬：カテゴリに基づいたエラー分析

(16)

他のタスク ( 要約タスク ) との連携

Snippet _の評価

NTCIR-2 TSC-1

• _課題

– A-1 10,30,50%要約率の抜粋 ( 重要文抽出 ) – A-2 20,40% 要約率のアブストラクト

– B 検索結果の適合性判断のための要約

• 対象文書：新聞記事 ( 報道記事と社説 )

• _評価

– 内的な評価：人間が選択した重要文との一致度，主観評価 – 外的な評価：情報検索タスクに基づく評価．

(17)

Snippet _とは

(18)

情報検索タスクに基づく外的な評価

被験者に検索要求とその検索結果としてテキストの要約を提示．被験者は，各要約を読んで，その要約が検索要求に合っているかどうか判断．被験者が判断をうまく行えた度合いにより評価．

(19)

エラー分析の観点の分類

• _{時間的な変化}

• _{言語依存の問題}

• _{他のタスクとの関連性}