• 検索結果がありません。

エラー分析ワークショップ Project Next NLP SekineSlides

N/A
N/A
Protected

Academic year: 2018

シェア "エラー分析ワークショップ Project Next NLP SekineSlides"

Copied!
29
0
0

読み込み中.... (全文を見る)

全文

(1)

エラー分析ワークショップ

(兼 Project Next NLP  報告会)

2015 年 3 月 20­21 日

関根聡

https://sites.google.com/site/projectnextnlp/

(2)

動機

 我々は上手に失敗しているだろうか?

(3)

動機

 我々は上手に失敗しているだろうか?

エラーに慣れてしまってはいないだろう

か?

精度が 0.8 程度あり、システムは

十分実用的であると考えられる。

(4)

動機

 我々は上手に失敗しているだろうか?

エラーに慣れてしまってはいないだろうか?

本質的ではない精度向上に満足していない

だろうか?

  実験結果を表 2 に示す。提案手法で

の NE の抽出結果は、適合率が X% 、

再現率が Y% であり、 F 値は Z であっ

た。いずれもベースラインの結果より

高く、提案手法の優位性を確認した。

(5)

動機

 我々は上手に失敗しているだろうか?

エラーに慣れてしまってはいないだろうか?

本質的ではない精度向上に満足していないだ

ろうか?

何が本質か見失っていないだろうか?

A の素性を加えた実験では、精度が X% 高く、その

有効性が確認できた。

SVM と MaxEnt の方法を比較した場合、 SVM の方

が Y% 高く、本タスクでは SVM が適しているこ

とがわかった。

(6)

動機

 我々は上手に失敗しているだろうか?

エラーに慣れてしまってはいないだろうか?

本質的ではない精度向上に満足していないだ

ろうか?

何が本質か見失っていないだろうか?

難しい問題を避け、次なる眼新しい課題に

移ろい続けていないだろうか?

(7)

Problem egg

(新たなタスクに移ろっているだけではないか?)

Understanding

IR

(’70s~)

IE

(’80s~) Summarization

(’80s~)

Sentiment

(’05s~)

Q&A

(’00~)

Dialogue

(’60s~)

Syno nym

Names

Ontology Paraphrase WSD

Scrip t

World Knowledge

Metaph or

Grounding Sit ua tion

(8)

Problem egg

Understanding/Semantics

IR

(’70s~)

IE

(’80s~) Summarization

(’80s~)

Sentiment

(’05s~)

Q&A

(’00s~)

Dialogue

(’60s~)

Syno nym

Names

Ontology Paraphrase WSD

Scrip t

World Knowledge

Metaph or

Grounding Sit ua tion

(9)

これまでのエラー分析

 各論文、各研究単位では行われてきた

システムや手法に固有の問題は分析できる

タスクに本質的な問題は?

言語処理に本質的な問題は?

 

(10)

目的

 エラー分析を通じて自然言語処理の本質

的な課題を明確にする

複数のシステムのエラー分析を重ね合わせる

複数のタスクのエラー分析を重ね合わせる

 エラー分析の技術の進展

 エラー分析データーの蓄積

 エラー分析を通した課題の整理、発見

(11)

プロジェクトの進め方

NLP のタスクごとに分析を行う (全1

8タスク)

 分析方法は各グループの自主性に任せる

それぞれのタスクで事情は異なる

共通の軸を予め設定できない

(12)

分析の進め方

リーダーを中心とした各グループで自主性に推進

例えば。。。

1)現在のそれぞれのシステムを持ち寄って同じタスクに対してシステ

ムを走らせ、共通な対象についてのエラーを分析する。

2)違った対象に対してそれぞれのシステムを走らせて、そこで得られ

た違った種類のエラーを集めてそれらを分析する。

3)システムを走らせず、どのような知識が必要かを人手で挙げる。

4)誰かのシステム( Public domain でも)を走らせて皆でエラー分析

をする。

5)12月に行われる NTCIR の参加者が結果のエラー分析する。

6) NTCIR から提供されている過去のタスクのシステム結果を分析す

る。  7)評価型ワークショップを新たに行い、その結果をもってエラー分

析をする。

8)。。。

(13)

タスクとリーダー

基礎技術

形態素解析 鍜治伸裕(東京大学)、森信介(京都大学) 構文解析 河原大輔(京都大学)

述語項構造解析 松林優一郎(東北大学) 要素技術

固有表現抽出 岩倉友哉(富士通研究所) 照応解析 飯田龍( NICT)

言い換え 藤田篤( NICT ) 語義曖昧性解消 新納浩幸(茨城大学)

知識獲得 柴田知秀(京都大学) 情報アクセス応用

情報検索 難波英嗣(広島市立大)

要約 高村大也(東工大)、平尾努( NTT )、西川仁( NTT ) 情報抽出 新里圭司(楽天)

レビュー解析 藤井敦(東工大)、乾孝司(筑波大)

Web応用 岡崎直観(東北大学)、荒牧英治(京都大学)

東ロボ 宮尾祐介( NII )、横野光( NII )、松崎拓也(名古屋大学)   翻訳、文作成支援、対話

翻訳 工藤拓(グーグル)、グラム・ニュービッグ(奈良先端大) 日本語校正 山本和英(長岡技科大)、鄭育昌(富士通研)

英文校正 水本智也(奈良先端大)

対話 東中竜一郎( NTT )、船越孝太郎( HRI )

(14)

活動

2014年3月: 年次大会 WS  (北海道大学)

データ分析、エラー分析の重要性議論

プロジェクト発足

5月19日:キックオフミーティング (情報学研究所)

プロジェクトの進め方の議論

9月2、3日:ミッドタームミーティング (首都大学東京)

各グループで集中討論(1日目)

各グループの報告(2日目)

11月:中間報告レポート

進捗報告

アドバイザーからのコメント

3月20、21日:言語処理学会年次大会 WS  (京都大学)

5月11/21日:論文誌特集号締め切り

(15)

これまでのエラー分析

 各論文、各研究単位では行われてきた

システムや手法に固有の問題は分析できる

タスクに本質的な問題は?

言語処理に本質的な問題は?

 

(16)

言語処理における本質的問題

(議論の参考に)

「世界」と「言葉」の対応

Prof. Ido Dagan (Bar Ilan Univ.) 

http://nlp.cs.nyu.edu/sk­symposium/

(17)
(18)

世界

言葉

(19)

世界

言葉

世界は点の集合なのか?

汎化をどうするか?

といった問題はとりあえず置いておい

て。。。

(20)

世界

言葉

言語解析基礎、要素技術

形態素解析

構文解析 述語項構造解析

固有表現抽出

照応解析

入力文

(21)

世界

言葉

言い換え

(22)

世界

言葉

情報アクセス

情報検索 情報抽出

レビュー解析

Web 応用

質問応答 (東ロボ)

テキスト

情報要求

(23)

世界

言葉

語義曖昧性解消

 単語/表現

(24)

世界

言葉

翻訳

入力テキスト 出力テキスト

(25)

世界

言葉

要約

入力テキスト 出力テキスト

(26)

世界

言葉

文校正

誤り 正解

(27)

世界

言葉

対話

 人間発話  マシン発話  人間発話

(28)

世界

言葉

知識獲得=

言葉と世界の関係を求める

世界の点の関係を求める

(29)

最後に

タスクリーダー、参加者の方、本当にお疲れ様でした

このワークショップでは、これをあと17回繰り返す

ことなく、17倍(以上)の知識を得られます

自分のエラー分析の経験を基に、様々な質問、議論を

してください

そして、何かを学んで、研究室に帰ってからの自分の

研究に役立ていただければ幸いです

参照

関連したドキュメント

の応力分布状況は異なり、K30 値が小さいほど応力の分 散がはかられることがわかる。また、解析モデルの条件の場合、 現行設計での路盤圧力は約

重回帰分析,相関分析の結果を参考に,初期モデル

従来より論じられることが少なかった財務状況の

カウンセラーの相互作用のビデオ分析から,「マ

を塗っている。大粒の顔料の成分を SEM-EDS で調 査した結果、水銀 (Hg) と硫黄 (S) を検出したこと からみて水銀朱 (HgS)

テキストマイニング は,大量の構 造化されていないテキスト情報を様々な観点から

一部の電子基準点で 2013 年から解析結果に上下方 向の周期的な変動が検出され始めた.調査の結果,日 本全国で 2012 年頃から展開されている LTE サービ スのうち, GNSS

FSIS が実施する HACCP の検証には、基本的検証と HACCP 運用に関する検証から構 成されている。基本的検証では、危害分析などの