Project Next NLP 概要 2014/3 – 2015/2
関 聡
ニュ 大学
本稿 「014 」 言語処理学会第 「0 回 次大会ワ プ 自然言語処理 発展 向 情報共 討論 議論 発端 始 Pちぞ一ご続下 3ごで下 31P 活動 う 「015 」 言語処理学会第 「1 回 次大会ワ プ 析ワ プ 兼 Pちぞ一ご続下 3ごで下 31P 報
告会 以降 析 WS 呼ぶ 直前 活動 報告 本プ
後 予定 あ 様子 以 HP 逐次 プ い 予定 あ Pちぞ一ご続下 3ごで下 31P :し下下た上野//上じ下ご上.gぞぞgせご.続ぞぜ/上じ下ご/たちぞ一ご続下そごで下そせた/
「. 背 景
本プ 背景 目的 以 う 述 い
科学技術 下ちじ戒せ 戒そ正 ごちちぞち 進展 間 いあ 下ちじ戒せ 戒そ正 ごちちぞち 科学技術 効率的 発展 偶然 産物 求 無作 試行 繰
返 ごちちぞち 深 析 次 効 下ちじ戒せ プ 要 あ 々
考え い
自然言語処理 技術 様々 応用 目指 進 1重60 代 対話技術 70 代 情報検索技術 里0 代 情報抽出 要約技術 「000 頃 質問応答 盛
研究 応用 精度 60%程度 後 以
精度向 見 い 新 応用 求 移 来 いう歴史 あ 重0
代 始 大規模 元 経験的 手法 新 展開 生 統計手法や
機械学習 巻 込 発展 実 未 60% 精度 必要 い
体 見え い 言い い状況
問題 体 明 様々 言語処理技術 い
析 行い 次 対処 課題 明確 非常 要 思い 言語処理技術
各領域 い 析 個 研究 部 個々 研究者 行 い
ほ 特定 特定 手法 対象
手法 固 問題 混在 形 課題 明 プ
い 複数 析 行う い 共通
要 問題 明 い い 考え 多
析 時 行う 自然言語処理全体 問題 列挙 考え
う 大規模 解析 過去 経験 う 結果 得 や い
い部 あ 後 自然言語処理研究 方向性 決 要
間 い い 思わ 人 多 研究者 回 ワ プ 参 い
自然言語処理研究 次 展開 い 期待 い
複数 自然言語処理技術 析 いう 側面 横断的 自然言語処理 いう 関係性 関係性 全体的 技術 方向性 探
本プ 目的 あ
析 関連 電動 火装置 鉛 ソ ン ン 発明 発明
関 言 格言 多 残 ン 以 言葉 引用 い
記 言葉 析 地 行う者 心強い 特 「 番目 言葉 全体調整役
プ 運営 い 筆者 常 心 留 い言葉 あ
自然言語処理 研究者 失敗 要性 必然性 充 理解 い 思う 人間 言葉 営 ン ュ 工学的 実現 う い 自然言語処理技術 研究開発 組 い
々 失敗 目標 い 人 満足 精度 動 い 毎日経験 い
満足 い精度 出 い限 原因 あ 析 精度向
目指 あ 論文 提出 研究資金 得 評価型 ン い
い 績 注意 払い過 い 時 失敗 要性 い
い う ? 失敗 色々 失敗 方法 あ あ 注意 払 い
う ?自 込 研究活動 省 以 う 疑問 湧い
以 個人的 経験 基 記 疑問 い 少 考え い 話 内容 以 文章 個人
的 う 形 い 容赦願い い
1 あ 英語 美 い 引用 以 う 日本語 表現 あ う 挑戦 挑戦 挑戦
失敗 問題 い 問題 失敗 後 再度挑戦 失敗
999 回失敗し 1 回うまくいけ いい そ 発明家 失敗 うまくいく 練習 考え い 成 99 パーセント 以前 失敗 上 築
失敗 事を恥 べ く そ 原因を明 為 あ ゆ 失敗を 析 べ
あ 事を良く教え 必要 あ 失敗 いう事 こ 世 重要 教育科目 一
つ
It doesn、t matter if とou trと and trと and trと again, and fail. It does matter if とou trと and fail, and fail to trと again.1
々 手 失敗 い う ?
! 慣 い い う ?
! 本質的 い精度向 満足 い い う ?
! 何 本質 見失 い い う ?
! 難 い問題 避 次 目新 い課題 移 い い い う ?
慣 い い う ?
自然言語処理 解析精度 向 い 特定 ン 形態素解析 重里% いう高い精度 得
い 固 表現抽出 重0% 超え い 般的 人間 ン 比較 凌
駕 い いう報告 耳 常 人 満足 精度 得 い い
要素技術 あ 照応解析や 応用技術 あ 情報抽出 情報検索 翻訳 精度 60% いう
う 数 い う ?例え う 精度 い
いう 商用 使わ い 々 誇 果 あ うや 工
学的 応用 見 人 作 々 目標 あ
60% 65% 大学 研究者 応用 十 精度 い
う 満足 良い あ う ? 通過 あ う 精度 裏返 言え
率 慣 い い う ? 々研究者 人間 言語 営 ン ュ 工
学的 実現 目標 あ 十 い精度 満足 い い 常 自問 必
要 あ う 思う
本質的 い精度向 満足 い い う ?
ン 比較 達 値 X% 提案手法 効性 証明 いう文言
締 い 論文 目 自然言語処理 始 学生 練習問題
あえ う 素性 効 調 実験 いう位置付 あ 問題
い 比較 ン 提案手法 対 内容的 関係
う 精度向 本来 実験 目的 い 効果 あ 析
後 種類 残 い わ い限 本質的 精度向
う 断 い 精度向 提案手法 目的 い 精度向
ン 特異的 間 い ンプ い
精度 向 い結果 中 提案手法 解決 う い 課題 多 残 い い 実際 自身 あ 基 い 情報抽出 実験 統計的 意差 あ 精
度向 得 後 実験結果 析 や 偶然性 言い う い理
精度 向 い あ 論文 書 者 う 析 怠 や
義務 あ う 少 困 里 程度 頭発表論文 あ
査 者 追 や著者 確認 わ 統計的 意差 あ 良 いう
論文 通 う あ う 疑問 持 う う 論文 経験
実 往々 あ 自 込 々 論文 通 目標 研究 い わ
々 言語活動 工学的 実現 本質的 高い精度 出 手法 実現 目標 到 う い わ あ あ 意味 論文 副産物 過 い 例え 機械 学習 使 様々 素性 数多 実験 特定 対 行え 適当 散 従
精度 向 素性 あ あ う 結果 本質的 言語処理 精
度向 貢献 あ 言え い
何 本質 見失 い い う ?
々 多 人間 言葉 営 ン ュ 工学的 実現 目標 い
う 自然言語処理研究者 機械学習 あ 目的 い 機械学習
いう 非常 興味深 魅惑的 研究 あ 自身 研究
立場 行う必要 あ 機械学習研究者 応用 自然言語処理 あ
いう 自然言語処理研究者 機械学習 使う いう 全 異
例え X いう機械学習手法 Y いう機械学習手法 方 あ 効
う 結果 機械学習 研究者 対 益 い証拠 提供
あ 自然言語処理研究者 結論 得 い 自然言語 本質
見失わ い 見 要 あ
思い出話 筆者 博士 学生 ニュ 大学 ュ ン教授 え
最初 構文解析 音声認識 精度 向 いう あ 時
A(1 会長 経験 い ュ ン教授 最初 ン 持参 厚い紙
束 」0 発話 対 音声認識結果 3 結果 確 3=5 自 手 構文解析 結果
あ 析結果 使 研究 う 意味 限界 持 いう 明 プ
始 う 析 や技術 本質 見 い 必要 あ 思う
見 作業 大変 あ 公開 目指 ン
作業 ン 標準 ニュ 作業 大変 十 わ い
作業 省い 自然言語処理 本質 見極 可能 あ 構築
い 様 あ 出力 結果 中 特 自 目 頭
析 原因 い 深 考え 作業 自然言語処理 研究 中 思 い
難 い問題 避 次 目新 い課題 移 い い い う ?
自然言語処理 対象 課題 図 提示 図 1重60 代 対話処
理 70 代 情報検索 里0 代 情報抽出 自動要約 00 代 質問応答 新 い課
題 提案 研究 盛 10 い 時間 60%程度 精度 到
以 進展 見 い 研究 火 次 課題 移 い いう状況 表 い 最近 「000 頃 質問応答 新 い課題 情報検索 引 形 提案 IB2 ワ ソン あ 程度 見 火 い 状況 認識 い 10 い 研究 60%
到 後 火 あ う ?個人的 意味 いう 共通 問題
内包 殻 固い卵 あ 壊 い 衰退 い 状況 い 考え い
ン 析対象 い 文章 現 い情報 人間 文章 理解
頭 中 入 い 世界知識や常識 う 文章 理解 必要 い
あ 問題 自然言語処理研究 研究対象 い 捉え
形式 い問題 あ 現状 挙 い 課題 義語 意味 階層 固
ン ン 語義 曖昧 プ 挙
い あ う う 課題 奥行 あ 興味深い問題 あ 論文 議論 譲 い
図 . 自然言語処理 移 変わ 意味 課題
対 自然言語処理 発展 向 情報共 討論 ワ プ 乾氏 以 う
述 い 通 あ 乾氏 議論 本プ 支柱 あ
意味 問題 踏 込 研究 関 氏 言う う 簡単 い 最大 原因
意味 いう 卵 中 あ いう 60% 課題 あ 多様
個 的 あ い いう印象 持 い 照応解析や含意関係認識 実際
解析誤 見 何 源的 問題 あ 解 気 精度
いう構造︎ い 訳 う う あ 60% ン
語彙知識や因果関係 プ 世界知識 関わ 思い浮 ぶ類い 問題 他 実 多様 問題 少 顔 見 数 計算 問題 時空間 推論 問題 領域
慣習的 知覚 問題 雑多 問題 少 混
い 誤 蓄積 精度 伸 い う解法 必要
あ 解法 作 関わ 現象 元 照応解析
や含意関係認識 評価用 わ 含 い 解 混 い
全体 精度 寄 定 的 測定 大抵 場合極 困難 あ
元気 出 い 特定 問題 含 う 作 う
自然 ンプ 多 あ う い い い
う 60% 問題 性質 う雑多 課題 集 組 合わ
個 解決 う 効果 測定 自然 作
難 い 研究 進 い いう状況 あ い 最初 述 自然言語処理 境界 融解 傾向 拍車 可能性 あ 言語 意味 問題 踏 込 い
要 あ 何 難 い 深 理解 い 力
踏 え 研究 方法論 議論 求 い う 思わ
」. 活 動 内 容
本プ 活動方針 自然言語処理 ャ 思わ 複数 対 時
析 行う 複数 参 者 募 複数 析 行
い い 全体 得 文政 非常 多
析担 い あ 自然言語処理技術 後 方向性 見 知見 蓄積
い 設定 18 種類 各 以 通 あ 敬称略
基 礎 技 術
形態素解析 鍜治伸裕 東京大学 森信 京都大学 構文解析 河原大輔 京都大学
述語項構造解析 松林優 郎 東 大学 要 素 技 術
固 表現抽出 岩倉 哉 富士通研究所 照応解析 飯 龍 3I(T
言い換え 藤 篤 3I(T 語義曖昧性解消 新納浩幸 茨城大学
知識獲得 柴 知 京都大学 情 報 応 用
情報検索 難波英嗣 広島 立大
要約 高村大也 東工大 尾 3TT 西川仁 3TT 情報抽出 新 圭司 楽
ュ 解析 藤井敦 東工大 乾孝司 筑波大
Web 応用 岡崎直観 東 大学 荒牧英治 京都大学
東 宮尾祐 3II 横 3II 松崎拓也 屋大学
翻 訳 文作 支 援 対 話
翻訳 工藤拓 ニュ 奈良 端大
日本語構 山本和英 長岡技科大 鄭育昌 富士通研 英文校 水本智也 奈良 端大
対話 東中竜 郎 3TT 船越孝 郎 HRI
選出 経緯 以 通 あ 2014 WS 後 筆者 候補 連絡
担当者 指 担当者 各 析 方法論や可能性 考え い い
時 プ 立 考え い 自薦 推薦 い い
以外 立候補や他薦 形 就任 い い あ 2 1
連絡担当者 い 立 あ 立後 基本的
活動 主 あ 各 労 頭 思い あ 心 謝意 敬意
表 い 興味 持 い 者 集 議論 あ 非常 良い刺激
問題や課題 明確 方向性 見出 い 思
い 物理的 集 数回行 議論 100 通
超え い あ 特 多 参 者 集 活発 活動 わ い
あ 他 関連性や 析 要性 認識 機会 い
本プ 意義 あ 思う
個々 直接関係 い 就任 以 方々 願い 様々 機
会 貴 意見 指 賜 い 記 感謝 意 表 い 敬称略 賀沢 人
相澤 子 情報学研究所 黒橋禎 京都大学
藤恒昭 東京大学 奥村学 東京工業大学 佐藤理史 屋大学
鈴木久美 ソ
神門 子 情報学研究所 中村哲 奈良 端大学院大学 酒井哲也 早稲 大学 徳永健伸 東京工業大学 佐々木裕 豊 工業大学
浦峡 東京大学
本プ 全体調整役 東 大学 乾健 郎 ニュ 大学 関 聡 人 進 い
4. 活 動 内 容
本プ 「014 」 言語処理学会第 「0 回 次大会ワ プ 自然言語処理 発展 向 情報共 討論 議論 発端 現在 「015 」 言語処理学会第
「1 回 次大会ワ プ 析 WS い い 1里 立 各
活動 中心 あ 全体 通 活動 機会 5 回あ い 記載 活動
記録
4.1. 自然言語処理 発展 向 情 報 共 討 論 議 論 2014年 3 月 17 日 年次大会ワークショップ し 北海道大学
ワ プ 午前中 手 発表 あ 特 飯 氏 東工大:当時 松林氏
東 大 寧 作 析 要性 い 述 会
場 活発 議論 含 本プ 方向性 沿 非常 益 発表 あ
午後 発表 予定 い 筆者 発表 反響 本プ 全体調整
役 共 務 乾氏 昼食 本プ 基本構想 い 話 合
午後 予定 い 自身 発表 え 析ワ プ 構
想 い 発表 行い 聴衆 是非 問う 対 非常 前向 意見 多
出 構想 意義 確認 プ 着手 決意 ワ プ後 多
人 借 プ 設計 入 海 大学 ワ プ
Project Next NLP 生 親 あ ワ プ 企画 岩倉氏 富士通研究所 始 関係者 方々 心 感謝 表明 い
4.「. ン
2014年 5 月 19 日 情報学研究所 約 45 名 参 者
本プ 目的 全体調整役 2 大多数 方 他
興味 あ 方 参 得 ン 行 筆者 プ 構想 紹
対 質疑応答 各 紹 あ 情報交換 目的
機械翻訳 析 紹 氏 情報検索 析 過去
例 紹 酒井氏 共 目的 東 紹 横 氏 い い プ
議論 飯 氏 用意 析 意義 ン 要
性 難 い 述 プ 推進 関 提案 議論 中心 プ
進 方 初 試 あ 自主性 任 整合 後
整合 い う いう立場 共通 共通 基準 使い意味 あ 析 い う いう立場 意見交換 あ 現状 全体 瞰 可能 あ
全体 共通 基準 設 い いう現実 認識 思う
い 基準 横断的 見 意味 あ いう意見 表明
共通 使う意義 い 提言 あ 実際 うい 使う
自主性 任 既 良 あ 頑張
意味 あ あ 大 選択や内容 自主性 任 後
合わ 合わ い う いう共通認識 う 方針
4.」. ン
2014年 9 月 2 3 日 首都大学東京 南大沢キャンパス 60 名を超え 参 者
自然言語処理研究会 連 開催 非常 多 人 集 全 報告
あ 全体 瞰 いう意味 要 あ 思う 1 日目 半日 開催
う 2 時間 各 ン 行い 議論 い い 活
動 始 設計 活動 い 活動 報告
意見交換 行わ 後 1 日目 3 報告 2 日目 残 15
報告 あ 全体 議論 後 懇親会 BBQ 行い 議論
8 各 発表 い い 内容 多岐 渡 報告
至難 技 あ 乾氏 関 工藤氏 参 者 ン
集計 い い
乾氏 ン
目的 何
全容 知 い
- 種類 原因 い 体的 理解 深 - 間 共通 種類 原因 い 体的 理解 深 - 間 連携
- 前段 後段 う 響 - 後段 大間 い 前段 何 - ? 裏表?
- 振 舞い 析
- 誤 出 何 足 引 張 い - 手法 扱 い い現象 手 - 改良方向 究明
- う 解 う ? 何 手 う ? - 解(東 )
- 人間 誤 わ (松林 ) 析 (注釈付 ) 蓄積 共
- 通 揃 い 価値 - 誤 原因 累計 斉公開
析方略( 析 方法論) - 準備
- プ や あわ ?
- ういう 労 あ / プ 共 - ニュ
流 流 い
- 流 部 流 工程 類
- 流(基礎技術) 析 簡単 い
人間 誤 わ 析 要
関 ン
- 色々 あ
-- 流 他 責任 付 出来 い 言葉
表現 い問題 含 い
-- 流 流 融合体 あ 多 や現
状 見 非常 意義
--- 流 深い 新 い課題 見 十 気 回
要
-- 精度 い や標準 あ 新
い 析方法 う
-- 析 方法論 い 般的 あ 姿 共通 示 難 い や
必要 い う 列挙 大
-- 間 依 関係 あ 場合 関係 明示的 示 基 析 行 う 非常 要
--- 析結果 含 例 流 流 戻 対 流
析 非常 意義
--- 流 様 流 響 訳 調
要
- 析 何?
-- 析 いい ?
-- 複数 共通 析 理 い ?
-- 凄 単純 必要 技術 見極 方法論 あ
-- 全 用意 , 必要 技術 調 い いう方法
論 あ
--- 方法 析 言え い い 回 プ 目的
方法 十
- 析 種類 結果 出 ?
1) 類
2) 解決 方法 類 3) 現象 あ 列挙
-- 記 関連 あ う あ う 関連性 素晴 い
- 析方法論 模索?
1) 参 各人 々 析 持 議論
2) 少人数 類 決 従 大勢 析
行う
-- 長所短所 あ う 1 方法 議論 新 い発見 あ う
-- 種類 参 者 熟練度合い いい う い
工藤氏 ン
- ン 時間配 適 考察 全体討論時間
長い いう意見 あ 意差 い う
- 満足度 関 個 ン 全体会議 大 差 見 い 全般的 高 い満足度
- 間 視 い 方 多い 次回 WS 何 生
う 企画 求
- 析方法 確立 い い 多い 裏 返
析 い 多い?
- 解 再現 十 いう認識 多 人 共 い
- 次回 WS 全体討論会 ン 関連 間 中
規模 ン 期待 い
逆 規模 会議や ソン 人気 少 い 間 視 い 方 多い
期待 え う ン 中規模 ン
開催 考慮 い あ う
際立 言え 間 視 い 方 多い 裏
返
業 進 い 現状 満足 い い方 多い いえ 間
生 う
組 いう あ 析結果 参 者 共
第 歩 思い
余力 あ 組 益 恐縮
機械翻訳 組
現状 形態素解析や構文解析 足 い 再認識 う
4.4. 中間
2014年 11 月 15 日締
ン 熱い議論や活発 活動 維持 目的 中間
提出 願い 各 2 3
対 ン 依頼 最終的 11 中間報告 あ
対 ン 返信 最終的 析 WS 前
益 方向性 指針 い 幸い あ い中 ン
い い 皆様 心 感謝 い
4.5. 析 ワ プ
2015年 3 月 20 21 日 京都大学
言語処理学会 ワ プ 2 日間 わ 本プ 報告会 開催
各 1 間 活動報告 関係 ン 全体
ン ン ン 非常 楽 あ
5. 後
本プ え 定義 基 い え 対 参 者 作
評価 行 性能 比較 う 評価型プ 自身 作
い 丹念 析 経験 共 自然言語処理 研究者 対象 研
究者 協力 あ 良い 作 い う いう あ 1 活動
歩 踏 出 過 プ 形態 非常 大 可能性 秘 い
考え い 実際 熱意 持 進 い い 後 是非 い
い いう声 聞 い 18 行 や 方法 良い う プ
形態 い 慎 検討 析 プ 後 進 い い 個人
的 考え い 本プ 析 参 い 皆様 主役 あ 労
心 感謝 述 い 皆様 互い 学 合え 後 自然言語処理 発展 幸い あ
参 考 文 献
言語処理学会第 20 回 次大会ワ プ 自然言語処理 発展 向 情報共 討論
海 大学 2014. https://sites.google.com/site/nlp2014ws/