– 係り受け情報を用いない素性
2. 1 + 係り受け
– 述語と格要素候補が1-3の深さで係り受け 関係にあるか
3. 1 ‒ 正解格フレーム
– どの述語がどの役割の格要素を文(内|外)に 持つか
4. 1 ‒ 正解格フレーム + 係り受け
党: y 存亡:を け:た 実現:
fi 取 組
民主: ベ :新党
y 構想:
社会党:S y 今年 y
intra‒wo
? intra‒ga
?
係り受けなし (1) vs 係り受けあり (2)
Criteria
DEP
Z‐INTRA
Z‐INTER
ALL
P
R
F
P
R
F
P
R
F
P
R
F
ga
1
91.27 59.58 72.09 53.64 27.37 36.25 21.81 10.25 13.95 72.45 34.20 46.47+
Dep. (2)
89.17 68.01 77.17 60.58 19.05 28.99 22.27 9.86 13.67 76.11 35.95 48.83Wo
1
97.80 83.77 90.24 55.43 26.77 36.10 19.61 2.42 4.31 94.20 72.41 81.88+
Dep. (2)
96.98 85.34 90.79 58.17 18.91 28.54 22.02 2.91 5.14 94.64 72.57 82.15Ni
1
97.55 84.27 90.43 43.40 27.06 33.33 19.72 5.43 8.51 90.23 68.28 77.73+
Dep. (2)
96.93 84.88 90.51 46.84 20.94 28.94 22.78 6.98 10.68 91.04 68.14 77.95ALL
正解格フレームあり (1) vs なし (3)
Criteria
DEP
Z‐INTRA
Z‐INTER
ALL
P
R
F
P
R
F
P
R
F
P
R
F
ga
1
91.27 59.58 72.09 53.64 27.37 36.25 21.81 10.25 13.95 72.45 34.20 46.47‐ CF (3)
92.77 51.83 66.50 48.58 18.14 26.42 16.20 5.62 8.34 73.60 27.72 40.28Wo
1
97.80 83.77 90.24 55.43 26.77 36.10 19.61 2.42 4.31 94.20 72.41 81.88‐ CF (3)
98.47 77.76 86.90 45.38 14.94 22.48 20.93 1.09 2.07 94.76 63.66 76.16Ni
1
97.55 84.27 90.43 43.40 27.06 33.33 19.72 5.43 8.51 90.23 68.28 77.73‐ CF (3)
69.14 35.99 47.34 44.74 8.00 13.57 23.53 1.55 2.91 67.72 29.30 40.90ALL
1
94.66 70.64 80.91 53.34 27.27 36.10 21.67 9.06 12.78 81.83 46.64 59.4133
係り受けなし (3) vs 係り受けあり (4)
(正解格フレームなし)
Criteria
DEP
Z‐INTRA
Z‐INTER
ALL
P
R
F
P
R
F
P
R
F
P
R
F
ga
‐ CF (3)
92.77 51.83 66.50 48.58 18.14 26.42 16.20 5.62 8.34 73.60 27.72 40.28‐ CF + Dep (4)
89.67 64.07 74.74 50.50 9.50 15.99 14.29 4.84 7.24 76.88 30.74 43.92wo
‐ CF (3)
98.47 77.76 86.90 45.38 14.94 22.48 20.93 1.09 2.07 94.76 63.66 76.16‐ CF + Dep (4)
96.58 79.40 87.15 38.10 5.67 9.86 22.73 0.60 1.18 94.39 63.20 75.71ni
‐ CF (3)
69.14 35.99 47.34 44.74 8.00 13.57 23.53 1.55 2.91 67.72 29.30 40.90‐ CF + Dep (4)
68.17 33.12 44.58 54.55 1.41 2.75 7.69 0.39 0.74 67.58 25.42 36.94ALL
本システムが特徴的に正解した例
• 最初に「は」を伴う「首相」が以降の文の動作主
– 最初のガ格はそれ以降の文でガ格になりやすい
• ニ格が存在することを当てるのが難しい
– 正解格フレームの影響
村山
[ga:
首相]
は日米だけでなくアジア・太平洋地域を[p:
にらんだ]
安 全保障面での日米の協力の重要性を表明[p:
する]
。また、経済問題に ついては日本経済の構造変革のため規制緩和に積極的に取り組むと[p:
訴える]
。さらに回転運動の特徴から、円盤の
[ni:
内側]
に太陽の三千六百万倍も の質量が存在[p:
する]
ことが明らかになった。本システムが特徴的に誤った例
• 係り受けがあれば解ける
• 分類器が独立のためシステム全体のRecallが低い
[ga:
自民党]
は昨年暮れから柿沢氏や大内啓伍元民社党委員長ら自由 連合のメンバーに統一会派結成を[p:
働きかけて]
きた。システム出力
[ga: null]
この結果、中心核に秒速約千キロの超高速で回転する外径一・六光年、
内径〇・八光年の分子ガス円盤がある
[ga:
こと]
が[p:
わかった]
。 システム出力[ga: null]
係り受けとの整合
• 内省した場合、「意地でも新作を出し続 けることが、歌手のあかしなんです。」
– この本来の順序で係り受けがあれば簡単
– 話し言葉ではしばしば左から右に係るという 仮定が成り立たない
– 分詞構文はまた話が別
「歌手の
[p:
あかし]
なんです。意地でも新作を出し続ける[ga:
こと]
が。自分で音楽をやっている、燃えている、という充実感があるのは 新作なんです。もうひと花咲かせるためには継続してなきゃだめなん ですよ」システム出力[ga: null]
まとめ
• 係り受けの述語項構造解析に対する寄与 はそこまで大きくない
– 述語項構造解析を意識した係り受けの基準
(または変換規則)が必要では?
• 前段の処理における思想と後段のアプリが期待す る前段処理の出力にギャップがあるのでは?
• 格フレームを当てることが(特にニ格の 解析に)非常に重要
– SRLにおいて述語語義を当てることが必要と いう知見と一致
述語語義の曖昧性も前段階で処理して欲しい
はNP 精度 い
直接係 受け関係 あ 事例 お
Projらct nらォt ー分析
林部祐太 京大
はNP 解析
• 構文・格解析 フ
– ー を用い 入力文 対す 構文・格構造 候補を絞 込
– そ 候補 対し , コーパスやWどて
取得した統計値を用い 最良 構文・格構 造 生成確率を 木を出力
• 照応解析 ‒anapれora プション
– 係 受け解析結果 維持
– ー 基 く共参照解析→ ー 基 く
共参照解析
はNP 精度計算 留意点
• 共参照関係 扱い
– NづIST キス コーパス 項 さ い
け ,例えそ 共参照関係 あ た し ,今回 精度計算 解析 ス し 扱
い
• 述語 位置 種類
– はNP ー 基 い 決定
– 他 シス 述語 位置 るo」よを使用
• らる:国民 [p:広くめ 開 た姿勢を 法務当局 要望
したい が形容詞述語 し アノ ーションさ い
い
はNP け 省略解析 有無 影響
全体F値 ガ 動詞述語 ヲ ニ 構文格解析 49.。1 、、.。3 52.3。
省略解析 35.3。 62.94 44.12
文内ゼロF値 ガ ヲ ニ
構文格解析 6.95 3.。3 、.0
省略解析 21.、、 9.04 23.、1
文内非ゼロRec ガ ヲ ニ
構文格解析 、6.02 5、.16 、5.44 省略解析 4。.69 50.01 6。.93
省略解析す 全体精度 下
文内ゼロ 項 精度 上
省略解析 精度向上案
• 談話解析 モ さ 候補 統語的 素性 を追加
• 格解析 結果 談 話解析 結果 ち 良い
を直接比較し 最終的 項を決
直接係 受け関係 あ 事例 ー分析1
• 連体修飾
– 昨年十二月初 行 た前回 調査
支持率 三ポイン 下 チ チ ン進攻 対す 国民 強い不満を反映[p:し ため[るa:結果め い
• づ て
– 今回 国際サッ ー連盟[p:承認め [o:大 会め 5大陸 関係者 集ま い た ロビー活動 絶好 機会
格助詞を伴わ い係 受け
直接係 受け関係 あ 事例 ー分析2
• 推論 必要
– パチンコ店 顔見知 中国人[o:男性め を 致し そ 兄 身代金六十万円を取 た し 神奈川県警捜査一課 加賀町署
十一日 横浜市中区弥生町一 無職 呉国明
▽同 同 呉国飛 両容疑[sオs‒o:者め を身代 金[p:誘拐め 容疑 同区 パチンコ店員 林 同云 同区大和町一 無職 川島辰雄 両容 疑者を恐喝容疑 逮捕した
他 述語項構造を利用
ま
• はNP 省略解析
– 省略項 解析精度 上
– 係 受け関係 あ 項 Rらca」」 大 く下 – 全体的 精度 低下
• 対策案
– 談話解析 モ さ 候補 統語的 素性を追加 – 格解析 結果 談話解析 結果 ち 良い を直
接比較し 最終的 項を決
• 誤 分析
– 連体修飾,づ てが格助詞を伴わ い係 受けき
人間の直感にもとづく
手がかりアノテーションによる
現象の分布把握と各システムの分析
中山 周 松林 優一郎
東北大学
文内ゼロ照応に関する分析
• 明らかにしたい問題
– ゼロ照応に内在する様々な現象
– 各現象に対処するために必要な手がかり
– 現状のシステムはどの程度各現象を捉えられて いるか
• 人間の直感にもとづく手がかりアノテーション
– 文内ゼロ照応事例に対して手がかりラベルを付与 太郎に 影響を 与える
機能動詞構文
手がかりラベル一覧
• 統語関係
– 統語パス
• 語彙化パス
– 相互作用(意味)
– 機能語相当表現 – 連体修飾
– 受身
• 相互作用(形式)
– 機能動詞 – 制御構文
• 並列
• 談話関係
– 発話者
• 文脈
• 知識
– 選択選好 – 語義
– 複合語 – 常識
• その他
• アノテーションエラー
アノテーション例
手がかりラベル 説明 例文
機能動詞 「全体に影響を及ぼす」が機能動 詞構文であるため、「及ぼす」と
「影響」の二格が一致する。
市場変調が供給戸数
[ni:
全体]
に[p:
影響]
を及ぼしそうだ。選択選好
&
常識 「入力」の選択選好により、ヲ格として「機械」が埋まりやすい。
また、一般的な機械の操作に関す る常識的知識による解釈により、
「機械に入力する」と理解される。
モニタ上に映し出された眼底像を見 ながら新生血管の輪郭と照射量を入 力
[p:
すれ]
ば、[ni:
装置]
が自動的 に照射を行う。相互作用
(
意味) &
並列 「会談し」のガ格が「山花氏」で あることと、「会談し」「決定 し」が並列であること、「開い て」「決定し」が意味的に継起し ていることから、「開いて」のガ 格は「決定し」と同じ「山花氏」
である。
山花
[ga:
氏]
は十一日、国会内で田 辺元委員長と会談し、十六日に新党 準備会の議員総会を[p:
開い]
て新 会派結成を正式に決定した。複数のラベルを組み合わせる ことで手がかりを表現
現象に関する詳しい説明
•
「入力する」「装置」が共起しやすい•
一般的な機械装置の操作に関する常識的知識により、「装置に入力する」と解釈される
アノテーション時に目立って出現した現象
モニタ上に映し出された眼底像を見ながら新生血管の輪郭と照射 量を入力
[
すれ述語]
ば、[
装置ニ格]
が自動的に照射を行う。山花
[
氏ガ格]
は国会内で田辺元委員長と会談し、十六日に新党準 備会の議員総会を[
開い述語]
て新会派結成を正式に決定した。それぞれの手がかりが独立に項 候補の確信度を上げるタイプ
1.
「会談」のガ格が「山花氏」2.
「会談」「決定」が並列3.
「開いて」「決定」が意味的に継起している選択選好 常識
選択選好 並列
相互作用
(
意味)
局所的な解析結果を順を追って 重ねていく必要のあるタイプ
並列
① ②
③
0 5 10 15 20
アノ テー ショ ンエ ラー
機能 動詞
並列 &
相互 作用
︵意 味︶
機能 語相 当表 現
複合 語 &
選択 選好
その 他
その 他 &
選択 選好
制御 構文
その 他 &
語義 選択 選好
その 他 &
並列 &
相互 作用
︵意 その 他 &
文脈 &
機能 語相 当表 現
その 他 &
連体 修飾
制御 構文 &
語義 常識 機
能動 詞 &
連体 修飾
機能 語相 当表 現 &
選択 選好
その 他 &
並列 &
相互 作用
︵意 その 他 &
並列 &
語義 その 他 &
文脈 その 他 &
文脈 &
発話 者
その 他 &
機能 語相 当表 現 &
発話 その 他 &
機能 語相 当表 現 &
連体 その 他 &
機能 語相 当表 現 &
選択 その 他 &
発話 者
その 他 &
語義 &
選択 選好
並列 &
制御 構文 &
選択 選好
並列 &
機能 語相 当表 現 &
相互 作
並列 &
相互 作用
︵意 味︶ &
語義 常識 &
文脈 常識 &
語義 文脈 文
脈 &
語義 複合 語 &
語義 &
選択 選好
語義 語 義 &
連体 修飾
0 5 10 15 20 25 30
文脈 選 択選 好 その 他
常識 そ の他 &
選択 選好
語義 そ の他 &
文脈 アノ テー ショ ンエ ラー 機能 動詞
常識 &
選択 選好
文脈 &
機能 語相 当表 現 機能 語相 当表 現 複合 語 &
選択 選好
常識 &
文脈 文脈 &
選択 選好 複合 語 複合 語 &
語義 連体 修飾 &
選択 選好 その 他 &
連体 修飾 制御 構文
常識 &
機能 語相 当表 現 機能 語相 当表 現 &
語義 その 他 &
機能 動詞 その 他 &
機能 語相 当表 現 並列 &
制御 構文 並列 &
常識 並列 &
機能 動詞 並列 &
相互 作用
︵意 味︶ 並列 &
語義 &
選択 選好 並列 &
選択 選好
常識 &
機能 語相 当表 現 &
統語 文脈 &
発話 者 機能 動詞 &
機能 語相 当表 現 機能 語相 当表 現 &
選択 選好
知識 そ の他 &
並列 その 他 &
並列 &
常識 &
相互 その 他 &
並列 &
語義 その 他 &
並列 &
連体 修飾 その 他 &
並列 &
選択 選好 その 他 &
制御 構文 &
機能 語相 その 他 &
常識 &
文脈 &
語義 その 他 &
常識 &
機能 語相 当表 その 他 &
文脈 &
機能 動詞 その 他 &
文脈 &
機能 語相 当表 その 他 &
文脈 &
選択 選好 その 他 &
機能 動詞 &
語義 その 他 &
機能 語相 当表 現 連 その 他 &
機能 語相 当表 現 選 その 他 &
発話 者 その 他 &
複合 語 &
語義 その 他 &
語義 その 他 &
連体 修飾 &
選択 選好
並列 並 列 &
制御 構文 &
相互 作用
︵ 並列 &
常識 &
相互 作用
︵意 味 並列 &
常識 &
相互 作用
︵意 味 並列 &
文脈 &
機能 動詞 並列 &
知識 並列 &
語義 並列 &
連体 修飾 制御 構文 &
常識 制御 構文 &
機能 語相 当表 現 制御 構文 &
機能 語相 当表 現 制御 構文 &
機能 語相 当表 現 制御 構文 &
語義 常識 &
機能 動詞 &
知識 常識 &
複合 語
常識 &
語義 文脈 &
機能 語相 当表 現 &
統語 文脈 &
語義 文脈 &
連体 修飾 機能 動詞 &
機能 語相 当表 現 機能 語相 当表 現 &
知識 機能 語相 当表 現 &
連体 修飾
発話 者 &
語義 &
連体 修飾 統語 関係 &
語義 語義 &
連体 修飾
語義 &
選択 選好
組み合わされた手がかりラベルごとの事例数
計
100 NTC
事例事例数
事例数
残り
50%
残り
50%
機能語相当表現
&
選択選好並列
&
語義&
連体修飾&
その他 制御構文&
選択選好&
その他:
常識
&
機能語相当表現&
連体修飾 連体修飾&
並列&
その他常識