意味処理を目的とする中国語構文解析の研究 ―動
詞連続構文および結果構文を中心に―
著者
周 振
学位授与機関
Tohoku University
学位授与番号
11301甲第16486号
URL
http://hdl.handle.net/10097/59659
博士論文
意味処理を目的とする中国語構文解析の研究
―動詞連続構文および結果構文を中心に―
周振
1
目次
第 1 章 序 論 ... 4 1.1 言 語 学 研 究 と コ ー パ ス ... 4 1.2 統 語 ・ 意 味 情 報 を タ グ 付 け し た コ ー パ ス の 開 発 ... 4 1.3 研 究 課 題 ... 7 1.4 研 究 の 意 義 ... 9 1.5 本 稿 の 構 成 と 概 要 ... 10 第 2 章 本 研究 におけ るアノ テー ショ ン方式 ... 12 2.1 ペ ン 通 時 コ ー パ ス 式 の 解 析 規 約 ... 12 2.2 ペ ン 通 時 コ ー パ ス 式 ア ノ テ ー シ ョ ン 方 式 の メ リ ッ ト ... 14 2.3 形 態 素 解 析 ... 17 2.4 統 語 解 析 の 原 則 ... 18 2.5 SCT に よ る 意 味 処 理 の 概 要 ... 23 2.6 要 素 間 コ ン ト ロ ー ル 関 係 の 同 定 ... 27 2.7 句 レ ベ ル の ス コ ー プ ア ノ テ ー シ ョ ン ... 31 2.8 ま と め ... 44 第 3 章 動 詞連 続構文 の解析 ... 46 3.1 は じ め に ... 46 3.2 中 国 語 SVC の 定 義 お よ び そ の 下 位 カ テ ゴ リ ー ... 47 3.3 二 つ 以 上 の 別 個 の イ ベ ン ト を 表 す SVC ... 49 3.3.1 二 つ の 動 詞 句 が 並 列 的 に 連 続 あ る い は 交 替 す る SVC ... 49 3.3.2 一 つ の 動 詞 句 が も う 一 つ の 動 詞 句 を 修 飾 す る SVC ... 52 3.4 一 つ の 動 詞 句 が も う 一 つ の 動 詞 句 の 動 詞 の 項 で あ る SVC... 58 3.4.1 一 つ の 動 詞 句 が も う 一 つ の 動 詞 句 の 動 詞 の 主 語 で あ る SVC ... 58 3.4.2 一 つ の 動 詞 句 が も う 一 つ の 動 詞 句 の 動 詞 の 目 的 語 で あ る SVC ... 60 3.5 ピ ボ ッ ト 構 造 を 持 つ SVC ... 67 3.6 二 番 目 の 動 詞 句 が 記 述 的 な も の で あ る SVC ... 69 3.7 意 味 の 曖 昧 性 を 持 つ 中 国 語 SVC の 解 析 ... 76 3.8 三 つ 以 上 の 動 詞 句 か ら な る 中 国 語 SVC の 解 析 ... 792 3.9 ま と め ... 81 第 4 章 結 果構 文の解 析 ... 83 4.1 は じ め に ... 83 4.2 VR 構 造 の 文 法 カ テ ゴ リ ー と そ の 主 要 部 ... 85 4.2.1 語 彙 レ ベ ル に お け る 形 成 ... 86 4.2.2 統 語 レ ベ ル に お け る 形 成 ... 92 4.2.3 本 研 究 の 立 場 ... 96 4.3 本 研 究 に お け る 結 果 構 文 の 定 義 お よ び そ の 分 類 ... 98 4.4 動 作 主 型 ... 101 4.4.1 「 動 作 主 」 型 ... 101 4.4.2 「 動 作 主 ‐ 対 象 」 型 ... 109 4.4.3 「 動 作 主 ‐ 道 具 」 型 ... 112 4.5 被 動 作 主 型 ... 118 4.5.1 「 被 動 作 主 」 型 ... 119 4.5.2 「 被 動 作 主 ‐ 動 作 主 」 型 ... 122 4.6 道 具 型 ... 125 4.6.1 「 道 具 」 型 ... 126 4.6.2 「 道 具 ‐ 対 象 」 型 ... 131 4.7 ツ リ ー の 変 換 ... 136 4.8 ま と め ... 144 第 5 章 終 わり に ... 146 5.1 ま と め ... 146 5.2 今 後 の 課 題 ... 148 補 遺 A:「离合 词」 の一 体性 ... 149 A.1 は じ め に ... 149 A.2 課 題 ... 149 A.3 先 行 研 究 ... 150 A.4 VN 型 動 詞 の 抽 出 ... 151 A.5 使 用 す る コ ー パ ス ... 152 A.6 調 査 の 手 法 ... 152
3 A.7 結 果 ... 153 A.8 考 察 ... 154 A.9 ま と め ... 156 謝 辞 ... 158 参 考 文 献 ... 159 付 録 A:タ グ一 覧 ... 165 1 品 詞 タ グ ... 165 2 統 辞 タ グ ... 166 2.1 句 ... 166 2.2 複 合 動 詞 ... 166 3 機 能 タ グ ... 167 4 空 範 畴 ... 168 付 録 B:コ ント ロー ル ・非コ ント ロー ル動詞 ... 169 1 コ ン ト ロ ー ル 構 文 し か 作 れ な い 動 詞 お よ び そ の 出 現 頻 度 ... 169 2 非 コ ン ト ロ ー ル 構 文 し か 作 れ な い 動 詞 お よ び そ の 出 現 頻 度 ... 181 3 両 方 と も 作 れ る 動 詞 お よ び そ の 出 現 頻 度 ... 188
4
第 1 章 序論
1.1 言語学研究とコーパス
電 子 化 さ れ た 文 章 に 対 し て 言 語 分 析 情 報 を 付 加 ( タ グ 付 け ) し た コ ー パ ス が 言 語 研 究 に と っ て 有 用 で あ る こ と は 言 う ま で も な い 。 し か し 、 日 本 と 中 国 に お い て 文 系 の 言 語 研 究 者 が 使 用 す る コ ー パ ス は 、文 法 情 報 で は 主 と し て 形 態 素 情 報 だ け 付 加 し た も の が 中 心 で あ り 、 こ れ で は 大 量 の テ ク ス ト か ら 必 要 な 言 語 情 報 を 抽 出 す る に 当 た っ て 障 害 が 大 き い 。 各 文 に 対 し て 統 語 解 析 情 報 を タ グ 付 け し た ツ リ ー バ ン ク (Treebank) は よ り 柔 軟 な 検 索 や文 法 情 報 の 抽 出 を 可 能 に す る 。 し か し 、 日 本 語 に 関 し て 統 辞 情 報 を タ ギ ン グ し た コ ー パ ス は 、 言 語 処 理 研 究 上 の 目 的 で 文 節 に も と づ い て 構 築 さ れ た も の が 中 心 で あ る ( 例 え ば 、 京 都 大 学 テ キ ス ト コ ー パ ス (Kurohashi et al. 2003))。一方、中国語では、データの量も質も確保で き る ツ リ ー バ ン ク (Penn Chinese Treebank Xue et al. 2000) が既に公表されてはいるが 、日 本 語 の 場 合 に 類 似 し て 、 元 々 構 文 解 析 器 の 評 価 及 び 訓 練 を 目 的 と し て デ ザ イ ン さ れ た も の で あ る た め 、 こ れ か ら 言 語 研 究 者 が 必 要 と す る 文 法 的 依 存 関 係 を 得 る こ と は 極 め て 困 難 で あ る 。 さ ら に 、 ツ リ ー バ ン ク そ の も の に も 限 界 が あ る 。 通 常 の ツ リ ー バ ン ク で は 表 層 的 な 統 辞 構 造 が 示 さ れ る だ け で あ る 。コ ン ト ロ ー ル 構 文 や 主 題 化 構 文 や 関 係 節 構 文 等 が 表 れ た 場 合 、 文 の 基 本 を な す 格 名 詞 句 と 動 詞 と の 依 存 関 係 を つ き と め る こ と は 非 常 な 困 難 を と も な う 。 か と い っ て 、形 式 統 語 理 論( Head-driven Phrase Structure Grammar Pollard et al. 1994 等)を 応 用 し て こ れ ら の 複 雑 な 構 文 を 自 動 解 析 し よ う と す る 試 み は 、実 用 化 の 域 に 達 し て い な い 。5
こ れ に 対 し て 、 バ ト ラ ー (Butler 2010) が 提 唱 す る ス コ ー プ 制 御 理 論 (Scope Control Theory; SCT) で は 、 文 の 表 層 的 な 統 語 解 析 情 報 が 与 え ら れ れ ば 、 そ の 意 味 論 的 な 適 切 性 (well-formedness) を 計 算 す る こ と を 通 じ て 論 理 意 味 情 報 ( 述 語 論 理 式 ) を 得 る こ と を 可 能 に す る 。筆 者 が 加 わ っ て い る 欅 ツ リ ー バ ン ク の プ ロ ジ ェ ク ト で は SCT をイン プリメ ント し た シ ス テ ム を 用 い て 、 日 本 語 や 英 語 の ツ リ ー バ ン ク を 入 力 と し て そ れ ぞ れ の 論 理 意 味 表 示 を タ グ 付 け し た コ ー パ ス を 構 築 す る こ と を 試 み て い る 。 筆 者 ら が 目 的 と す る 高 精 度 の 論 理 意 味 表 示 が タ グ 付 け さ れ た コ ー パ ス の 構 築 の た め に は 、 構 造 の 曖 昧 性 を 克 服 し て 単 純 な 格 フ レ ー ム ( 述 語 ‐ 項 関 係 ) を 超 え た よ り 複 雑 な 構 文 に よ り 表 現 さ れ た 意 味 情 報 の 抽 出 が 可 能 な 入 力 デ ー タ を 必 要 と す る 。 当 初 、 筆 者 ら は 、 す で に 入 手 可 能 な 日 本 語 統 語 解 析 情 報 付 き コ ー パ ス に 注 目 し 、 そ の 中 に 含 ま れ た 統 語 情 報 へ の ア ク セ ス の 試 み を 行 っ た (Butler et al. 2012a)。
日 本 語 の 文 に 対 し て 統 語 解 析 情 報 を 付 加 し た コ ー パ ス は い く つ か あ る が 、 そ の 代 表 で あ る 京 都 大 学 テ キ ス ト コ ー パ ス を は じ め と し て 、 そ の 多 く は 文 節 に 基 づ く も の で あ り 、 申 請 者 ら が 目 指 す 文 の 意 味 の 自 動 解 析 に 利 用 す る に は 問 題 が あ る 。 京 都 大 学 テ キ ス ト コ ー パ ス 第 4 版のうち 5,000 の文につ いて は、 格、照 応およ び指 示情 報が付 加され てい る。 格関係 の 追 加 に よ り 、 ペ ン ツ リ ー バ ン ク (Penn Treebank) のやり方と同じく、述語のとる項を確 定 す る こ と は 出 来 る 。 し か し 、 文 の 意 味 情 報 を 述 語 及 び 述 語 の と る 項 よ り 深 い レ ベ ル ま で 求 め た い 場 合 、 文 節 に も と づ く 解 析 は 問 題 を 生 じ る 。 文 節 に も と づ く 解 析 は 、 節 と 節 と の 依 存 関 係 を 教 え て く れ る が 、 節 の 壁 を 越 え た 文 法 関 係 の 解 明 は で き な か っ た 。 そ の た め 、 筆 者 ら は 文 が 実 際 に 表 示 す る 複 雑 な 統 語 情 報 を 京 都 大 学 テ キ ス ト コ ー パ ス に 基 づ い て 得 よ う と 試 み た 。そ の 一 例 と し て 、文 節 の 結 合 及 び 分 割 に 関 す る 処 理 (Zhou et al. 2012) が 挙 げ ら れ る 。 図 1-1 と 図 1-2 に 、 文 節 の 分 割 の 実 例 を 示 す 。 文 節 分 割 以 前 に 一 つ の 文 節 で あ る「 買 え な い 」( 文 節 番 号 2)を「 買え 」( 文 節 番 号 2)と「な い」( 文 節 番 号 2.5) に 分 け る こ と に よ っ て 、 否 定 ( な い ) の 作 用 範 囲 の 調 整 を 可 能 に し た 。 ま た 、 筆 者 が 変 更 プ ロ グ ラ ム を 開 発 し た 際 に 、 結 合 及 び 分 割 の 結 果 が 文 節 間 の 依 存 関 係 全 体 に 波 及 効 果 を 与 え な い よ う に 注 意 を 払 い ( こ の 例 の 場 合 、 分 割 さ れ た 文 節 2 の依 存 関係も 同時 に“ -1D” か ら“ 2.5D”に変更 )、その結 果 、変 更プロ グ ラムに よる 京都 テキス トコー パス 全体 に対す る 部 分 自 動 修 正 が 実 現 で き た 。
6 図 1-1 文節分割前 図 1-2 文節分割後 し か し 、 文 節 表 記 の 壁 は や は り 厚 く 、 個 々 の 文 節 を 超 え て シ ス テ マ テ ィ ッ ク に 情 報 を 補 充 す る 方 法 を 見 出 す こ と は 出 来 な か っ た 。 し か も 、 現 時 点 で 必 要 な 大 規 模 の 日 本 語 ツ リ ー バ ン ク は ま だ 存 在 し な い の で 、 筆 者 ら は 、 日 本 語 ツ リ ー バ ン ク を ゼ ロ か ら 構 築 す る こ と に 方 針 転 換 し た 。 一 方 、 中 国 語 の 場 合 、 上 述 し た よ う に 、 中 国 語 版 ペ ン ツ リ ー バ ン ク (Penn Chinese Treebank) は そ の 設 計 上 の 理 由 が あ っ て 、 (1)の 統 語 木 で あ る (2)に 見 ら れ る よ う に 、 そ の 中 に 収 納 さ れ た 統 語 木 は 内 部 構 造 が 複 雑 で 階 層 が 多 く 、 同 じ カ テ ゴ リ ー の 句 や 節 が 何 度 も 重 な っ て 部 分 木 を 構 築 す る ( そ の 典 型 的 な 例 は 、 名 詞 句 (NP) 及び動詞句 (VP) に対する扱 い で あ る ) こ と が あ る 。 (1) 之 前 失 去 的 机 会 又 来 了 。
zhīqián shīqù de jīhuì yòu lái le こ の 前 失う 補文標 識 チャン ス また 来る 完了 こ の 前 失 っ た チ ャ ン ス が ま た や っ て き た 。
7 (2)
(TOP (IP (NP-SBJ (CP (WHPP-1 (-NONE- *OP*))
(CP (IP (NP-SBJ (-NONE- *pro*)) (VP (ADVP (AD 之 前 /こ の 前 )) (VP (VV 失 去 /失 う ) (NP-OBJ (-NONE- *T*-1))))) (DEC 的 /補 文 標 識 ))) (NP (NN 机 会 /チ ャ ン ス ))) (VP (ADVP (AD 又 /ま た )) (VP (VV 来 /来 る ) (AS 了 /完 了 ))) (PU 。 ))) ま た 、 中 国 語 の 中 の 複 雑 な 統 語 構 造 を と る 構 文 に 対 し て 深 い 処 理 を 行 っ て い な い 。 例 え ば 、 中 国 語 で 最 も 多 機 能 を 果 た す “ 把 (bǎ)” 構文に対 して 、“ 把” 自体を動 詞とし て扱い そ の 後 ろ の 部 分 を 全 て “ 把 ” の 取 る 目 的 語 と 見 な す よ う な 単 純 す ぎ る ア ノ テ ー シ ョ ン を 行 っ て い る 。 そ の 結 果 、 中 国 語 版 ペ ン ツ リ ー バ ン ク は 、 言 語 現 象 の 検 証 を 行 う た め の プ ラ ッ ト ホ ー ム に は な れ な か っ た し 、そ の デ ー タ を そ の ま ま 用 い て SCT を 実装し た 意 味処 理シス テ ム に 入 力 し 文 の 論 理 意 味 表 示 を 得 よ う と す る と 文 の 構 成 要 素 間 の 文 法 関 係 へ の ア ク セ ス お よ び 句 の 構 成 要 素 の 特 定 が 困 難 で あ る と い う 問 題 が 生 じ る 。 そ こ で 、 意 味 処 理 の 入 力 デ ー タ に 相 応 し い 中 国 語 ツ リ ー バ ン ク の 開 発 が 必 要 で あ る 。
1.3 研究課題
論 理 意 味 表 示 を タ グ 付 け し た 中 国 語 ツ リ ー バ ン ク の 構 築 は 二 つ の 段 階 に 分 け ら れ る 。 そ れ は 、 (1)分 析 デ ー タ と し て 選 ば れ た 中 国 語 の 自 然 テ ク ス ト に 対 す る 統 語 解 析 情 報 の 追 加 、 お よ び (2)そ れ を ス コ ー プ 制 御 理 論 を 実 装 し た シ ス テ ム に 入 力 す る こ と に よ る 自 動 的 な 文8 の 論 理 意 味 表 示 の 獲 得 で あ る 。 こ れ ま で の 研 究 で 英 語 お よ び 日 本 語 に 対 す る 自 動 意 味 解 析 の 結 果 が 良 好 で あ っ た こ と は 、自 然 言 語 の 文 の 意 味 に 対 す る SCT の アプロ ーチ が的 外れの も の で な い こ と を 示 し て い る 。そ の た め 、 SCT を実装 したシ ステ ム の入力 であ る中 国語の 統 語 解 析 情 報 を 十 分 に 含 む コ ー パ ス の 構 築 が う ま く で き れ ば 、 シ ス テ ム に 対 し て あ る 程 度 の 中 国 語 な り の 修 正 を 行 う だ け で 自 動 的 に 中 国 語 の 文 の 論 理 意 味 表 示 が 得 ら れ る と 期 待 さ れ る 。 以 上 の こ と か ら 、 精 度 の 高 い 中 国 語 の 統 語 解 析 情 報 付 き コ ー パ ス ( 中 国 語 の ツ リ ー バ ン ク ) の 開 発 が 研 究 の 要 と な る と 思 わ れ る 。 さ て 、 ア ノ テ ー シ ョ ン 作 業 が 効 率 的 に 進 め ら れ る よ う に 、 ま ず は 中 国 語 の 主 要 な 諸 構 文 に 対 し て 、 そ の 解 析 を 各 々 決 め て い く 必 要 が あ る と 思 わ れ る 。 周 知 の よ う に 、 中 国 語 は 機 能 語 や 屈 折 形 態 素 な ど に 乏 し い 言 語 で 、 そ の 語 お よ び 文 は い わ ば 漢 字 の 並 び と 組 み 合 わ せ だ け で あ る 。 こ の よ う な 形 態 上 の ヒ ン ト が 乏 し い 言 語 を 対 象 と す る ア ノ テ ー シ ョ ン に お い て は 主 に 以 下 の 三 つ の 難 点 が 予 想 さ れ る 。 1) 語 を 判 定 す る 基 準 が 不 明 確 で あ る こ と ( 例 :“ 離 合 詞 ”) 2) 表 層 構 造 が 同 じ よ う に 見 え て も 異 な る 言 語 情 報 を 伝 え る 構 文 が 数 多 い こ と( 例:動 詞 連 続 構 文 ) 3) 各 要 素 間 の 文 法 関 係 ・ 意 味 役 割 が 複 雑 で あ る こ と ( 例 : 結 果 構 文 ) 1)に 関 し て は 、筆 者 は 修 士 論 文 で 、従 来 形 態 素 解 析 の 最 大 の 問 題 と さ れ て き た“ 離 合 詞 ” を 取 り あ げ 、 コ ー パ ス を 使 っ て 、 動 詞 の 自 他 の 傾 向 と そ の 語 と し て の 一 体 性 と の 間 の 関 連 性 に つ い て 考 察 し た 。 そ の 結 果 、 中 国 語 の “ 離 合 詞 ” の 場 合 、 後 ろ に 目 的 語 が 取 れ る タ イ プ は 語 と し て の 一 体 性 が 高 く 、 一 方 、 後 に 目 的 語 が 取 れ な い タ イ プ の 方 は 一 体 性 が 低 い と い う 傾 向 が 明 ら か に な っ た( そ の 詳 細 は 補 遺 A を参照の こと 。)。そ の研究 結果 は、今 後中 国 語 を 対 象 と す る 形 態 素 解 析 作 業 に 多 大 な 示 唆 を 与 え る こ と が 出 来 る 。 一 方 、 2)と 3)につ い て は 、 本 論 文 で 、 そ れ ら が 代 表 す る も っ と も 典 型 的 な 文 法 項 目 ( 動 詞 連 続 構 文 お よ び 結 果 構 文 ) を 取 り あ げ て 、 そ の 統 語 ・ 意 味 解 析 を そ れ ぞ れ 考 察 し て い き た い 。 以 上 の こ と か ら 、 本 研 究 の 研 究 課 題 を 以 下 の よ う に ま と め る こ と が 出 来 る 。
9 研 究 課 題 : こ れ ま で の 主 要 な 研 究 を 参 考 に し な が ら 、中 国 語 の 動 詞 連 続 構 文 お よ び 結 果 構 文 に 対 し て 、も っ と も 合 理 的 と 判 断 さ れ る 解 析 法 を 各 々 決 定 し 、適 切 な 解 析 ス キ ー ム を 選 ん で 、 そ れ に 従 っ て 記 述 す る 。
1.4 研究の意義
本 研 究 で は 、 意 味 処 理 の 要 請 に こ た え る こ と を 目 的 と し て 中 国 語 の 諸 構 文 の 統 語 解 析 法 を 再 検 討 す る 。 こ れ に よ り 、 中 国 語 の 統 辞 研 究 に 新 た な 示 唆 が 与 え ら れ る 。 従 来 、 統 辞 論 と 意 味 論 は 緊 密 な 関 連 性 を も っ て お り 、 意 味 論 は 統 辞 論 と 共 に 働 く こ と に よ っ て 力 を 発 揮 す る こ と が で き る と 言 わ れ て き た 。本 研 究 に は 、SCT をイ ンプリ メ ントし たシ ステ ムを利 用 し て 意 味 解 析 を 行 う こ と に よ り 、 文 の 統 語 構 造 と 論 理 意 味 表 示 と の 対 応 を 形 式 的 に 考 察 す る こ と が 出 来 る と い う 意 義 が あ る 。 ま た 、 本 研 究 を 基 に し て 構 築 さ れ る 中 国 語 の 約 4 万 文に つい て統語 ・意味 情報 をタ ギン グ す る 統 語 ・ 意 味 コ ー パ ス は 、 筆 者 た ち が 取 り 組 ん で い る 欅 コ ー パ ス プ ロ ジ ェ ク ト (http://www.compling.jp/keyaki/)の他には、中国語は勿論のことどんな言語についても 存 在 し な い 。 こ れ が 完 成 す れ ば 、 同 じ 解 析 手 法 で 作 業 を 行 っ た 日 英 中 三 言 語 の 大 規 模 の 統 語 ・ 意 味 コ ー パ ス 群 が 手 に 入 り 、 こ れ ま で に な い 深 さ と 広 さ を 兼 ね 備 え た 言 語 研 究 に 貢 献 す る こ と が で き る 。 例 え ば 、 対 照 分 析 に よ っ て 目 標 言 語 の 特 徴 を 捉 え よ う と す る 対 照 言 語 学 に 対 し て 、 本 研 究 は そ の 最 も 直 接 的 な 比 較 デ ー タ ( 日 英 中 ) の 提 供 が 可 能 で あ る 。 そ れ だ け で は な く 、 比 較 デ ー タ が 同 じ 解 析 手 法 を 用 い て い る た め 、 目 標 の 言 語 サ ン プ ル へ の ア ク セ ス が 簡 単 に 実 現 で き る 。 例 を 挙 げ る と 、 三 言 語 の 連 体 修 飾 節 構 造 を 比 較 し た い 場 合 、 タ グ CP-THT と CP-REL を 手掛 かりと して 検 索を行 うと 、修 飾の限 定性、 補文 標識 、疑問 代 名 詞 、 連 体 修 飾 節 と 主 要 部 の 位 置 関 係 な ど に 関 す る 情 報 が 一 目 瞭 然 に 現 れ 、 対 照 が 効 率 よ く 行 え る 。 さ ら に 論 理 意 味 表 示 に も と づ い て 、 述 語 項 関 係 、 量 化 詞 や 否 定 辞 の 作 用 域 、 文 中 ・ 文 間 の 照 応 関 係 等 、 こ れ ま で に 得 ら れ な か っ た 種 類 の 言 語 学 的 情 報 を 大 量 に 得 、 分10 析 す る こ と が 出 来 る 。 ま た 、 自 然 言 語 の 意 味 の 段 階 で は 言 語 表 層 上 の ほ と ん ど の 相 違 が な く な る の で 、 適 切 な 外 国 語 教 育 支 援 プ ロ グ ラ ム の 作 成 を 通 し て 、 言 語 の 教 育 現 場 へ の 応 用 も 期 待 さ れ て い る 。
1.5 本稿の構成と概要
本 稿 は 全 7 章で 構成 されて いる 。全 体の構 成を 図 1-3 に示 す。 図 1-3 本論文 の流 れ 第5章 終わりに まとめおよび今後の課題の提示 第4章 結果構文の解析 難点3)の代表的な例に関する統語・意味解析 第3章 動詞連続構文の解析 難点2)の典型的な例を対象とする統語・意味解析 第2章 本研究におけるアノテーション方式 本研究に使用されるアノテーション方式の特徴とメリットおよびSCTについての紹介 第1章 序論 本研究の研究背景、研究課題と学問的意義11
本 章 で は 、 研 究 の 背 景 、 研 究 課 題 お よ び 研 究 の 意 義 に つ い て 述 べ た 。
続 く 第 2 章で は、本 研究に おい て適 用され る ペン 通時 コー パス (Penn Historical Corpora) 式 の 解 析 規 約 を 紹 介 し 、 他 の 解 析 規 約 に 比 べ て そ れ が 本 研 究 に と っ て 最 も 相 応 し い こ と を 説 明 す る 。 そ し て 、 具 体 例 を 通 じ て 、 本 研 究 に お け る ペ ン 通 時 コ ー パ ス 式 の 解 析 規 約 の 適 用 情 況 お よ び 中 国 語 を 対 象 と す る 形 態 素 ・ 統 語 解 析 の 実 状 に 応 じ て 解 析 規 約 に 対 し て 行 う 修 正 と そ の 原 則 を 示 す 。最 後 に 、SCT による 意味処 理の 過程 を概観 し た上 で 、コ ントロ ー ル 構 文 の 処 理 を 例 と し て 、 従 来 の 方 法 で は な か な か 捉 え ら れ な い 言 語 情 報 ( 同 一 指 示 関 係 や 否 定 の 作 用 域 な ど )を 得 る た め に 、本 研 究 で い か な る 処 置 を 取 っ た か に つ い て 説 明 す る 。 第 3 章 では 、上 記で述 べた 中 国語 を対 象とす るアノ テー ショ ンの難 点二 を めぐ り、 中国 語 の 動 詞 連 続 構 文 (SVC) を 取 り あ げ 、 先 行 研 究 を 踏 ま え て そ の 下 位 カ テ ゴ リ ー を 緻 密 に 決 定 し た 上 で 、 文 を 構 成 す る 要 素 の 間 の 同 一 指 示 関 係 に 留 意 し て 各 下 位 カ テ ゴ リ ー に 対 し て も っ と も バ ラ ン ス の 取 れ た 解 析 方 法 を 付 与 す る 。こ れ に よ っ て SCT をイン プリメ ント し た 意 味 処 理 シ ス テ ム を 通 し て 精 度 の 高 い 論 理 意 味 表 示 を 行 い 、 従 来 の 解 析 方 法 で は 捉 え ら れ な い 中 国 語 SVC における統 語・ 意味 情報が 得られ るよ うに な るこ とを具 体例 で示 す。 第 4 章で は、 中国語 の結果 構文 を対 象とし て 、ア ノテ ーシ ョンの 難点三 をめ ぐり 議論を 進 め て い く 。 中 国 語 の 結 果 構 文 を 構 築 す る 要 素 の 間 の 文 法 ・ 意 味 関 係 を 形 式 的 に 捉 え る た め に 、本 研 究 は 、先 行 研 究 を ま と め た 上 で 、ま ず 、「 動 詞 + 結 果 補 語 」構 造 の 文 法 カ テ ゴ リ ー と そ の 主 要 部 を 決 定 す る 。 そ れ か ら 、 文 頭 ・ 文 末 に 来 る 名 詞 句 と 第 一 述 語 と の 意 味 関 係 に 基 づ い て 、 中 国 語 の 結 果 構 文 に 七 つ の 下 位 カ テ ゴ リ ー を 付 与 し 、 そ の 統 語 解 析 お よ び 意 味 処 理 を 展 開 し て い く 。ま た 、コ ー パ ス の 中 に 収 納 さ れ る デ ー タ の 汎 用 性 を 高 め る た め に 、 第 4 章の最後 に、 tsurgeon ツール の紹 介を 踏 まえて 、 ツ リー の変換 という 処理 のス テップ の 追 加 に つ い て 検 討 を 行 う 。 第 5 章 では 、本 研究の 内容を 整理 し、 総合的 考察を 行っ て、 今後の 課題を 提示 する 。
12
第 2 章 本研究におけるアノテーション方式
2.1 ペン通時コーパス式の解析規約
SCT を 実 装 し た シ ス テ ム の 入 力 と し て 適 切 な ツ リ ー バ ン ク は 、有 用 な 統 語 情 報 に 富 ん で い て し か も 統 語 情 報 へ の ア ク セ ス が 容 易 に 出 来 る も の で あ る 。 こ れ ら の 要 件 を 満 た す の は ペ ン 通 時 コ ー パ ス 式 の 解 析 ス キ ー ム (Santorini 2010) であ る。 本 章 では 、同 解析 ス キーム を 日 本 語 ツ リ ー バ ン ク 構 築 に 応 用 し た 研 究 (Butler et al. 2012b; Butler et al. 2013) に基 づい て 、 こ の 方 式 を 中 国 語 ツ リ ー バ ン ク の 枠 組 み と し て 用 い る 際 の 問 題 と そ の 解 決 に つ い て 述 べ る 。 ペ ン 通 時 コ ー パ ス 式 の 解 析 シ ス テ ム は 、 ペ ン ツ リ ー バ ン ク 式 の 解 析 ス キ ー ム を 修 正 し た も の で 、文 の 統 語 構 造 を ラ ベ ル 付 き の 括 弧 で 表 示 す る 。ラ ベ ル に は 語 彙 レ ベ ル の ラ ベ ル( N、 ADJ な ど ) と 句 レ ベ ル の ラ ベ ル ( NP、 ADJP な ど ) の 2 種 類 が あ る 。 文 の 全 て の 終 端 要 素 ( 語 や 助 詞 な ど ) は 語 彙 レ ベ ル の ラ ベ ル に よ っ て 、 タ グ 付 け さ れ て い る が 、 必 ず し も 句 レ ベ ル の ラ ベ ル を 持 つ 必 要 は な い 。句 レ ベ ル の ラ ベ ル は 形 式 と 機 能 を 両 方 指 す こ と が 出 来 る 。 例 え ば 、NP-SBJ の場合 、NP は句のタ イプ が名 詞句で ある こと を表す と同時 に、-SBJ はこ の 名 詞 句 の 機 能 を 主 語 に 限 定 し て い る 。 一 般 的 に は 、 句 レ ベ ル の ラ ベ ル は 機 能 タ グ を 一 つ し か 持 た な い が 、二 つ 以 上 持 つ 場 合( 例:IP-INF-PRP = 目的を表 す 不定詞 句 、IP-IMP-SPE = 直 接 話 法 命 令 句 )も あ る 。中 間 レ ベ ル の 構 造( N’、ADJ’な ど )は 、い か な る 場 合 も 明 示 的 に タ グ 付 け さ れ る こ と は な い 。 と は い え 、 あ る 特 定 の 句 の ラ ベ ル を 使 わ な い こ と は 、 決 し て コ ー パ ス の 作 成 者 た ち が ア ノ テ ー シ ョ ン の 対 象 と す る 目 標 言 語 に そ う い う 句 が 存 在 し な い と 判 断 し て い る と い う こ と を 意 味 す る わ け で は な い (Santorini 2010)。中間レベルの構 造 を 使 用 し な い ゆ え に 、 統 語 木 全 体 が フ ラ ッ ト で シ ン プ ル に な り 、 特 定 の 言 語 サ ン プ ル を 検 索 し た り す る よ う な 作 業 も 簡 単 に 出 来 る (Butler et al. 2013)。(4)は 、その 解析 スキ ーム を 応 用 し て 実 際 に 中 国 語 の 無 制 約 の 文 (3)を 対 象とし て 統 語解 析を行 った一 例で ある 。13 (3)
如 果 没 有 研 究 , 就 没 有 科 学 的 发 展 。
rúguǒ méiyǒu yánjiū jiù méiyǒu kēxué de fāzhǎn も し な い 研 究 肯 定 を 強 め る ない 科 学 格 助 詞 発展 研 究 な し で は 科 学 は 発 展 し な い 。
(4)
(IP-MAT (NP-SBJ *arb*) (PP (P 如 果 /も し )
(CP-ADV (IP-SUB (VE 没 有 /な い )
(NP-OB1 (N 研 究 /研 究 ))))) (PU , ) (ADVP (ADV 就 /肯 定 を 強 め る )) (VE 没 有 /な い ) (NP-OB1 (PP (NP (N 科 学 /科 学 )) (P 的 /格 助 詞 )) (N 发 展 /発 展 )) (PU 。 )) (4)か ら 分 か る よ う に 、IP は 常 に 述 語 と 文 レ ベ ル の 要 素 を 直 接 支 配 す る の で 、中 間 レ ベ ル の I’や VP などは 存在 しない 。同様 に、句の ヘッド (head) は各句 によっ て 直 接支 配され る た め 、中 間 レ ベ ル の 構 造( N’、ADJ’など)も 示され ない。また 、句 レベル の 要 素は 形式と 機 能 を 表 す タ グ を 両 方 持 つ こ と が 出 来 る が 、 必 ず し も そ の 両 方 を 備 え な け れ ば な ら な い わ け で は な い 。例 え ば 、文 レ ベ ル の NP は常に 機能タ グ( -SBJ、-OB1 など)によ って マーク さ れ る の に 対 し て 、PP はその 存在 位置 を問わ ず、機 能タ グに関 する アノテ ーシ ョン は一切 必 要 と し な い 。
14
2.2 ペン通時コーパス式アノテーション方式のメリット
ペ ン 通 時 コ ー パ ス 式 の 解 析 ス キ ー ム は 、 機 能 を 表 す タ グ と 照 応 関 係 を 手 掛 か り と し て 、 述 語 ‐ 項 関 係 の 確 定 が で き る 。 こ れ は 、 ペ ン ツ リ ー バ ン ク 式 の 解 析 ス キ ー ム に よ っ て も 可 能 で あ る が 、意 味 処 理 の 入 力 と し て の 前 者 の メ リ ッ ト と し て 、主 に 以 下 の 二 点 (Butler et al. 2013) を 挙 げ る こ と が 出 来 る 。 1) 句 ( IP を 除 く ) の 内 部 構 造 の 一 貫 性 を 保 つ こ と 。 こ れ は 、 句 の 構 成 を 規 則 正 し く 見 つ け 出 す た め に は 非 常 に 役 に 立 つ 。 図 2-1 に示すように、二つの例外(限定詞や動詞など解 析 規 約 に よ っ て 句 を 投 射 し な い よ う な ヘ ッ ド お よ び 単 一 の 単 語 よ り な る 前 置 修 飾 語 ) を 除 い て 、 一 般 的 に は ヘ ッ ド は 常 に 句 の 要 素 を 投 射 す る ( N→NP、P→PP、ADJ→ADJP など )。 句 レ ベ ル の 要 素 ( NP、PP、ADJP など) は主 要部を 直接 支配 する。 図 2-1 句の内 部構 造 そ れ は 、X’理論 で提 唱 された 中間 レベ ルの欠 如とい うこ とを 意味す る。その ため 、 ペ ン通 時 コ ー パ ス 式 の 解 析 シ ス テ ム で は 、 従 来 の 所 謂 指 定 部 (specifier) お よ び 付 加 部 (adjunct) は 修 飾 語 ・ 修 飾 句 (modifiers) に統 合 され 、 しか も修 飾語 も 補語 (complements) も 常に ヘ ッ ド と 同 じ レ ベ ル に あ る 。 一 つ の 具 体 例 と し て 、 (5), (6)に PP と NP の内部 構造 を示 す 。 (5) 仅 仅 为了 个人 的 微 小 利 益jǐnjǐn wèile gèrén de wēixiǎo lìyì た だ ため 個人 格助詞 微小だ 利益 た だ 個 人 の 微 小 な 利 益 の た め
15 (6) (PP (ADVP (ADV 仅 仅 /た だ )) <--- 修 飾 句 (P 为 了 /た め ) <--- ヘ ッ ド (NP (PP (NP (N 个 人 /個 人 )) <--- 補 語 (P 的 /格 助 詞 )) (ADJ 微 小 /微 小 だ ) (N 利 益 /利 益 ))) 2) 機 能 を 表 す タ グ が 常 に 句 (IP, CP) に タ グ 付 け さ れ る こ と 。 例 え ば 、 IP-IMP( 命 令 文 )、 CP-REL( 関 係 節 )の よ う に 、個 々 の IP と CP は そ の 文 法 的 な 機 能 を 指 す た め の タ グ を 持 っ て い る 。 こ れ に よ り 、 述 語 ‐ 項 関 係 に 止 ま ら な い よ り 複 雑 な 構 文 に よ り 表 現 さ れ た 意 味 情 報 を 抽 出 す る こ と が 可 能 に な る 。例 え ば 、通 常 の 関 係 節 を 伴 う 文 (7)(主名 詞「 机会 」は 関 係 節 の 内 部 で 目 的 語 の 働 き を す る )の 統 語 木 (8)に対し て、埋め 込ま れ た節が 主名 詞「 机会」 の 内 容 を 表 し て い る 文 (9)の統語 木は(10)の よ うに表 され る。 (7) (= (1)) 之 前 失 去 的 机 会 又 来 了 。
zhīqián shīqù de jīhuì yòu lái le こ の 前 失う 補文標 識 チャン ス また 来る 完了 こ の 前 失 っ た チ ャ ン ス が ま た や っ て き た 。
16 (8)
(IP-MAT (NP-SBJ (CP-REL (IP-SUB (NP-SBJ *pro*) (NP-OB1 *T*) (ADVP (ADV 之 前 /こ の 前 )) (VB 失 去 /失 う )) (C 的 /補 文 標 識 )) (N 机 会 /チ ャ ン ス )) (ADVP (ADV 又 /ま た )) (VB 来 /や っ て く る ) (AS 了 /完 了 ) (PU 。 )) (9) 去 美 国 的 机 会 又 来 了 。
qù měiguó de jīhuì yòu lái le
行 く アメリ カ 補文標 識 チャン ス また 来る 完了 ア メ リ カ に 行 く チ ャ ン ス が ま た や っ て き た 。
(10)
(IP-MAT (NP-SBJ (CP-THT (IP-SUB (NP-SBJ *pro*) (VB 去 /行 く ) (NP-OB1 (NPR 美 国 /ア メ リ カ ))) (C 的 /補 文 標 識 )) (N 机 会 /チ ャ ン ス )) (ADVP (ADV 又 /ま た )) (VB 来 /や っ て く る ) (AS 了 /完 了 ) (PU 。 )) (8)と (10)を SCT を イ ン プ リ メ ン ト し た 意 味 処 理 シ ス テ ム に 入 力 し て 自 動 意 味 評 価 す る こ と
17
に よ り 、 文 (7)と(10)の 述語論 理式 は、 (11)と(12)のよ うに 与え られ る 。
(11)
∃ x4 x1 e2 e3 (
x4 = pro ∧ 机 会 (x1) ∧ 之 前 (e2) ∧
失 去 (e2, x4, x1) ∧ 又 (e3) ∧ 来 _了 (e3, x1))
(12)
∃ x4 x3 e1 e2 ( x4 = pro ∧
机 会 (x3, 去 (e1, x4, 美 国 )) ∧ 又 (e2) ∧ 来 _了 (e2, x3))
関 係 節 と 主 節 と の 意 味 的 関 係 は 、(11)では 連言 結合子 ∧で 連結 される 並列関 係で ある 一方 、 (12)で は 、 関 係 節 の 意 味 の 主 名 詞 の 意 味 へ の 埋 め 込 み 関 係 と な り 、 本 質 的 に 異 な る 。 こ の よ う な 差 を 正 し く 捉 え る こ と は 、(8)で通 常の 関係節 を表 すア ノテー ショ ン CP-REL が使 わ れ る 一 方 、 (10)で は埋 め込ま れた 節を 表す CP-THT が使 われ るこ とに よって 可能 とな る。
2.3 形態素解析
周 知 の よ う に 、 中 国 語 の 文 は 、 単 語 間 の 分 か ち 書 き が 行 わ れ ず 、 単 な る 漢 字 の 連 続 と し て 表 記 さ れ る 。 従 っ て 、 品 詞 ・ 統 語 情 報 を タ ギ ン グ す る 前 に 、 文 を 単 語 ご と に 分 割 し て お く 必 要 が あ る 。 中 国 語 に お い て の 単 語 分 割 タ ス ク の 実 行 可 能 性 に つ い て は 、 こ れ ま で に 言 語 学 者 は い ろ い ろ 論 じ て き た 。 中 国 語 の 単 語 と は 何 で あ る か と い う こ と に つ い て の 中 国 語 母 語 話 者 の 間 の 合 意 の 程 度 が 非 常 に 低 い (Sproat et al. 1996) という 実験結 果が ある が、 Xue et al. (2005) の 調 査 報 告 に よ る と 、中 国 語 母 語 話 者 の 間 に 、中 国 語 の 単 語 の 境 界 線 が ど こ ま で 広 が る か に 対 し て は か な り の 意 見 の 相 違 が 存 在 し て い る に も 関 わ ら ず 、 こ れ ら の 意 見 の 不 一 致 は 実 は そ れ ほ ど 大 事 な も の で は な く 、 母 語 話 者 に 適 切 な セ グ メ ン テ ー シ ョ ン の18 ガ イ ド ラ イ ン さ え 与 え れ ば 、 中 国 語 の 単 語 分 割 タ ス ク は 順 調 に 進 め る こ と が 出 来 る 。 以 上 の こ と を 踏 ま え な が ら 作 業 の 効 率 面 へ の 配 慮 も あ っ て 、 本 研 究 で は 、 形 態 素 の 解 析 は 、基 本 的 に は 中 国 語 版 ペ ン ツ リ ー バ ン ク の セ グ メ ン テ ー シ ョ ン ガ イ ド ラ イ ン (Xia 2000b) お よ び 品 詞 ガ イ ド ラ イ ン (Xia 2000a) に従う 。実際 の作 業で は、 ス タンフ ォー ド大 学が開 発 し た 中 国 語 版 ペ ン ツ リ ー バ ン ク 標 準 の 中 国 語 用 の 単 語セ グ メ ン タ (Stanford Word Segmenter) (Tseng et al. 2005)、 品 詞 タ ガ ー (Stanford Log-linear Part-Of-Speech Tagger) (Toutanova et al. 2000, Toutanova et al. 2003) を 使 っ て 自 動 解 析 し た 結 果(中 国 語 版 ペ ン ツ リ
ー バ ン ク 式) を 筆 者 が 開 発 し た 品 詞 タ グ 自 動 変 換 ス ク リ プ ト を 通 し て 、 ペ ン 通 時 コ ー パ ス 式 の も の に 書 き 換 え る ( 例 : NN→N(普 通名 詞)、 CC→CONJ(接 続 詞)な ど )。ま た、 必 要 に 応 じ て 人 手 に よ る 修 正 も 行 う 。
2.4 統語解析の原則
本 研 究 は 、 基 本 的 に は ペ ン 通 時 コ ー パ ス式 の 解 析 規 約 に 従 っ て 統 語 解 析 を 進 め て い く が 、 研 究 目 的 と 中 国 語 の 実 際 の 使 用 情 況 に 合 わ せ て 、 あ る 程 度 の 修 正 も 行 う 。 以 下 、 解 析 方 針 の う ち 、 独 特 か つ 重 要 な も の に つ い て 説 明 す る 。 (ⅰ ) 研 究 目 的 の 実 際 に 従 っ て ア ノ テ ー シ ョ ン を 行 う 本 研 究 の 主 な 目 標 は 、 あ る 統 語 理 論 の 妥 当 性 を 宣 言 し そ れ を 貫 徹 す る た め で は な く 、 む し ろ 実 用 上 の 理 由 か ら の も の で あ る 。元 々 、SCT では、特定 の統 語 理論に 拘ら ずに 文の表 層 的 な 統 語 解 析 情 報 が 与 え ら れ れ ば 、 評 価 を 行 う こ と に よ っ て そ の 述 語 論 理 式 を 得 る こ と が 可 能 で あ る 。従 っ て 、本 研 究 の 統 語 木 は 、従 来 の X’理論で 提唱 さ れた中 間レ ベル の構造 ( N’、ADJ’など)には 基本的 には こだ わらな い 。こ れに 対し 、中 国 語版ペ ンツ リー バンク の ア ノ テ ー シ ョ ン に お い て は 、統 率 束 縛 (GB) 理論を 基にし たた め に、すべ ての 品詞 カテ ゴ リ ー に 対 す る 句 へ の 投 射 が 要 求 さ れ た 。 ま た 、 (13), (14)が示すよ うに中 間レ ベル の階層 を 作 っ て 補 部 と 付 加 部 の 区 別 も 行 っ た 。19 (13) 晚 上 做 作 业 wǎnshàng zuò zuòyè 夜 や る 宿題 夜 に 宿 題 を す る (14) (VP (NP (N 晚 上 /夜 )) (VP (VB 做 /や る ) (NP (N 作 业 /宿 題 )))) そ の 結 果 、 中 国 語 ペ ン ツ リ ー バ ン ク の 全 て の デ ー タ を 対 象 に 標 準 的 な ツ リ ー 正 規 化 処 理 (standard tree normalizations) を 施 し た 後 で 、 解 析 の た め に 統 計 を 行 う 際 に 、 マ イ ナ ス の 影 響 ( 同 じ 大 き さ の 他 の ツ リ ー バ ン ク に 比 べ る と よ り 乏 し い 句 構 造 規 則 と 分 岐 因 子 ) を 与 え て し ま う こ と を Levy et al. (2003) が指摘 して いる 。本 研究 の立 場か らは 、中 間レ ベル の表 示 を 必 要 と す る 理 由 は な い 。 (15)に は中 間レ ベル の VP がない (本 研究で は、 基本 的には VP を 使 用 し な い た め 、 最 高 階 層 の VP 自 体 も IP に 変 わ っ た )。 た だ し 、 そ の 代 り に NP に そ れ ぞ れ 機 能 タ グ -TMP(時制 的) と -OB1(直 接目的 語) を付 け加え ている 。 (15) (IP (NP-TMP (N 晚 上 /夜 )) (VB 做 /や る ) (NP-OB1 (N 作 业 /宿 題 ))) こ の や り 方 に よ り 異 な る 機 能 タ グ に よ る 両 者 の 区 別 を 可 能 に す る と 同 時 に 、 中 間 の 階 層 が 存 在 し な い た め 、 句 の 内 部 階 層 が よ り 少 な く な る 。 ま た 、 構 造 的 な も の に 比 べ て 、 明 示 的 な 機 能 タ グ の ほ う が よ り 識 別 し や す い 。 そ の 結 果 と し て 、 す べ て の 種 類 の 句 が 常 に 同 一 の フ ラ ッ ト な 構 造 を 取 り 、 そ れ 以 後 の 意 味 処 理 の 段 階 に お い て 部 分 木 の 検 索 や あ る 特 定 の 文 法 項 目 の 確 定 が 極 め て 簡 単 に 行 わ れ る 。 意 味 処 理 の 結 果 を(16)に示す。
20 (16) ∃ x1 t2 e3 ( 作 业 (x1) ∧ 晚 上 (t2) ∧ 做 (e3, _, x1) ∧ tmp(e3) ⊑ t2) ま た 、 そ の 境 界 を 定 義 す る こ と が 困 難 な 句 の 使 用 も で き る 限 り 控 え て い る 。 典 型 的 な 例 は VP である。その た め、本研 究で は、同 じ 項を共 有す る動 詞句の 並列構 造( 第 3.3.1 節を 参 照 の こ と 。)を 表 す ほ か に は VP を使用 しな い。そし て、限 定詞句 (DP) のよう な解析 の コ ス ト が そ の 有 用 性( 本 研 究 の 実 際 か ら 考 え る と )を 超 え て し ま う カ テ ゴ リ ー に 対 し て も 、 そ の ア ノ テ ー シ ョ ン を 省 略 す る こ と に す る 。 (ⅱ ) 句 の 機 能 情 報 を 常 に 丁 寧 に タ ギ ン グ す る 中 国 語 は 機 能 語 や 屈 折 形 態 素 な ど に 乏 し い 言 語 で あ る 。 し か も 、 少 な い 機 能 語 の 中 に は 一 つ 以 上 の 機 能 を 担 う も の も 少 な く な い 。(17)と(18)では 、前 置詞 (P)“在 ”を含む 前置 詞 句 (PP) が、 それ ぞれ 動作進 行の 場所 と時間 を指す 。 (17) 在 公司 工 作 zài gōngsī gōngzuò で 会社 仕 事 す る 会 社 で 仕 事 を す る (18) 在 假日 工作 zài jiàrì gōngzuò に 休日 仕事す る 休 日 に 仕 事 を す る
意 味 処 理 の 段 階 で こ の よ う な 曖 昧 性 が 回 避 で き る よ う に 、各 々 の 統 語 解 析 (19)と (20)では 、 二 つ の PP にそ の機 能 を表す タグ (LOC、TMP) を付 与し てお く必要 がある 。
21 (19) (FRAG (PP (P 在 /で ) (NP (N 公 司 /会 社 ))) (NP-LOC *) (VB 工 作 /仕 事 す る )) (20) (FRAG (PP (P 在 /に ) (NP (N 假 日 /休 日 ))) (NP-TMP *) (VB 工 作 /仕 事 す る )) (19), (20)を 踏 ま え て 、 (17), (18)の 述 語 論 理 式 を 以 下 の (21), (22)に 示 す 。 (21)
∃ x1 e2 (公 司 (x1) ∧ 工 作 (e2) ∧ loc_在 (e2) = x1)
(22) ∃ t1 e2 (假 日 (t1) ∧ 工 作 (e2) ∧ tmp_在 (e2) = t1) 元 々 、ペ ン 通 時 コ ー パ ス の 解 析 規 約 に よ っ て 、PP に関す る機 能情 報 のタギ ング が禁 止さ れ て い る た め 、本 研 究 で は 、PP に機 能タグ を 直接つ ける こと(PP-LOC、PP-TMP など)は し な い が 、中 国 語 の 実 際 の 情 況 と 意 味 処 理 か ら の 要 請 を 考 慮 し 、以 上 の (19)と(20)で 示した 妥 協 案 (PP のす ぐ右 側 に NP を経由 して その 機能情 報を 示す (Butler et al. 2013))を 採用 し た 。 こ れ に よ り 、 ペ ン 通 時 コ ー パ ス と の 一 致 性 が 保 て る と 同 時 に 、 デ ー タ 全 体 に 対 し て も 将 来 よ り シ ス テ マ テ ィ ッ ク に 編 集 で き る( 例 え ば 、コ ー パ ス を 他 の 目 的 で 使 う た め に PP に 関 す る 機 能 情 報 を 必 要 と し な い 場 合 は 、 そ れ ら を 一 気 に 削 除 す る こ と が で き る ) よ う に な っ た 。 こ の よ う な テ ク ニ ッ ク を 用 い て よ り 柔 軟 な ア ノ テ ー シ ョ ン が 行 え る た め 、SCT はよ り豊 富 な 統 語 情 報 を 提 供 で き る 。例 え ば 、(23)と (24)の統語 解析(25)と(26)では、その 両方 が PP
22 を 含 ん で い る が 、 従 属 節 と 主 節 の 意 味 的 関 係 が そ れ ぞ れ 等 位 (coordinate) と 従 属 (subordinate) に な っ て い る 。 精 度 の 高 い 述 語 論 理 式 (27), (28)を 得 る た め に は 、 こ れ ら の 区 別 に 関 す る 情 報 も ア ノ テ ー シ ョ ン す る(PP の すぐ右 側に それ ぞれ CRD、CND をタ ギング ) 必 要 が あ る 。 (23) 因 为 约 翰 去 我 才 去 。 yīnwèi yuēhàn qù wǒ cái qù
か ら ジ ョ ン 行く 私 こそ 行く ジ ョ ン が 行 く か ら こ そ 、 私 は 行 く 。
(24)
如 果 约 翰 去 我 就 去 。
rǔguǒ yuēhàn qù wǒ jiù qù
も し ジ ョ ン 行く 私 「如果 」と 呼応 行く ジ ョ ン が 行 く な ら ば 、 私 は 行 く 。 (25) (IP-MAT (PP (P 因 为 /か ら ) (CP-ADV (IP-SUB (NP-SBJ (NPR 约 翰 /ジ ョ ン )) (VB 去 /行 く )))) (CRD *) (NP-SBJ (PRO 我 /私 )) (ADVP (ADV 才 /こ そ )) (VB 去 /行 く ) (PU 。 ))
23 (26) (IP-MAT (PP (P 如 果 /な ら ば ) (CP-ADV (IP-SUB (NP-SBJ (NPR 约 翰 /ジ ョ ン )) (VB 去 /行 く )))) (CND *) (NP-SBJ (PRO 我 /私 )) (ADVP (ADV 就 /“ 如 果 ” と 呼 応 )) (VB 去 /行 く ) (PU 。 )) (27)
∃ x3 e1 e2 (x3 = 我 ∧ 因 为 (去 (e1, 约 翰 ), 去 (e2, x3) ∧ 才 (e2)))
(28)
∃ x1 (x1 = 我 ∧ ∀ e2 如 果 (去 (e2, 约 翰 ), ∃ e3 (去 (e3, x1) ∧ 就 (e3))))
2.5 SCT による意味処理 の概要
SCT は 、 自 然 言 語 の 文 の 意 味 理 解 を 行 う た め に 動 態 意 味 論 (Dynamic Semantics Groenendijk et al. 1991, Kamp et al. 1993 ) を 拡 張 ・ 発 展 さ せ た 形 式 言 語 理 論 で あ る 。 従 来 の 諸 理 論 に お い て は 、文 の 根 幹 を な す 依 存 関 係 を 統 語 論 的 な も の と し て 捉 え て き た の に 対 し 、 SCT で は 意 味 論 的 な 関 係 と し て 形 式 化 ・ 処 理 を 行 う こ と に 特 徴 が あ る 。 自 然 言 語 に は 、 関 係 節 に よ る 名 詞 修 飾 節 や 主 題 化 な ど の 非 有 界 依 存 関 係 (unbounded dependency) を 初 め と し て 多 様 な 複 雑 な 構 文 が 存 在 し 、 そ の 統 語 ・ 意 味 解 析 は 重 要 な 課 題 と さ れ て き た 。 こ の 問 題 を 解 決 し 、 多 様 な 構 文 を 解 析 す る た め に 、 従 来 の 形 式 文 法 理 論 で は 統 語 構 造 や そ れ に も と づ く 統 語 素 性 の 複 雑 な 操 作 を 行 っ て き た 。 こ れ に 対 し て SCT で
24 は 、 自 然 言 語 の 文 構 造 は 、 意 味 の 基 本 的 な 構 成 要 素 で あ る ス コ ー プ (変 項 の 値 ) を 導 入 し た り 、 操 作 あ る い は 評 価 す る こ と に よ っ て 形 作 ら れ る 依 存 関 係 を 直 接 反 映 し た も の で あ る (Butler 2010) と 考 え る 。 統 語 構 造 と し て は 単 純 な 表 層 統 語 構 造 の み を 仮 定 し 、 ス コ ー プ を 制 御 す る こ と に よ り 、 文 の 意 味 解 析 (評 価 ) を 行 う 。 文 の 解 析 や 解 釈 に お い て 最 も 重 要 な こ と は 、文 が 文 法 的 (well-formed) で ある ため の条件 を明 らか にする ことで ある が、SCT は こ れ を 、 文 の 各 領 域 に お い て 必 要 と さ れ る ス コ ー プ の 数 と 、 割 当 関 数 に よ っ て 供 給 さ れ る ス コ ー プ の 数 と が 一 致 す る こ と で あ る と 定 義 す る (表 現 統 合 性 条 件 )。こ の 条 件 の 下 に 、文 を 構 成 す る 領 域 ご と に ス コ ー プ が 導 入 さ れ た り 、 他 の 変 項 に シ フ ト さ れ た り 、 あ る い は 新 た な ス コ ー プ の 出 現 に よ り 一 時 的 に 不 活 性 化 し た り す る が 、 こ れ に よ り 自 然 言 語 の 文 の 複 雑 な 成 り 立 ち を 体 系 的 に シ ミ ュ レ ー ト 出 来 る と 考 え る の で あ る 。 以 下 、 ご く 単 純 な 文 の 意 味 解 析 過 程 を 示 す 。 (29) 约 翰 爱 玛 丽 。 yuēhàn ài mǎlì ジ ョ ン 愛する メアリ ー ジ ョ ン が メ ア リ ー を 愛 す る 。 ペ ン 通 時 コ ー パ ス 式 の 解 析 ス キ ー ム を 例 文 (29)に適用 する と、 ツリ ー (30)が得られ る。 (30) (IP-MAT (NP-SBJ (NPR 约 翰 /ジ ョ ン )) (VB 爱 /愛 す る ) (NP-OB1 (NPR 玛 丽 /メ ア リ ー )) (PU 。 )) 論 理 意 味 表 示 を 自 動 的 に 行 う た め に は 、 木 構 造 を 評 価 シ ス テ ム の 入 力 と し て 受 け 入 れ ら れ る 形 式 に 変 換 す る 必 要 が あ る 。 こ れ は 、 句 構 造 の 内 部 構 造 を 探 る こ と に よ っ て 実 現 さ れ る 。具 体 的 に は 、木 構 造 を 、ま ず 補 語 お よ び 修 飾 語 と ヘ ッ ド と の ス コ ー プ 関 係( [修 飾 語 [ヘ ッ ド [補 語 ]]]) を 含 む 中 間 レ ベ ル の 表 現 (31)に変換 する 。
25 (31)
NP-SBJ-in: (NPR 约 翰 )
NP-SBJ-out: (NP-SBJ npr "entity" "约 翰 "__LOCAL__) NP-OB1-in: (NPR 玛 丽 )
NP-OB1-out: (NP-OB1 npr "entity" "玛 丽 "__LOCAL__)
IP-MAT-in: (NP-SBJ npr "entity" "约 翰 "__LOCAL__)@IP-MAT@@(VB 爱 )@IP-MAT@@(NP-OB1 npr "entity" "玛 丽 "__LOCAL__)@IP-MAT@@(PU 。 )
(PU 。 )
IP-MAT-out: (IP-MAT-fact ((npr "entity" " 约 翰 ") "arg0") (((npr "entity" " 玛 丽 ") "arg1") (verb lc fh "event" ["arg0", "arg1"] " 爱 "))__LOCAL__"arg1"@NAME@"arg0")
次 に 、 こ れ ら の 表 現 に そ の 文 法 役 割 を 表 す 束 縛 名 称 (binding names) を 追 加 し た上 で 、 こ の 中 間 レ ベ ル の 表 現 を (32)のよう に一 連の 演算( some (不定 の限 定詞)、npr (固有名 詞)、 verb(埋 め 込 み を 含 め な い 動 詞 )、 past (過 去 テ ン ス )、 な ど ) に 置 き 換 え る 。 (32) ( fn fh => ( fn lc => ( ( ( npr "entity" "约 翰 ") "arg0") ( ( ( npr "entity" "玛 丽 ") "arg1")
( verb lc fh "event" ["arg0", "arg1"] "爱 ")))) ["arg1", "arg0", "h"])
["constant", "event"]
さ ら に 、 こ れ ら の 演 算 を シ ス テ ム が 評 価 可 能 な SCT 言語(Use、Hide、Close、Rel、 If、 Lam、 Clean な ど の 関 数 ) (33)に 変 え る 。
26 (33) Hide ("constant", CClose ("constant", Hide ("event", Close ("∃ ", ("event","event"),["event"], Clean (0, ["arg0"], "c",
CUse (C ("约 翰 ", "entity"), "constant", Lam ("constant", "arg0",
Clean (0, ["arg1"], "c",
CUse (C ("玛 丽 ", "entity"), "constant", Lam ("constant", "arg1",
If (fn, Hide ("h", Hide ("arg0", Hide ("arg1",
Rel (["arg1", "arg0", "h"], ["c", "c", "c"], "CHECK", [ Use ("arg1",
Use ("arg0", Use ("event",
Rel (["constant"], ["c"], "爱 ", [At (T ("event", 0), "event"), At (T ("arg0", 0), "arg0"),
At (T ("arg1", 0), "arg1")]))))])))), Hide ("h",
Hide ("arg0", Hide ("arg1",
Rel (["arg1", "arg0", "h"], ["c", "c", "c"], "CHECK", [ Use ("h",
Use ("arg1", Use ("arg0", Use ("event",
27
Rel (["constant"], ["c"], "爱 ", [At (T ("event", 0), "event"), At (T ("arg0", 0), "arg0"), At (T ("arg1", 0), "arg1"), At (T ("h", 0), "h")])))))]))))))))))))))) 最 後 に 、 こ れ に 対 し て 形 式 的 な 評 価 を す る こ と ( そ の 詳 細 は 、 Butler, 2010 を 参 照 の こ と 。) に よ っ て 、 文 の 述 語 論 理 式 (34)が生 じら れる。 (34) ∃ e1 爱 (e1, 约 翰 , 玛 丽 ) こ の よ う に 、SCT が インプ リメ ント された システ ム を 使っ て、ペ ン通時 コー パス 式の解 析 規 約 に 従 っ て 構 築 さ れ た 統 語 解 析 結 果 に 対 し て 処 理 ・ 評 価 を 行 う こ と に よ り 、 通 常 の ツ リ ー バ ン ク で は 取 り 扱 う こ と が 困 難 な 非 有 界 依 存 (unbounded dependency) な ど が 含 ま れ る 構 文 に お け る 格 名 詞 句 と 動 詞 と の 依 存 関 係 を つ き と め る こ と が 可 能 に な る 。 以 下 で は コ ン ト ロ ー ル 構 文 の 例 を 示 す 。
2.6 要素間コントロール関係の同定
一 般 的 に は 、 依 存 関 係 の 表 示 お よ び 述 語 ‐ 項 関 係 の 再 構 成 に 必 要 な た め 、 主 語 ま た は 目 的 語 が 動 詞 の 必 須 格 と し て 求 め ら れ る に も か か わ ら ず 文 中 で 表 現 さ れ て い な い 場 合 、 ゼ ロ 代 名 詞 の 追 加 を 行 っ て そ れ ら を 明 示 す る 必 要 が あ る 。 ゼ ロ 代 名 詞 は 、 一 般 的 に 純 粋 な 代 名 詞 類 の 性 質 を 持 つ pro およ び 代名詞 類の 性質 と照応 形 の 性 質 を 合 わ せ 持 つ PRO に分類さ れる 。従 来コン トロ ール 構文に 対する ゼロ 代名 詞のタ ギ ン グ は 、直 接 PRO を 付け加 える こと が主流 だった 。目 的語 コン ト ロール 構文 の(35)と主 語 コ ン ト ロ ー ル 構 文 の (36)に対 して 、(37)と(38)が示す よう に、中国 語 版ペン ツリ ーバ ンク 式 の 解 析 ス キ ー ム で は 、 コ ン ト ロ ー ル 補 文 で あ る IP に対 して 主語 PRO のアノ テー ション28 を 行 っ て い る 。 (35) 张 三 今 晚 请 我 们 吃 饭 。 zhāngsān jīnwǎn qǐng wǒmen chīfàn 張 三 今 晩 招 待 す る 私たち 食事す る 張 三 は 今 晩 私 た ち を 御 馳 走 す る 。 (36) 李 四 帮 我 们 叫 医 生 。
lǐsì bāng wǒmen jiào yīshēng 李 四 手伝う 私たち 呼ぶ お医者 さん 李 四 は 私 た ち の た め に お 医 者 さ ん を 呼 ぶ 。 (37) (IP (NP-SBJ (NPR 张 三 /張 三 )) (NP-TMP (N 今 晚 /今 晩 )) (VB 请 /招 待 す る ) (NP-OB1 (PRO 我 们 /私 た ち )) (IP (NP-SBJ *PRO*) (VB 吃 饭 /食 事 す る )) (PU 。 ))
29 (38) (IP (NP-SBJ (NPR 李 四 /李 四 )) (VB 帮 /手 伝 う ) (NP-OB1 (PRO 我 们 /私 た ち )) (IP (NP-SBJ *PRO*) (VB 叫 /呼 ぶ ) (NP-OB1 (N 医 生 /お 医 者 さ ん ))) (PU 。 )) こ の よ う な コ ン ト ロ ー ル 構 文 の 解 析 の 仕 方 は あ る 意 味 で 論 理 的 だ が 、 精 度 の 高 い 述 語 ‐ 項 構 造 を 目 的 と し て PRO の値を確 定し よう と する際 に問 題が 出てし まう。 即 ち PRO をコ ン ト ロ ー ル し て い る 対 象 ( 主 文 の 主 語 か 目 的 語 か ) の 同 定 が 出 来 な い の で あ る 。 こ れ に 対 し て 、 本 研 究 で は 、 統 語 解 析 の 段 階 で 句 に そ れ ぞ れ 異 な る 機 能 タ グ を 付 与 し 、 IP、CP の 下 位 カ テ ゴ リ ー を 緻 密 化 す る こ と に よ っ て 、そ の 中 に 埋 め 込 ま れ た 主 語 や 目 的 語 の デ ィ フ ォ ー ル ト 的 解 釈 が 意 味 処 理 の 段 階 で 可 能 と な っ た 。 (39) (IP-MAT (NP-SBJ (NPR 张 三 /張 三 )) (NP-TMP (N 今 晚 /今 晩 )) (VB 请 /招 待 す る ) (NP-OB1 (PRO 我 们 /私 た ち )) (IP-INF (VB 吃 饭 /食 事 す る )) (PU 。 ))
30 (40) (IP-MAT (NP-SBJ (NPR 李 四 /李 四 )) (VB 帮 /手 伝 う ) (NP-OB1 (PRO 我 们 /私 た ち )) (IP-PPL (VB 叫 /呼 ぶ ) (NP-OB1 (N 医 生 /お 医 者 さ ん ))) (PU 。 )) 例 え ば 、 (39)と(40)では 、PRO のタギン グが 行 われず 、そ の代 りに、 補文の 二つ の IP が そ れ ぞ れ IP-INF(不 定 詞句 )お よび IP-PPL( 分詞句 )とされ てい る 。こ れに より 、SCT に お い て 、IP-PPL に対し て、「 そ れ に よ っ て 直 接 支 配 さ れ る 主 語 項( NP-SBJ 或いは IP-PPL-SBJ) が 文 中 に 明 示 的 に 表 示 さ れ て い な い 場 合 、 そ れ よ り 先 行 し し か も そ れ と 姉 妹 ( そ れ と 同 じ レ ベ ル に あ る 要 素 ) の 関 係 を 持 つ 主 語 項 が そ れ が 直 接 支 配 す る 主 語 項 と な る 」 と い う デ ィ フ ォ ー ル ト 的 解 釈 を( 今 の 段 階 で の 暫 定 的 な も の と し て )与 え る こ と が 出 来 る 。ま た 、IP-INF に 対 し て は 、「 そ れ に よ っ て 直 接 支 配 さ れ る 主 語 項 が 文 中 に 明 示 的 に 表 示 さ れ て い な い 場 合 、 そ れ よ り 先 行 し し か も そ れ と 姉 妹 の 関 係 を 持 つ 目 的 語 項 が そ れ が 直 接 支 配 す る 主 語 項 と な る 。」と い う デ ィ フ ォ ー ル ト の 解 釈 を 同 様 に 付 与 し さ え す れ ば 、ほ と ん ど の 場 合 、空 範 畴 を 表 す ゼ ロ 代 名 詞 PRO のアノテ ーシ ョン を行わ ずに済 む。こ れに よっ て、文全 体の 統語 構造 が 簡 潔 に な る と と も に 、従 来 の ゼ ロ 代 名 詞 PRO をタグ付 けす る方 法 と比べ てよ り精 密 な要 素 間 の 同 一 指 示 関 係 を 意 味 処 理 に よ っ て 捉 え ら れ る よ う に な る 。 (41) ∃ x4 t1 e2 e3 ( x4 = 我 们 ∧ 今 晚 (t1) ∧
31 (42) ∃ x4 x1 e2 e3 ( x4 = 我 们 ∧ 医 生 (x1) ∧ 帮 (e3, 李 四 , x4, 叫 (e2, 李 四 , x1))) (41), (42)が 示 す と お り 、(35)に お け る 主 文 目 的 語 と 補 文 主 語 、お よ び (36)の 主 文 主 語 と 補 文 主 語 と を 同 一 指 示 で あ る と し て 関 係 づ け る こ と が 出 来 る 。
2.7 句レベルのスコープアノテーション
さ ら に 、語 順 変 化 や 否 定 の 作 用 域 な ど の 問 題 も 視 野 に 入 れ る と 、制 御 は 一 層 複 雑 に な る 。 一 般 的 に 言 え ば 、中 国 語 は 世 界 の 多 く の 言 語 と 同 じ よ う に 主 語 が 文 頭 に 現 れ る 言 語 で あ る 。 し か し 、 場 合 に よ っ て は 、 そ れ 以 外 の 位 置 に 現 れ る こ と も あ る 。 (43) 我 喝 啤 酒 。 wǒ hē píjiǔ 私 飲む ビール 私 は ビ ー ル を 飲 む 。 (44) 啤 酒 我 喝 。 píjiǔ wǒ hē ビ ー ル 私 飲む ビ ー ル は 私 が 飲 む 。 (43), (44)は ご く 単 純 な 例 で あ る 。 情 報 伝 達 上 に 多 少 の 相 違 が あ る と し て も 、 二 つ の 文 に32 お け る 各 要 素 が 同 じ 統 語 ・ 意 味 的 関 係 を 持 つ こ と は 確 実 で あ る 。 そ こ で 、 両 文 に そ れ ぞ れ (45), (46)の よ う な 統 語 解 析 を 付 与 す る こ と が 出 来 る 。 (45) (IP-MAT (NP-SBJ (PRO 我 /私 )) (VB 喝 /飲 む ) (NP-OB1 (N 啤 酒 /ビ ー ル )) (PU 。 )) (46) (IP-MAT (NP-OB1 (N 啤 酒 /ビ ー ル )) (NP-SBJ (PRO 我 /私 )) (VB 喝 /飲 む ) (PU 。 )) (43), (44)は ど ち ら も 単 文 で あ る た め 、(45)に 比 べ て 、(46)で は 目 的 語 が 主 語 の 前 に 移 動 し た と し て も 、 両 者 は 同 じ 意 味 処 理 の 結 果 (47)が得ら れる 。 (47) ∃ x3 x1 e2 (x3 = 我 ∧ 啤 酒 (x1) ∧ 喝 (e2, x3, x1)) し か し 、 こ れ は あ く ま で も 単 文 の 話 で 、 従 属 節 を 伴 う 複 文 を 対 象 と す る と 新 た な 問 題 が 出 て し ま う 。 (48), (49)は複文 の例 であ る。 (48) 张 三 因 为 昨 晚 熬 夜 了 今 天 没 去 学 校 。
zhāngsān yīnwèi zuówǎn áoyè le jīntiān méi qù xuéxiào 張 三 か ら 昨 夜 徹 夜 す る 完了 今日 否 定 行く 学校 張 三 は 昨 夜 徹 夜 し た か ら 今 日 学 校 へ 行 か な か っ た 。
33 (49)
张 三 今 天 没 去 学 校 因 为 昨 晚 熬 夜 了 。
zhāngsān jīntiān méi qù xuéxiào yīnwèi zuówǎn áoyè le 張 三 今 日 否 定 行く 学校 か ら 昨 夜 徹 夜 す る 完了 張 三 は 今 日 学 校 へ 行 か な か っ た 。 昨 夜 徹 夜 し た か ら 。 (48), (49)で は 、主 節“ 张 三 今 天 没 去 学 校 ”と 従 属 節“ 因 为 昨 晚 熬 夜 了 ”と の 順 番 が 逆 に な っ て い る 。 今 ま で 紹 介 し て き た 解 析 法 を 使 う と 、 両 方 の 統 語 解 析 結 果 は そ れ ぞ れ (50), (51) に な る 。 (50) (IP-MAT (NP-SBJ (NPR 张 三 /張 三 )) (PP (P 因 为 /か ら ) (CP-ADV (IP-SUB (NP-TMP (N 昨 晚 /昨 夜 )) (VB 熬 夜 /徹 夜 す る ) (AS 了 /完 了 )))) (CRD *) (NP-TMP (N 今 天 /今 日 )) (NEG 没 /否 定 ) (VB 去 /行 く ) (NP-OB1 (N 学 校 /学 校 )) (PU 。 ))
34 (51) (IP-MAT (NP-SBJ (NPR 张 三 /張 三 )) (NP-TMP (N 今 天 /今 日 )) (NEG 没 /否 定 ) (VB 去 /行 く ) (NP-OB1 (N 学 校 /学 校 )) (PP (P 因 为 /か ら ) (CP-ADV (IP-SUB (NP-TMP (N 昨 晚 /昨 夜 )) (VB 熬 夜 /徹 夜 す る ) (AS 了 /完 了 )))) (CRD *) (PU 。 )) (50), (51)を シ ス テ ム に 入 力 す る と 、そ の 意 味 処 理 の 結 果 は 次 の (52), (53)の と お り に な る 。 (52) ¬ ∃ x1 t2 t3 e4 e5 ( 学 校 (x1) ∧ 昨 晚 (t2) ∧ 今 天 (t3) ∧ 因 为 (熬 夜 _了 (e4, 张 三 ) ∧ tmp(e4) = t2, 去 (e5, 张 三 , x1) ∧ tmp(e5) = t3)) (53) ¬ ∃ x1 t2 t3 e4 e5 ( 学 校 (x1) ∧ 今 天 (t3) ∧ 昨 晚 (t2) ∧ 因 为 (熬 夜 _了 (e4, x1) ∧ tmp(e4) = t2, 去 (e5, 张 三 , x1) ∧ tmp(e5) = t3))
35 (48), (49)の 述 語 論 理 式 と し て の (52), (53)は 、 問 題 点 が 残 っ て い る 。 (53)で は 、 述 語 “ 熬 夜 ”の 動 作 主 は x1 の“ 学校 ”にな って しま っ ている 。そ れに 対し て 、(52)では 、述 語“熬 夜 ”の 動 作 主 は“ 张 三 ”で あ り 、こ れ は 言 語 デ ー タ の 実 情 に 合 っ て い る が 、(52), (53)とも、 否 定 (negation) のオペ レータ ー ¬ が述語 論理 式の最 初に 現れ ている 。そのた め、(52)の意 味 は 、「 張 三 は 昨 夜 徹 夜 し た か ら 今 日 学 校 へ 行 っ た と い う こ と は 真 実 で は な い 」と な る 。し か し 、 こ れ は 明 ら か に 文 の 元 の 意 味 を 捉 え そ こ な っ て い る 。 こ の よ う な 望 ま し く な い 処 理 の 結 果 が 出 た 理 由 と し て は 、 ま ず 、 CP-ADV( そ れ を 直 接 支 配 す る PP が存在す る場合 も同 様) が直接 支配す る主 語項 を、文 中にあ る 同 一指 示関係 を 持 つ 名 詞 句 と 同 定 す る た め に 、「 CP-ADV によって 直接 支配 される 主語項 が文 中に 明示的 に 表 示 さ れ て い な い 場 合 、 そ れ よ り 先 行 し し か も そ れ と 姉 妹 の 関 係 を 持 つ 目 的 語 項 ( 目 的 語 が 存 在 し な い 場 合 は 主 語 項 ) が そ れ が 直 接 支 配 す る 主 語 項 と な る 」 と い う デ ィ フ ォ ー ル ト の 解 釈 を 与 え て い る こ と に あ る 。 こ の よ う な デ ィ フ ォ ー ル ト の 解 釈 に よ り 、 ほ と ん ど の 情 況 に 対 応 で き る が 、 (49)の よ う に そ の 言 語 が 持 つ 一 般 的 な 語 順 に 従 わ な い 文 を 対 象 と す る 場 合 は 、 矛 盾 を も た ら し て し ま う 。 即 ち 、 (49)で は 、主 文 の 目 的 語 “ 学 校” は CP-ADV を 直 接 支 配 し て い る PP“因为 昨晚 熬夜了 ”よ りも先 行し しか もそれ と姉妹 の関 係を 持って い る に も 関 わ ら ず 、 そ れ が そ の 主 語 と は な ら ず 、 む し ろ 主 文 の 主 語 “ 张 三 ” こ そ 補 文 の 主 語 で あ る 。 さ ら に 、 (50), (51)を考 察すれ ばわ かる ように 、否定 のマ ーカ ー“ 没 ”はど ちら にお いて も 主 文 の 述 語 “ 去 ” に つ い て い る た め 、 そ の 述 語 論 理 式 で あ る (52), (53)では、否 定の オペ レ ー タ ー ¬ が共に 主節 に付加 され てい る 。即 ち、(48), (49)のような 従属節 を持 つ複 文は 、 そ の 主 節 に 否 定 が 付 く 場 合 、 否 定 の 作 用 域 が 従 属 節 を も 包 含 す る の か そ れ と も 主 節 だ け を 含 む の か に つ い て は 、 そ の 文 法 構 造 か ら 判 断 す る こ と が 不 可 能 で あ る 。 以 上 を ま と め る と 、 未 解 決 の 問 題 点 が ま だ 二 点 残 っ て い る 。 そ れ は 、 句 に 与 え た デ ィ フ ォ ー ル ト の 解 釈 が い か に 柔 軟 に 様 々 な 情 況 ( 語 順 の 変 化 な ど ) に 対 応 で き る か 、 お よ び 否 定 の 作 用 域 を 、 い か に 自 由 に 操 る か と い う こ と で あ る 。 以 上 の 問 題 点 を 解 決 す る た め に 、 SCT では 、第 2.6 節に 見られ た ように 句に 埋め 込まれ た 主 語 や 目 的 語 に 対 し て デ ィ フ ォ ー ル ト 的 解 釈 を 付 与 す る 他 に 、 ス コ ー プ の 階 層 (scope hierarchy) と い う 概 念 も 導 入 し た 。 ペ ン 通 時 コ ー パ ス 式 の 解 析 規 約 に 従 っ て 構 築 し て き た ツ リ ー は 常 に フ ラ ッ ト な た め に 、 句 レ ベ ル に お け る 各 要 素 間 の ス コ ー プ 関 係 は 基 本 的 に は 自 由 で あ る 。 と は い う も の の 、 複
36 数 の 修 飾 語・句 が 存 在 す る 場 合 は 、あ る 程 度 の 制 限 を 加 え る 必 要 が あ る 。Butler et al. (2013) に よ る と 、 基 本 的 な デ ィ フ ォ ー ル ト の 順 番 と し て 、 自 然 言 語 の 語 順 が 参 考 と し て 用 い ら れ る 。 従 っ て 、 よ り 最 初 に 現 れ る 修 飾 語 ・ 句 は よ り 広 い ス コ ー プ を 取 る こ と に な る 。 ス コ ー プ の 階 層 の デ ィ フ ォ ー ル ト 値 に 影 響 を 及 ぼ す 要 因 は 、自 然 言 語 の 語 順 の 他 に も 幾 つ か あ る 。 ま ず 、 文 ・ 句 の 述 語 ( そ れ が 補 語 (CP-THT や IP-INF など) を 伴う 場合は 、そ の補 語)は 常 に も っ と も 狭 い ス コ ー プ を 取 る 。 そ れ か ら 、 述 語 が イ ベ ン ト 束 縛 を 伴 う 動 詞 の 場 合 、 そ の イ ベ ン ト 束 縛 に 掛 っ て い る 全 て の 修 飾 語 ・ 句 が そ の イ ベ ン ト 束 縛 よ り も 狭 い ス コ ー プ を 取 る 。 た だ し 、 修 飾 語 ・ 句 に 付 く 機 能 タ グ ( TPC(主 題 ) や VOC( 呼 格 )な ど ) に よ り、 も っ と も 広 い ス コ ー プ に 変 え ら れ る こ と も あ る 。最 後 に 、機 能 タ グ -SBJ を持つ項 に対 して 、 他 の 修 飾 語 ・ 句 よ り も 高 い ス コ ー プ の 階 層 を 持 つ と い う デ ィ フ ォ ー ル ト の 値 を 設 定 す る 。 こ れ は 、(50)と (52)にお ける よ うに、自然 言語 の語順 に頼 らず に従属 節の主 語項 を自 動的に 主 節 の 主 語 項 に 同 定 す る た め で あ る 。 以 上 の よ う な ス コ ー プ の 階 層 を 決 め る た め の デ ィ フ ォ ー ル ト 的 設 定 に よ り 、 自 然 言 語 の ほ と ん ど の 情 況 に 対 応 で き る 。 更 に 、 (48), (49)のよう な特別 な例 外 を解決 でき る た めに、 -HIGH お よ び -LOW と い う 二 つ の 機 能 タ グ を 導 入 す る こ と に よ っ て 、 ス コ ー プ の 階 層 関 係 に 関 す る 精 密 的 な 調 整 も 可 能 に な る 。 以 上 を 踏 ま え て 、 ス コ ー プ の 階 層 を 降 順 ( 高 い → 低 い ) で 以 下 の (54)のよ うに規 定す る (Butler et al. 2013)。 (54) ① -TPC、-VOC およ び -HIGH によっ てマ ーク される 修飾 語・ 句 ② -SBJ を持つ項 ③ IP-PPL ④ MD(モダ リティ ー) ⑤ NEG(否 定) ⑥ -HIGH および -LOW によ っ てマー クさ れて いない 修飾語 ・句 ( 語 順順) ⑦ -LOW によっ てマ ークさ れ る修飾 語・ 句 ⑧ 述 語 ⑨ 補語 -HIGH あ る い は -LOW が 付 与 さ れ た 修 飾 語 ・ 句 が 二 つ 以 上 あ る 場 合 、 そ の ス コ ー プ の 階
37 層 が 自 然 言 語 の 語 順 で 決 ま る こ と に な る 。
ス コ ー プ の 階 層 を 導 入 す る こ と に よ っ て 、 CP-ADV も含め て、 第 2.6 節に示 し た IP-PPL お よ び IP-INF に 関す る ディフ ォー ルト の解釈 を以下 のよ うに 修正・統合す るこ とが 出来る 。
CP-ADV / IP-PPL / IP-INF :
そ れ ら に よ っ て 直 接 支 配 さ れ る 主 語 項 ( NP-SBJ 或いは IP-PPL-SBJ) が文中 に明 示的 に 表 示 さ れ て い な い 場 合 、 そ れ ら と 姉 妹 の 関 係 を 持 つ 要 素 か ら な る ス コ ー プ の 階 層 に お い て 、 そ れ ら よ り も 高 い 階 層 に あ り 、 し か も も っ と も 近 い 距 離 を 保 つ 必 要 項 ( NP-INST、 NP-OB2、 NP-LGS、 NP-OB1、 NP-SBJ) が 、 そ れ ら が 直 接 支 配 す る 主 語 項 と な る 。 な ぜ 、 (41), (42)では 、要素 間の 長距 離依存 関係の 確定 が出 来る の か、こ こで 考察 してみ よ う 。 以 上 で 規 定 し た ス コ ー プ の 階 層 に 、 (39), (40)にお ける IP-MAT によっ て直 接支 配さ れ る 各 要 素 を 当 て は め る と 、 そ の ス コ ー プ 階 層 は そ れ ぞ れ 以 下 の (55), (56)のよ うに なる 。 (55) [NP-SBJ (张 三 ) [NP-TMP (今 晚 ) [NP-OB1 (我 们 ) [VB (请 ) [IP-INF (吃 饭 )]]]]] (56) [NP-SBJ (李 四 ) [IP-PPL (叫 医 生 ) [NP-OB1 (我 们 ) [VB (帮 )]]]]
す る と 、 IP-PPL / IP-INF に 与え たデ ィフォ ールト の解 釈に より、 (55)では 、NP-OB1 が IP-INF よ り も 高 い ス コ ー プ の 階 層 に あ り 、し か も そ れ と も っ と も 近 い の で 、そ の 主 語 項 に な る の に 対 し て 、 (56)では、 IP-PPL よ りも 高 いスコ ープ の階 層を持 ちしか もそ れに もっと