• 検索結果がありません。

意味処理を目的とする中国語構文解析の研究 ―動詞連続構文および結果構文を中心に―

N/A
N/A
Protected

Academic year: 2021

シェア "意味処理を目的とする中国語構文解析の研究 ―動詞連続構文および結果構文を中心に―"

Copied!
199
0
0

読み込み中.... (全文を見る)

全文

(1)

意味処理を目的とする中国語構文解析の研究 ―動

詞連続構文および結果構文を中心に―

著者

周 振

学位授与機関

Tohoku University

学位授与番号

11301甲第16486号

URL

http://hdl.handle.net/10097/59659

(2)

博士論文

意味処理を目的とする中国語構文解析の研究

―動詞連続構文および結果構文を中心に―

周振

(3)

1

目次

第 1 章 序 論 ... 4 1.1 言 語 学 研 究 と コ ー パ ス ... 4 1.2 統 語 ・ 意 味 情 報 を タ グ 付 け し た コ ー パ ス の 開 発 ... 4 1.3 研 究 課 題 ... 7 1.4 研 究 の 意 義 ... 9 1.5 本 稿 の 構 成 と 概 要 ... 10 第 2 章 本 研究 におけ るアノ テー ショ ン方式 ... 12 2.1 ペ ン 通 時 コ ー パ ス 式 の 解 析 規 約 ... 12 2.2 ペ ン 通 時 コ ー パ ス 式 ア ノ テ ー シ ョ ン 方 式 の メ リ ッ ト ... 14 2.3 形 態 素 解 析 ... 17 2.4 統 語 解 析 の 原 則 ... 18 2.5 SCT に よ る 意 味 処 理 の 概 要 ... 23 2.6 要 素 間 コ ン ト ロ ー ル 関 係 の 同 定 ... 27 2.7 句 レ ベ ル の ス コ ー プ ア ノ テ ー シ ョ ン ... 31 2.8 ま と め ... 44 第 3 章 動 詞連 続構文 の解析 ... 46 3.1 は じ め に ... 46 3.2 中 国 語 SVC の 定 義 お よ び そ の 下 位 カ テ ゴ リ ー ... 47 3.3 二 つ 以 上 の 別 個 の イ ベ ン ト を 表 す SVC ... 49 3.3.1 二 つ の 動 詞 句 が 並 列 的 に 連 続 あ る い は 交 替 す る SVC ... 49 3.3.2 一 つ の 動 詞 句 が も う 一 つ の 動 詞 句 を 修 飾 す る SVC ... 52 3.4 一 つ の 動 詞 句 が も う 一 つ の 動 詞 句 の 動 詞 の 項 で あ る SVC... 58 3.4.1 一 つ の 動 詞 句 が も う 一 つ の 動 詞 句 の 動 詞 の 主 語 で あ る SVC ... 58 3.4.2 一 つ の 動 詞 句 が も う 一 つ の 動 詞 句 の 動 詞 の 目 的 語 で あ る SVC ... 60 3.5 ピ ボ ッ ト 構 造 を 持 つ SVC ... 67 3.6 二 番 目 の 動 詞 句 が 記 述 的 な も の で あ る SVC ... 69 3.7 意 味 の 曖 昧 性 を 持 つ 中 国 語 SVC の 解 析 ... 76 3.8 三 つ 以 上 の 動 詞 句 か ら な る 中 国 語 SVC の 解 析 ... 79

(4)

2 3.9 ま と め ... 81 第 4 章 結 果構 文の解 析 ... 83 4.1 は じ め に ... 83 4.2 VR 構 造 の 文 法 カ テ ゴ リ ー と そ の 主 要 部 ... 85 4.2.1 語 彙 レ ベ ル に お け る 形 成 ... 86 4.2.2 統 語 レ ベ ル に お け る 形 成 ... 92 4.2.3 本 研 究 の 立 場 ... 96 4.3 本 研 究 に お け る 結 果 構 文 の 定 義 お よ び そ の 分 類 ... 98 4.4 動 作 主 型 ... 101 4.4.1 「 動 作 主 」 型 ... 101 4.4.2 「 動 作 主 ‐ 対 象 」 型 ... 109 4.4.3 「 動 作 主 ‐ 道 具 」 型 ... 112 4.5 被 動 作 主 型 ... 118 4.5.1 「 被 動 作 主 」 型 ... 119 4.5.2 「 被 動 作 主 ‐ 動 作 主 」 型 ... 122 4.6 道 具 型 ... 125 4.6.1 「 道 具 」 型 ... 126 4.6.2 「 道 具 ‐ 対 象 」 型 ... 131 4.7 ツ リ ー の 変 換 ... 136 4.8 ま と め ... 144 第 5 章 終 わり に ... 146 5.1 ま と め ... 146 5.2 今 後 の 課 題 ... 148 補 遺 A:「离合 词」 の一 体性 ... 149 A.1 は じ め に ... 149 A.2 課 題 ... 149 A.3 先 行 研 究 ... 150 A.4 VN 型 動 詞 の 抽 出 ... 151 A.5 使 用 す る コ ー パ ス ... 152 A.6 調 査 の 手 法 ... 152

(5)

3 A.7 結 果 ... 153 A.8 考 察 ... 154 A.9 ま と め ... 156 謝 辞 ... 158 参 考 文 献 ... 159 付 録 A:タ グ一 覧 ... 165 1 品 詞 タ グ ... 165 2 統 辞 タ グ ... 166 2.1 句 ... 166 2.2 複 合 動 詞 ... 166 3 機 能 タ グ ... 167 4 空 範 畴 ... 168 付 録 B:コ ント ロー ル ・非コ ント ロー ル動詞 ... 169 1 コ ン ト ロ ー ル 構 文 し か 作 れ な い 動 詞 お よ び そ の 出 現 頻 度 ... 169 2 非 コ ン ト ロ ー ル 構 文 し か 作 れ な い 動 詞 お よ び そ の 出 現 頻 度 ... 181 3 両 方 と も 作 れ る 動 詞 お よ び そ の 出 現 頻 度 ... 188

(6)

4

第 1 章 序論

1.1 言語学研究とコーパス

電 子 化 さ れ た 文 章 に 対 し て 言 語 分 析 情 報 を 付 加 ( タ グ 付 け ) し た コ ー パ ス が 言 語 研 究 に と っ て 有 用 で あ る こ と は 言 う ま で も な い 。 し か し 、 日 本 と 中 国 に お い て 文 系 の 言 語 研 究 者 が 使 用 す る コ ー パ ス は 、文 法 情 報 で は 主 と し て 形 態 素 情 報 だ け 付 加 し た も の が 中 心 で あ り 、 こ れ で は 大 量 の テ ク ス ト か ら 必 要 な 言 語 情 報 を 抽 出 す る に 当 た っ て 障 害 が 大 き い 。 各 文 に 対 し て 統 語 解 析 情 報 を タ グ 付 け し た ツ リ ー バ ン ク (Treebank) は よ り 柔 軟 な 検 索 や文 法 情 報 の 抽 出 を 可 能 に す る 。 し か し 、 日 本 語 に 関 し て 統 辞 情 報 を タ ギ ン グ し た コ ー パ ス は 、 言 語 処 理 研 究 上 の 目 的 で 文 節 に も と づ い て 構 築 さ れ た も の が 中 心 で あ る ( 例 え ば 、 京 都 大 学 テ キ ス ト コ ー パ ス (Kurohashi et al. 2003))。一方、中国語では、データの量も質も確保で き る ツ リ ー バ ン ク (Penn Chinese Treebank Xue et al. 2000) が既に公表されてはいるが 、日 本 語 の 場 合 に 類 似 し て 、 元 々 構 文 解 析 器 の 評 価 及 び 訓 練 を 目 的 と し て デ ザ イ ン さ れ た も の で あ る た め 、 こ れ か ら 言 語 研 究 者 が 必 要 と す る 文 法 的 依 存 関 係 を 得 る こ と は 極 め て 困 難 で あ る 。 さ ら に 、 ツ リ ー バ ン ク そ の も の に も 限 界 が あ る 。 通 常 の ツ リ ー バ ン ク で は 表 層 的 な 統 辞 構 造 が 示 さ れ る だ け で あ る 。コ ン ト ロ ー ル 構 文 や 主 題 化 構 文 や 関 係 節 構 文 等 が 表 れ た 場 合 、 文 の 基 本 を な す 格 名 詞 句 と 動 詞 と の 依 存 関 係 を つ き と め る こ と は 非 常 な 困 難 を と も な う 。 か と い っ て 、形 式 統 語 理 論( Head-driven Phrase Structure Grammar Pollard et al. 1994 等)を 応 用 し て こ れ ら の 複 雑 な 構 文 を 自 動 解 析 し よ う と す る 試 み は 、実 用 化 の 域 に 達 し て い な い 。

(7)

5

こ れ に 対 し て 、 バ ト ラ ー (Butler 2010) が 提 唱 す る ス コ ー プ 制 御 理 論 (Scope Control Theory; SCT) で は 、 文 の 表 層 的 な 統 語 解 析 情 報 が 与 え ら れ れ ば 、 そ の 意 味 論 的 な 適 切 性 (well-formedness) を 計 算 す る こ と を 通 じ て 論 理 意 味 情 報 ( 述 語 論 理 式 ) を 得 る こ と を 可 能 に す る 。筆 者 が 加 わ っ て い る 欅 ツ リ ー バ ン ク の プ ロ ジ ェ ク ト で は SCT をイン プリメ ント し た シ ス テ ム を 用 い て 、 日 本 語 や 英 語 の ツ リ ー バ ン ク を 入 力 と し て そ れ ぞ れ の 論 理 意 味 表 示 を タ グ 付 け し た コ ー パ ス を 構 築 す る こ と を 試 み て い る 。 筆 者 ら が 目 的 と す る 高 精 度 の 論 理 意 味 表 示 が タ グ 付 け さ れ た コ ー パ ス の 構 築 の た め に は 、 構 造 の 曖 昧 性 を 克 服 し て 単 純 な 格 フ レ ー ム ( 述 語 ‐ 項 関 係 ) を 超 え た よ り 複 雑 な 構 文 に よ り 表 現 さ れ た 意 味 情 報 の 抽 出 が 可 能 な 入 力 デ ー タ を 必 要 と す る 。 当 初 、 筆 者 ら は 、 す で に 入 手 可 能 な 日 本 語 統 語 解 析 情 報 付 き コ ー パ ス に 注 目 し 、 そ の 中 に 含 ま れ た 統 語 情 報 へ の ア ク セ ス の 試 み を 行 っ た (Butler et al. 2012a)。

日 本 語 の 文 に 対 し て 統 語 解 析 情 報 を 付 加 し た コ ー パ ス は い く つ か あ る が 、 そ の 代 表 で あ る 京 都 大 学 テ キ ス ト コ ー パ ス を は じ め と し て 、 そ の 多 く は 文 節 に 基 づ く も の で あ り 、 申 請 者 ら が 目 指 す 文 の 意 味 の 自 動 解 析 に 利 用 す る に は 問 題 が あ る 。 京 都 大 学 テ キ ス ト コ ー パ ス 第 4 版のうち 5,000 の文につ いて は、 格、照 応およ び指 示情 報が付 加され てい る。 格関係 の 追 加 に よ り 、 ペ ン ツ リ ー バ ン ク (Penn Treebank) のやり方と同じく、述語のとる項を確 定 す る こ と は 出 来 る 。 し か し 、 文 の 意 味 情 報 を 述 語 及 び 述 語 の と る 項 よ り 深 い レ ベ ル ま で 求 め た い 場 合 、 文 節 に も と づ く 解 析 は 問 題 を 生 じ る 。 文 節 に も と づ く 解 析 は 、 節 と 節 と の 依 存 関 係 を 教 え て く れ る が 、 節 の 壁 を 越 え た 文 法 関 係 の 解 明 は で き な か っ た 。 そ の た め 、 筆 者 ら は 文 が 実 際 に 表 示 す る 複 雑 な 統 語 情 報 を 京 都 大 学 テ キ ス ト コ ー パ ス に 基 づ い て 得 よ う と 試 み た 。そ の 一 例 と し て 、文 節 の 結 合 及 び 分 割 に 関 す る 処 理 (Zhou et al. 2012) が 挙 げ ら れ る 。 図 1-1 と 図 1-2 に 、 文 節 の 分 割 の 実 例 を 示 す 。 文 節 分 割 以 前 に 一 つ の 文 節 で あ る「 買 え な い 」( 文 節 番 号 2)を「 買え 」( 文 節 番 号 2)と「な い」( 文 節 番 号 2.5) に 分 け る こ と に よ っ て 、 否 定 ( な い ) の 作 用 範 囲 の 調 整 を 可 能 に し た 。 ま た 、 筆 者 が 変 更 プ ロ グ ラ ム を 開 発 し た 際 に 、 結 合 及 び 分 割 の 結 果 が 文 節 間 の 依 存 関 係 全 体 に 波 及 効 果 を 与 え な い よ う に 注 意 を 払 い ( こ の 例 の 場 合 、 分 割 さ れ た 文 節 2 の依 存 関係も 同時 に“ -1D” か ら“ 2.5D”に変更 )、その結 果 、変 更プロ グ ラムに よる 京都 テキス トコー パス 全体 に対す る 部 分 自 動 修 正 が 実 現 で き た 。

(8)

6 図 1-1 文節分割前 図 1-2 文節分割後 し か し 、 文 節 表 記 の 壁 は や は り 厚 く 、 個 々 の 文 節 を 超 え て シ ス テ マ テ ィ ッ ク に 情 報 を 補 充 す る 方 法 を 見 出 す こ と は 出 来 な か っ た 。 し か も 、 現 時 点 で 必 要 な 大 規 模 の 日 本 語 ツ リ ー バ ン ク は ま だ 存 在 し な い の で 、 筆 者 ら は 、 日 本 語 ツ リ ー バ ン ク を ゼ ロ か ら 構 築 す る こ と に 方 針 転 換 し た 。 一 方 、 中 国 語 の 場 合 、 上 述 し た よ う に 、 中 国 語 版 ペ ン ツ リ ー バ ン ク (Penn Chinese Treebank) は そ の 設 計 上 の 理 由 が あ っ て 、 (1)の 統 語 木 で あ る (2)に 見 ら れ る よ う に 、 そ の 中 に 収 納 さ れ た 統 語 木 は 内 部 構 造 が 複 雑 で 階 層 が 多 く 、 同 じ カ テ ゴ リ ー の 句 や 節 が 何 度 も 重 な っ て 部 分 木 を 構 築 す る ( そ の 典 型 的 な 例 は 、 名 詞 句 (NP) 及び動詞句 (VP) に対する扱 い で あ る ) こ と が あ る 。 (1) 之 前 失 去 的 机 会 又 来 了 。

zhīqián shīqù de jīhuì yòu lái le こ の 前 失う 補文標 識 チャン ス また 来る 完了 こ の 前 失 っ た チ ャ ン ス が ま た や っ て き た 。

(9)

7 (2)

(TOP (IP (NP-SBJ (CP (WHPP-1 (-NONE- *OP*))

(CP (IP (NP-SBJ (-NONE- *pro*)) (VP (ADVP (AD 之 前 /こ の 前 )) (VP (VV 失 去 /失 う ) (NP-OBJ (-NONE- *T*-1))))) (DEC 的 /補 文 標 識 ))) (NP (NN 机 会 /チ ャ ン ス ))) (VP (ADVP (AD 又 /ま た )) (VP (VV 来 /来 る ) (AS 了 /完 了 ))) (PU 。 ))) ま た 、 中 国 語 の 中 の 複 雑 な 統 語 構 造 を と る 構 文 に 対 し て 深 い 処 理 を 行 っ て い な い 。 例 え ば 、 中 国 語 で 最 も 多 機 能 を 果 た す “ 把 (bǎ)” 構文に対 して 、“ 把” 自体を動 詞とし て扱い そ の 後 ろ の 部 分 を 全 て “ 把 ” の 取 る 目 的 語 と 見 な す よ う な 単 純 す ぎ る ア ノ テ ー シ ョ ン を 行 っ て い る 。 そ の 結 果 、 中 国 語 版 ペ ン ツ リ ー バ ン ク は 、 言 語 現 象 の 検 証 を 行 う た め の プ ラ ッ ト ホ ー ム に は な れ な か っ た し 、そ の デ ー タ を そ の ま ま 用 い て SCT を 実装し た 意 味処 理シス テ ム に 入 力 し 文 の 論 理 意 味 表 示 を 得 よ う と す る と 文 の 構 成 要 素 間 の 文 法 関 係 へ の ア ク セ ス お よ び 句 の 構 成 要 素 の 特 定 が 困 難 で あ る と い う 問 題 が 生 じ る 。 そ こ で 、 意 味 処 理 の 入 力 デ ー タ に 相 応 し い 中 国 語 ツ リ ー バ ン ク の 開 発 が 必 要 で あ る 。

1.3 研究課題

論 理 意 味 表 示 を タ グ 付 け し た 中 国 語 ツ リ ー バ ン ク の 構 築 は 二 つ の 段 階 に 分 け ら れ る 。 そ れ は 、 (1)分 析 デ ー タ と し て 選 ば れ た 中 国 語 の 自 然 テ ク ス ト に 対 す る 統 語 解 析 情 報 の 追 加 、 お よ び (2)そ れ を ス コ ー プ 制 御 理 論 を 実 装 し た シ ス テ ム に 入 力 す る こ と に よ る 自 動 的 な 文

(10)

8 の 論 理 意 味 表 示 の 獲 得 で あ る 。 こ れ ま で の 研 究 で 英 語 お よ び 日 本 語 に 対 す る 自 動 意 味 解 析 の 結 果 が 良 好 で あ っ た こ と は 、自 然 言 語 の 文 の 意 味 に 対 す る SCT の アプロ ーチ が的 外れの も の で な い こ と を 示 し て い る 。そ の た め 、 SCT を実装 したシ ステ ム の入力 であ る中 国語の 統 語 解 析 情 報 を 十 分 に 含 む コ ー パ ス の 構 築 が う ま く で き れ ば 、 シ ス テ ム に 対 し て あ る 程 度 の 中 国 語 な り の 修 正 を 行 う だ け で 自 動 的 に 中 国 語 の 文 の 論 理 意 味 表 示 が 得 ら れ る と 期 待 さ れ る 。 以 上 の こ と か ら 、 精 度 の 高 い 中 国 語 の 統 語 解 析 情 報 付 き コ ー パ ス ( 中 国 語 の ツ リ ー バ ン ク ) の 開 発 が 研 究 の 要 と な る と 思 わ れ る 。 さ て 、 ア ノ テ ー シ ョ ン 作 業 が 効 率 的 に 進 め ら れ る よ う に 、 ま ず は 中 国 語 の 主 要 な 諸 構 文 に 対 し て 、 そ の 解 析 を 各 々 決 め て い く 必 要 が あ る と 思 わ れ る 。 周 知 の よ う に 、 中 国 語 は 機 能 語 や 屈 折 形 態 素 な ど に 乏 し い 言 語 で 、 そ の 語 お よ び 文 は い わ ば 漢 字 の 並 び と 組 み 合 わ せ だ け で あ る 。 こ の よ う な 形 態 上 の ヒ ン ト が 乏 し い 言 語 を 対 象 と す る ア ノ テ ー シ ョ ン に お い て は 主 に 以 下 の 三 つ の 難 点 が 予 想 さ れ る 。 1) 語 を 判 定 す る 基 準 が 不 明 確 で あ る こ と ( 例 :“ 離 合 詞 ”) 2) 表 層 構 造 が 同 じ よ う に 見 え て も 異 な る 言 語 情 報 を 伝 え る 構 文 が 数 多 い こ と( 例:動 詞 連 続 構 文 ) 3) 各 要 素 間 の 文 法 関 係 ・ 意 味 役 割 が 複 雑 で あ る こ と ( 例 : 結 果 構 文 ) 1)に 関 し て は 、筆 者 は 修 士 論 文 で 、従 来 形 態 素 解 析 の 最 大 の 問 題 と さ れ て き た“ 離 合 詞 ” を 取 り あ げ 、 コ ー パ ス を 使 っ て 、 動 詞 の 自 他 の 傾 向 と そ の 語 と し て の 一 体 性 と の 間 の 関 連 性 に つ い て 考 察 し た 。 そ の 結 果 、 中 国 語 の “ 離 合 詞 ” の 場 合 、 後 ろ に 目 的 語 が 取 れ る タ イ プ は 語 と し て の 一 体 性 が 高 く 、 一 方 、 後 に 目 的 語 が 取 れ な い タ イ プ の 方 は 一 体 性 が 低 い と い う 傾 向 が 明 ら か に な っ た( そ の 詳 細 は 補 遺 A を参照の こと 。)。そ の研究 結果 は、今 後中 国 語 を 対 象 と す る 形 態 素 解 析 作 業 に 多 大 な 示 唆 を 与 え る こ と が 出 来 る 。 一 方 、 2)と 3)につ い て は 、 本 論 文 で 、 そ れ ら が 代 表 す る も っ と も 典 型 的 な 文 法 項 目 ( 動 詞 連 続 構 文 お よ び 結 果 構 文 ) を 取 り あ げ て 、 そ の 統 語 ・ 意 味 解 析 を そ れ ぞ れ 考 察 し て い き た い 。 以 上 の こ と か ら 、 本 研 究 の 研 究 課 題 を 以 下 の よ う に ま と め る こ と が 出 来 る 。

(11)

9 研 究 課 題 : こ れ ま で の 主 要 な 研 究 を 参 考 に し な が ら 、中 国 語 の 動 詞 連 続 構 文 お よ び 結 果 構 文 に 対 し て 、も っ と も 合 理 的 と 判 断 さ れ る 解 析 法 を 各 々 決 定 し 、適 切 な 解 析 ス キ ー ム を 選 ん で 、 そ れ に 従 っ て 記 述 す る 。

1.4 研究の意義

本 研 究 で は 、 意 味 処 理 の 要 請 に こ た え る こ と を 目 的 と し て 中 国 語 の 諸 構 文 の 統 語 解 析 法 を 再 検 討 す る 。 こ れ に よ り 、 中 国 語 の 統 辞 研 究 に 新 た な 示 唆 が 与 え ら れ る 。 従 来 、 統 辞 論 と 意 味 論 は 緊 密 な 関 連 性 を も っ て お り 、 意 味 論 は 統 辞 論 と 共 に 働 く こ と に よ っ て 力 を 発 揮 す る こ と が で き る と 言 わ れ て き た 。本 研 究 に は 、SCT をイ ンプリ メ ントし たシ ステ ムを利 用 し て 意 味 解 析 を 行 う こ と に よ り 、 文 の 統 語 構 造 と 論 理 意 味 表 示 と の 対 応 を 形 式 的 に 考 察 す る こ と が 出 来 る と い う 意 義 が あ る 。 ま た 、 本 研 究 を 基 に し て 構 築 さ れ る 中 国 語 の 約 4 万 文に つい て統語 ・意味 情報 をタ ギン グ す る 統 語 ・ 意 味 コ ー パ ス は 、 筆 者 た ち が 取 り 組 ん で い る 欅 コ ー パ ス プ ロ ジ ェ ク ト (http://www.compling.jp/keyaki/)の他には、中国語は勿論のことどんな言語についても 存 在 し な い 。 こ れ が 完 成 す れ ば 、 同 じ 解 析 手 法 で 作 業 を 行 っ た 日 英 中 三 言 語 の 大 規 模 の 統 語 ・ 意 味 コ ー パ ス 群 が 手 に 入 り 、 こ れ ま で に な い 深 さ と 広 さ を 兼 ね 備 え た 言 語 研 究 に 貢 献 す る こ と が で き る 。 例 え ば 、 対 照 分 析 に よ っ て 目 標 言 語 の 特 徴 を 捉 え よ う と す る 対 照 言 語 学 に 対 し て 、 本 研 究 は そ の 最 も 直 接 的 な 比 較 デ ー タ ( 日 英 中 ) の 提 供 が 可 能 で あ る 。 そ れ だ け で は な く 、 比 較 デ ー タ が 同 じ 解 析 手 法 を 用 い て い る た め 、 目 標 の 言 語 サ ン プ ル へ の ア ク セ ス が 簡 単 に 実 現 で き る 。 例 を 挙 げ る と 、 三 言 語 の 連 体 修 飾 節 構 造 を 比 較 し た い 場 合 、 タ グ CP-THT と CP-REL を 手掛 かりと して 検 索を行 うと 、修 飾の限 定性、 補文 標識 、疑問 代 名 詞 、 連 体 修 飾 節 と 主 要 部 の 位 置 関 係 な ど に 関 す る 情 報 が 一 目 瞭 然 に 現 れ 、 対 照 が 効 率 よ く 行 え る 。 さ ら に 論 理 意 味 表 示 に も と づ い て 、 述 語 項 関 係 、 量 化 詞 や 否 定 辞 の 作 用 域 、 文 中 ・ 文 間 の 照 応 関 係 等 、 こ れ ま で に 得 ら れ な か っ た 種 類 の 言 語 学 的 情 報 を 大 量 に 得 、 分

(12)

10 析 す る こ と が 出 来 る 。 ま た 、 自 然 言 語 の 意 味 の 段 階 で は 言 語 表 層 上 の ほ と ん ど の 相 違 が な く な る の で 、 適 切 な 外 国 語 教 育 支 援 プ ロ グ ラ ム の 作 成 を 通 し て 、 言 語 の 教 育 現 場 へ の 応 用 も 期 待 さ れ て い る 。

1.5 本稿の構成と概要

本 稿 は 全 7 章で 構成 されて いる 。全 体の構 成を 図 1-3 に示 す。 図 1-3 本論文 の流 れ 第5章 終わりに まとめおよび今後の課題の提示 第4章 結果構文の解析 難点3)の代表的な例に関する統語・意味解析 第3章 動詞連続構文の解析 難点2)の典型的な例を対象とする統語・意味解析 第2章 本研究におけるアノテーション方式 本研究に使用されるアノテーション方式の特徴とメリットおよびSCTについての紹介 第1章 序論 本研究の研究背景、研究課題と学問的意義

(13)

11

本 章 で は 、 研 究 の 背 景 、 研 究 課 題 お よ び 研 究 の 意 義 に つ い て 述 べ た 。

続 く 第 2 章で は、本 研究に おい て適 用され る ペン 通時 コー パス (Penn Historical Corpora) 式 の 解 析 規 約 を 紹 介 し 、 他 の 解 析 規 約 に 比 べ て そ れ が 本 研 究 に と っ て 最 も 相 応 し い こ と を 説 明 す る 。 そ し て 、 具 体 例 を 通 じ て 、 本 研 究 に お け る ペ ン 通 時 コ ー パ ス 式 の 解 析 規 約 の 適 用 情 況 お よ び 中 国 語 を 対 象 と す る 形 態 素 ・ 統 語 解 析 の 実 状 に 応 じ て 解 析 規 約 に 対 し て 行 う 修 正 と そ の 原 則 を 示 す 。最 後 に 、SCT による 意味処 理の 過程 を概観 し た上 で 、コ ントロ ー ル 構 文 の 処 理 を 例 と し て 、 従 来 の 方 法 で は な か な か 捉 え ら れ な い 言 語 情 報 ( 同 一 指 示 関 係 や 否 定 の 作 用 域 な ど )を 得 る た め に 、本 研 究 で い か な る 処 置 を 取 っ た か に つ い て 説 明 す る 。 第 3 章 では 、上 記で述 べた 中 国語 を対 象とす るアノ テー ショ ンの難 点二 を めぐ り、 中国 語 の 動 詞 連 続 構 文 (SVC) を 取 り あ げ 、 先 行 研 究 を 踏 ま え て そ の 下 位 カ テ ゴ リ ー を 緻 密 に 決 定 し た 上 で 、 文 を 構 成 す る 要 素 の 間 の 同 一 指 示 関 係 に 留 意 し て 各 下 位 カ テ ゴ リ ー に 対 し て も っ と も バ ラ ン ス の 取 れ た 解 析 方 法 を 付 与 す る 。こ れ に よ っ て SCT をイン プリメ ント し た 意 味 処 理 シ ス テ ム を 通 し て 精 度 の 高 い 論 理 意 味 表 示 を 行 い 、 従 来 の 解 析 方 法 で は 捉 え ら れ な い 中 国 語 SVC における統 語・ 意味 情報が 得られ るよ うに な るこ とを具 体例 で示 す。 第 4 章で は、 中国語 の結果 構文 を対 象とし て 、ア ノテ ーシ ョンの 難点三 をめ ぐり 議論を 進 め て い く 。 中 国 語 の 結 果 構 文 を 構 築 す る 要 素 の 間 の 文 法 ・ 意 味 関 係 を 形 式 的 に 捉 え る た め に 、本 研 究 は 、先 行 研 究 を ま と め た 上 で 、ま ず 、「 動 詞 + 結 果 補 語 」構 造 の 文 法 カ テ ゴ リ ー と そ の 主 要 部 を 決 定 す る 。 そ れ か ら 、 文 頭 ・ 文 末 に 来 る 名 詞 句 と 第 一 述 語 と の 意 味 関 係 に 基 づ い て 、 中 国 語 の 結 果 構 文 に 七 つ の 下 位 カ テ ゴ リ ー を 付 与 し 、 そ の 統 語 解 析 お よ び 意 味 処 理 を 展 開 し て い く 。ま た 、コ ー パ ス の 中 に 収 納 さ れ る デ ー タ の 汎 用 性 を 高 め る た め に 、 第 4 章の最後 に、 tsurgeon ツール の紹 介を 踏 まえて 、 ツ リー の変換 という 処理 のス テップ の 追 加 に つ い て 検 討 を 行 う 。 第 5 章 では 、本 研究の 内容を 整理 し、 総合的 考察を 行っ て、 今後の 課題を 提示 する 。

(14)

12

第 2 章 本研究におけるアノテーション方式

2.1 ペン通時コーパス式の解析規約

SCT を 実 装 し た シ ス テ ム の 入 力 と し て 適 切 な ツ リ ー バ ン ク は 、有 用 な 統 語 情 報 に 富 ん で い て し か も 統 語 情 報 へ の ア ク セ ス が 容 易 に 出 来 る も の で あ る 。 こ れ ら の 要 件 を 満 た す の は ペ ン 通 時 コ ー パ ス 式 の 解 析 ス キ ー ム (Santorini 2010) であ る。 本 章 では 、同 解析 ス キーム を 日 本 語 ツ リ ー バ ン ク 構 築 に 応 用 し た 研 究 (Butler et al. 2012b; Butler et al. 2013) に基 づい て 、 こ の 方 式 を 中 国 語 ツ リ ー バ ン ク の 枠 組 み と し て 用 い る 際 の 問 題 と そ の 解 決 に つ い て 述 べ る 。 ペ ン 通 時 コ ー パ ス 式 の 解 析 シ ス テ ム は 、 ペ ン ツ リ ー バ ン ク 式 の 解 析 ス キ ー ム を 修 正 し た も の で 、文 の 統 語 構 造 を ラ ベ ル 付 き の 括 弧 で 表 示 す る 。ラ ベ ル に は 語 彙 レ ベ ル の ラ ベ ル( N、 ADJ な ど ) と 句 レ ベ ル の ラ ベ ル ( NP、 ADJP な ど ) の 2 種 類 が あ る 。 文 の 全 て の 終 端 要 素 ( 語 や 助 詞 な ど ) は 語 彙 レ ベ ル の ラ ベ ル に よ っ て 、 タ グ 付 け さ れ て い る が 、 必 ず し も 句 レ ベ ル の ラ ベ ル を 持 つ 必 要 は な い 。句 レ ベ ル の ラ ベ ル は 形 式 と 機 能 を 両 方 指 す こ と が 出 来 る 。 例 え ば 、NP-SBJ の場合 、NP は句のタ イプ が名 詞句で ある こと を表す と同時 に、-SBJ はこ の 名 詞 句 の 機 能 を 主 語 に 限 定 し て い る 。 一 般 的 に は 、 句 レ ベ ル の ラ ベ ル は 機 能 タ グ を 一 つ し か 持 た な い が 、二 つ 以 上 持 つ 場 合( 例:IP-INF-PRP = 目的を表 す 不定詞 句 、IP-IMP-SPE = 直 接 話 法 命 令 句 )も あ る 。中 間 レ ベ ル の 構 造( N’、ADJ’な ど )は 、い か な る 場 合 も 明 示 的 に タ グ 付 け さ れ る こ と は な い 。 と は い え 、 あ る 特 定 の 句 の ラ ベ ル を 使 わ な い こ と は 、 決 し て コ ー パ ス の 作 成 者 た ち が ア ノ テ ー シ ョ ン の 対 象 と す る 目 標 言 語 に そ う い う 句 が 存 在 し な い と 判 断 し て い る と い う こ と を 意 味 す る わ け で は な い (Santorini 2010)。中間レベルの構 造 を 使 用 し な い ゆ え に 、 統 語 木 全 体 が フ ラ ッ ト で シ ン プ ル に な り 、 特 定 の 言 語 サ ン プ ル を 検 索 し た り す る よ う な 作 業 も 簡 単 に 出 来 る (Butler et al. 2013)。(4)は 、その 解析 スキ ーム を 応 用 し て 実 際 に 中 国 語 の 無 制 約 の 文 (3)を 対 象とし て 統 語解 析を行 った一 例で ある 。

(15)

13 (3)

如 果 没 有 研 究 , 就 没 有 科 学 的 发 展 。

rúguǒ méiyǒu yánjiū jiù méiyǒu kēxué de fāzhǎn も し な い 研 究 肯 定 を 強 め る ない 科 学 格 助 詞 発展 研 究 な し で は 科 学 は 発 展 し な い 。

(4)

(IP-MAT (NP-SBJ *arb*) (PP (P 如 果 /も し )

(CP-ADV (IP-SUB (VE 没 有 /な い )

(NP-OB1 (N 研 究 /研 究 ))))) (PU , ) (ADVP (ADV 就 /肯 定 を 強 め る )) (VE 没 有 /な い ) (NP-OB1 (PP (NP (N 科 学 /科 学 )) (P 的 /格 助 詞 )) (N 发 展 /発 展 )) (PU 。 )) (4)か ら 分 か る よ う に 、IP は 常 に 述 語 と 文 レ ベ ル の 要 素 を 直 接 支 配 す る の で 、中 間 レ ベ ル の I’や VP などは 存在 しない 。同様 に、句の ヘッド (head) は各句 によっ て 直 接支 配され る た め 、中 間 レ ベ ル の 構 造( N’、ADJ’など)も 示され ない。また 、句 レベル の 要 素は 形式と 機 能 を 表 す タ グ を 両 方 持 つ こ と が 出 来 る が 、 必 ず し も そ の 両 方 を 備 え な け れ ば な ら な い わ け で は な い 。例 え ば 、文 レ ベ ル の NP は常に 機能タ グ( -SBJ、-OB1 など)によ って マーク さ れ る の に 対 し て 、PP はその 存在 位置 を問わ ず、機 能タ グに関 する アノテ ーシ ョン は一切 必 要 と し な い 。

(16)

14

2.2 ペン通時コーパス式アノテーション方式のメリット

ペ ン 通 時 コ ー パ ス 式 の 解 析 ス キ ー ム は 、 機 能 を 表 す タ グ と 照 応 関 係 を 手 掛 か り と し て 、 述 語 ‐ 項 関 係 の 確 定 が で き る 。 こ れ は 、 ペ ン ツ リ ー バ ン ク 式 の 解 析 ス キ ー ム に よ っ て も 可 能 で あ る が 、意 味 処 理 の 入 力 と し て の 前 者 の メ リ ッ ト と し て 、主 に 以 下 の 二 点 (Butler et al. 2013) を 挙 げ る こ と が 出 来 る 。 1) 句 ( IP を 除 く ) の 内 部 構 造 の 一 貫 性 を 保 つ こ と 。 こ れ は 、 句 の 構 成 を 規 則 正 し く 見 つ け 出 す た め に は 非 常 に 役 に 立 つ 。 図 2-1 に示すように、二つの例外(限定詞や動詞など解 析 規 約 に よ っ て 句 を 投 射 し な い よ う な ヘ ッ ド お よ び 単 一 の 単 語 よ り な る 前 置 修 飾 語 ) を 除 い て 、 一 般 的 に は ヘ ッ ド は 常 に 句 の 要 素 を 投 射 す る ( N→NP、P→PP、ADJ→ADJP など )。 句 レ ベ ル の 要 素 ( NP、PP、ADJP など) は主 要部を 直接 支配 する。 図 2-1 句の内 部構 造 そ れ は 、X’理論 で提 唱 された 中間 レベ ルの欠 如とい うこ とを 意味す る。その ため 、 ペ ン通 時 コ ー パ ス 式 の 解 析 シ ス テ ム で は 、 従 来 の 所 謂 指 定 部 (specifier) お よ び 付 加 部 (adjunct) は 修 飾 語 ・ 修 飾 句 (modifiers) に統 合 され 、 しか も修 飾語 も 補語 (complements) も 常に ヘ ッ ド と 同 じ レ ベ ル に あ る 。 一 つ の 具 体 例 と し て 、 (5), (6)に PP と NP の内部 構造 を示 す 。 (5) 仅 仅 为了 个人 的 微 小 利 益

jǐnjǐn wèile gèrén de wēixiǎo lìyì た だ ため 個人 格助詞 微小だ 利益 た だ 個 人 の 微 小 な 利 益 の た め

(17)

15 (6) (PP (ADVP (ADV 仅 仅 /た だ )) <--- 修 飾 句 (P 为 了 /た め ) <--- ヘ ッ ド (NP (PP (NP (N 个 人 /個 人 )) <--- 補 語 (P 的 /格 助 詞 )) (ADJ 微 小 /微 小 だ ) (N 利 益 /利 益 ))) 2) 機 能 を 表 す タ グ が 常 に 句 (IP, CP) に タ グ 付 け さ れ る こ と 。 例 え ば 、 IP-IMP( 命 令 文 )、 CP-REL( 関 係 節 )の よ う に 、個 々 の IP と CP は そ の 文 法 的 な 機 能 を 指 す た め の タ グ を 持 っ て い る 。 こ れ に よ り 、 述 語 ‐ 項 関 係 に 止 ま ら な い よ り 複 雑 な 構 文 に よ り 表 現 さ れ た 意 味 情 報 を 抽 出 す る こ と が 可 能 に な る 。例 え ば 、通 常 の 関 係 節 を 伴 う 文 (7)(主名 詞「 机会 」は 関 係 節 の 内 部 で 目 的 語 の 働 き を す る )の 統 語 木 (8)に対し て、埋め 込ま れ た節が 主名 詞「 机会」 の 内 容 を 表 し て い る 文 (9)の統語 木は(10)の よ うに表 され る。 (7) (= (1)) 之 前 失 去 的 机 会 又 来 了 。

zhīqián shīqù de jīhuì yòu lái le こ の 前 失う 補文標 識 チャン ス また 来る 完了 こ の 前 失 っ た チ ャ ン ス が ま た や っ て き た 。

(18)

16 (8)

(IP-MAT (NP-SBJ (CP-REL (IP-SUB (NP-SBJ *pro*) (NP-OB1 *T*) (ADVP (ADV 之 前 /こ の 前 )) (VB 失 去 /失 う )) (C 的 /補 文 標 識 )) (N 机 会 /チ ャ ン ス )) (ADVP (ADV 又 /ま た )) (VB 来 /や っ て く る ) (AS 了 /完 了 ) (PU 。 )) (9) 去 美 国 的 机 会 又 来 了 。

qù měiguó de jīhuì yòu lái le

行 く アメリ カ 補文標 識 チャン ス また 来る 完了 ア メ リ カ に 行 く チ ャ ン ス が ま た や っ て き た 。

(10)

(IP-MAT (NP-SBJ (CP-THT (IP-SUB (NP-SBJ *pro*) (VB 去 /行 く ) (NP-OB1 (NPR 美 国 /ア メ リ カ ))) (C 的 /補 文 標 識 )) (N 机 会 /チ ャ ン ス )) (ADVP (ADV 又 /ま た )) (VB 来 /や っ て く る ) (AS 了 /完 了 ) (PU 。 )) (8)と (10)を SCT を イ ン プ リ メ ン ト し た 意 味 処 理 シ ス テ ム に 入 力 し て 自 動 意 味 評 価 す る こ と

(19)

17

に よ り 、 文 (7)と(10)の 述語論 理式 は、 (11)と(12)のよ うに 与え られ る 。

(11)

∃ x4 x1 e2 e3 (

x4 = pro ∧ 机 会 (x1) ∧ 之 前 (e2) ∧

失 去 (e2, x4, x1) ∧ 又 (e3) ∧ 来 _了 (e3, x1))

(12)

∃ x4 x3 e1 e2 ( x4 = pro ∧

机 会 (x3, 去 (e1, x4, 美 国 )) ∧ 又 (e2) ∧ 来 _了 (e2, x3))

関 係 節 と 主 節 と の 意 味 的 関 係 は 、(11)では 連言 結合子 ∧で 連結 される 並列関 係で ある 一方 、 (12)で は 、 関 係 節 の 意 味 の 主 名 詞 の 意 味 へ の 埋 め 込 み 関 係 と な り 、 本 質 的 に 異 な る 。 こ の よ う な 差 を 正 し く 捉 え る こ と は 、(8)で通 常の 関係節 を表 すア ノテー ショ ン CP-REL が使 わ れ る 一 方 、 (10)で は埋 め込ま れた 節を 表す CP-THT が使 われ るこ とに よって 可能 とな る。

2.3 形態素解析

周 知 の よ う に 、 中 国 語 の 文 は 、 単 語 間 の 分 か ち 書 き が 行 わ れ ず 、 単 な る 漢 字 の 連 続 と し て 表 記 さ れ る 。 従 っ て 、 品 詞 ・ 統 語 情 報 を タ ギ ン グ す る 前 に 、 文 を 単 語 ご と に 分 割 し て お く 必 要 が あ る 。 中 国 語 に お い て の 単 語 分 割 タ ス ク の 実 行 可 能 性 に つ い て は 、 こ れ ま で に 言 語 学 者 は い ろ い ろ 論 じ て き た 。 中 国 語 の 単 語 と は 何 で あ る か と い う こ と に つ い て の 中 国 語 母 語 話 者 の 間 の 合 意 の 程 度 が 非 常 に 低 い (Sproat et al. 1996) という 実験結 果が ある が、 Xue et al. (2005) の 調 査 報 告 に よ る と 、中 国 語 母 語 話 者 の 間 に 、中 国 語 の 単 語 の 境 界 線 が ど こ ま で 広 が る か に 対 し て は か な り の 意 見 の 相 違 が 存 在 し て い る に も 関 わ ら ず 、 こ れ ら の 意 見 の 不 一 致 は 実 は そ れ ほ ど 大 事 な も の で は な く 、 母 語 話 者 に 適 切 な セ グ メ ン テ ー シ ョ ン の

(20)

18 ガ イ ド ラ イ ン さ え 与 え れ ば 、 中 国 語 の 単 語 分 割 タ ス ク は 順 調 に 進 め る こ と が 出 来 る 。 以 上 の こ と を 踏 ま え な が ら 作 業 の 効 率 面 へ の 配 慮 も あ っ て 、 本 研 究 で は 、 形 態 素 の 解 析 は 、基 本 的 に は 中 国 語 版 ペ ン ツ リ ー バ ン ク の セ グ メ ン テ ー シ ョ ン ガ イ ド ラ イ ン (Xia 2000b) お よ び 品 詞 ガ イ ド ラ イ ン (Xia 2000a) に従う 。実際 の作 業で は、 ス タンフ ォー ド大 学が開 発 し た 中 国 語 版 ペ ン ツ リ ー バ ン ク 標 準 の 中 国 語 用 の 単 語セ グ メ ン タ (Stanford Word Segmenter) (Tseng et al. 2005)、 品 詞 タ ガ ー (Stanford Log-linear Part-Of-Speech Tagger) (Toutanova et al. 2000, Toutanova et al. 2003) を 使 っ て 自 動 解 析 し た 結 果(中 国 語 版 ペ ン ツ リ

ー バ ン ク 式) を 筆 者 が 開 発 し た 品 詞 タ グ 自 動 変 換 ス ク リ プ ト を 通 し て 、 ペ ン 通 時 コ ー パ ス 式 の も の に 書 き 換 え る ( 例 : NN→N(普 通名 詞)、 CC→CONJ(接 続 詞)な ど )。ま た、 必 要 に 応 じ て 人 手 に よ る 修 正 も 行 う 。

2.4 統語解析の原則

本 研 究 は 、 基 本 的 に は ペ ン 通 時 コ ー パ ス式 の 解 析 規 約 に 従 っ て 統 語 解 析 を 進 め て い く が 、 研 究 目 的 と 中 国 語 の 実 際 の 使 用 情 況 に 合 わ せ て 、 あ る 程 度 の 修 正 も 行 う 。 以 下 、 解 析 方 針 の う ち 、 独 特 か つ 重 要 な も の に つ い て 説 明 す る 。 (ⅰ ) 研 究 目 的 の 実 際 に 従 っ て ア ノ テ ー シ ョ ン を 行 う 本 研 究 の 主 な 目 標 は 、 あ る 統 語 理 論 の 妥 当 性 を 宣 言 し そ れ を 貫 徹 す る た め で は な く 、 む し ろ 実 用 上 の 理 由 か ら の も の で あ る 。元 々 、SCT では、特定 の統 語 理論に 拘ら ずに 文の表 層 的 な 統 語 解 析 情 報 が 与 え ら れ れ ば 、 評 価 を 行 う こ と に よ っ て そ の 述 語 論 理 式 を 得 る こ と が 可 能 で あ る 。従 っ て 、本 研 究 の 統 語 木 は 、従 来 の X’理論で 提唱 さ れた中 間レ ベル の構造 ( N’、ADJ’など)には 基本的 には こだ わらな い 。こ れに 対し 、中 国 語版ペ ンツ リー バンク の ア ノ テ ー シ ョ ン に お い て は 、統 率 束 縛 (GB) 理論を 基にし たた め に、すべ ての 品詞 カテ ゴ リ ー に 対 す る 句 へ の 投 射 が 要 求 さ れ た 。 ま た 、 (13), (14)が示すよ うに中 間レ ベル の階層 を 作 っ て 補 部 と 付 加 部 の 区 別 も 行 っ た 。

(21)

19 (13) 晚 上 做 作 业 wǎnshàng zuò zuòyè 夜 や る 宿題 夜 に 宿 題 を す る (14) (VP (NP (N 晚 上 /夜 )) (VP (VB 做 /や る ) (NP (N 作 业 /宿 題 )))) そ の 結 果 、 中 国 語 ペ ン ツ リ ー バ ン ク の 全 て の デ ー タ を 対 象 に 標 準 的 な ツ リ ー 正 規 化 処 理 (standard tree normalizations) を 施 し た 後 で 、 解 析 の た め に 統 計 を 行 う 際 に 、 マ イ ナ ス の 影 響 ( 同 じ 大 き さ の 他 の ツ リ ー バ ン ク に 比 べ る と よ り 乏 し い 句 構 造 規 則 と 分 岐 因 子 ) を 与 え て し ま う こ と を Levy et al. (2003) が指摘 して いる 。本 研究 の立 場か らは 、中 間レ ベル の表 示 を 必 要 と す る 理 由 は な い 。 (15)に は中 間レ ベル の VP がない (本 研究で は、 基本 的には VP を 使 用 し な い た め 、 最 高 階 層 の VP 自 体 も IP に 変 わ っ た )。 た だ し 、 そ の 代 り に NP に そ れ ぞ れ 機 能 タ グ -TMP(時制 的) と -OB1(直 接目的 語) を付 け加え ている 。 (15) (IP (NP-TMP (N 晚 上 /夜 )) (VB 做 /や る ) (NP-OB1 (N 作 业 /宿 題 ))) こ の や り 方 に よ り 異 な る 機 能 タ グ に よ る 両 者 の 区 別 を 可 能 に す る と 同 時 に 、 中 間 の 階 層 が 存 在 し な い た め 、 句 の 内 部 階 層 が よ り 少 な く な る 。 ま た 、 構 造 的 な も の に 比 べ て 、 明 示 的 な 機 能 タ グ の ほ う が よ り 識 別 し や す い 。 そ の 結 果 と し て 、 す べ て の 種 類 の 句 が 常 に 同 一 の フ ラ ッ ト な 構 造 を 取 り 、 そ れ 以 後 の 意 味 処 理 の 段 階 に お い て 部 分 木 の 検 索 や あ る 特 定 の 文 法 項 目 の 確 定 が 極 め て 簡 単 に 行 わ れ る 。 意 味 処 理 の 結 果 を(16)に示す。

(22)

20 (16) ∃ x1 t2 e3 ( 作 业 (x1) ∧ 晚 上 (t2) ∧ 做 (e3, _, x1) ∧ tmp(e3) ⊑ t2) ま た 、 そ の 境 界 を 定 義 す る こ と が 困 難 な 句 の 使 用 も で き る 限 り 控 え て い る 。 典 型 的 な 例 は VP である。その た め、本研 究で は、同 じ 項を共 有す る動 詞句の 並列構 造( 第 3.3.1 節を 参 照 の こ と 。)を 表 す ほ か に は VP を使用 しな い。そし て、限 定詞句 (DP) のよう な解析 の コ ス ト が そ の 有 用 性( 本 研 究 の 実 際 か ら 考 え る と )を 超 え て し ま う カ テ ゴ リ ー に 対 し て も 、 そ の ア ノ テ ー シ ョ ン を 省 略 す る こ と に す る 。 (ⅱ ) 句 の 機 能 情 報 を 常 に 丁 寧 に タ ギ ン グ す る 中 国 語 は 機 能 語 や 屈 折 形 態 素 な ど に 乏 し い 言 語 で あ る 。 し か も 、 少 な い 機 能 語 の 中 に は 一 つ 以 上 の 機 能 を 担 う も の も 少 な く な い 。(17)と(18)では 、前 置詞 (P)“在 ”を含む 前置 詞 句 (PP) が、 それ ぞれ 動作進 行の 場所 と時間 を指す 。 (17) 在 公司 工 作 zài gōngsī gōngzuò で 会社 仕 事 す る 会 社 で 仕 事 を す る (18) 在 假日 工作 zài jiàrì gōngzuò に 休日 仕事す る 休 日 に 仕 事 を す る

意 味 処 理 の 段 階 で こ の よ う な 曖 昧 性 が 回 避 で き る よ う に 、各 々 の 統 語 解 析 (19)と (20)では 、 二 つ の PP にそ の機 能 を表す タグ (LOC、TMP) を付 与し てお く必要 がある 。

(23)

21 (19) (FRAG (PP (P 在 /で ) (NP (N 公 司 /会 社 ))) (NP-LOC *) (VB 工 作 /仕 事 す る )) (20) (FRAG (PP (P 在 /に ) (NP (N 假 日 /休 日 ))) (NP-TMP *) (VB 工 作 /仕 事 す る )) (19), (20)を 踏 ま え て 、 (17), (18)の 述 語 論 理 式 を 以 下 の (21), (22)に 示 す 。 (21)

∃ x1 e2 (公 司 (x1) ∧ 工 作 (e2) ∧ loc_在 (e2) = x1)

(22) ∃ t1 e2 (假 日 (t1) ∧ 工 作 (e2) ∧ tmp_在 (e2) = t1) 元 々 、ペ ン 通 時 コ ー パ ス の 解 析 規 約 に よ っ て 、PP に関す る機 能情 報 のタギ ング が禁 止さ れ て い る た め 、本 研 究 で は 、PP に機 能タグ を 直接つ ける こと(PP-LOC、PP-TMP など)は し な い が 、中 国 語 の 実 際 の 情 況 と 意 味 処 理 か ら の 要 請 を 考 慮 し 、以 上 の (19)と(20)で 示した 妥 協 案 (PP のす ぐ右 側 に NP を経由 して その 機能情 報を 示す (Butler et al. 2013))を 採用 し た 。 こ れ に よ り 、 ペ ン 通 時 コ ー パ ス と の 一 致 性 が 保 て る と 同 時 に 、 デ ー タ 全 体 に 対 し て も 将 来 よ り シ ス テ マ テ ィ ッ ク に 編 集 で き る( 例 え ば 、コ ー パ ス を 他 の 目 的 で 使 う た め に PP に 関 す る 機 能 情 報 を 必 要 と し な い 場 合 は 、 そ れ ら を 一 気 に 削 除 す る こ と が で き る ) よ う に な っ た 。 こ の よ う な テ ク ニ ッ ク を 用 い て よ り 柔 軟 な ア ノ テ ー シ ョ ン が 行 え る た め 、SCT はよ り豊 富 な 統 語 情 報 を 提 供 で き る 。例 え ば 、(23)と (24)の統語 解析(25)と(26)では、その 両方 が PP

(24)

22 を 含 ん で い る が 、 従 属 節 と 主 節 の 意 味 的 関 係 が そ れ ぞ れ 等 位 (coordinate) と 従 属 (subordinate) に な っ て い る 。 精 度 の 高 い 述 語 論 理 式 (27), (28)を 得 る た め に は 、 こ れ ら の 区 別 に 関 す る 情 報 も ア ノ テ ー シ ョ ン す る(PP の すぐ右 側に それ ぞれ CRD、CND をタ ギング ) 必 要 が あ る 。 (23) 因 为 约 翰 去 我 才 去 。 yīnwèi yuēhàn qù wǒ cái qù

か ら ジ ョ ン 行く 私 こそ 行く ジ ョ ン が 行 く か ら こ そ 、 私 は 行 く 。

(24)

如 果 约 翰 去 我 就 去 。

rǔguǒ yuēhàn qù wǒ jiù qù

も し ジ ョ ン 行く 私 「如果 」と 呼応 行く ジ ョ ン が 行 く な ら ば 、 私 は 行 く 。 (25) (IP-MAT (PP (P 因 为 /か ら ) (CP-ADV (IP-SUB (NP-SBJ (NPR 约 翰 /ジ ョ ン )) (VB 去 /行 く )))) (CRD *) (NP-SBJ (PRO 我 /私 )) (ADVP (ADV 才 /こ そ )) (VB 去 /行 く ) (PU 。 ))

(25)

23 (26) (IP-MAT (PP (P 如 果 /な ら ば ) (CP-ADV (IP-SUB (NP-SBJ (NPR 约 翰 /ジ ョ ン )) (VB 去 /行 く )))) (CND *) (NP-SBJ (PRO 我 /私 )) (ADVP (ADV 就 /“ 如 果 ” と 呼 応 )) (VB 去 /行 く ) (PU 。 )) (27)

∃ x3 e1 e2 (x3 = 我 ∧ 因 为 (去 (e1, 约 翰 ), 去 (e2, x3) ∧ 才 (e2)))

(28)

∃ x1 (x1 = 我 ∧ ∀ e2 如 果 (去 (e2, 约 翰 ), ∃ e3 (去 (e3, x1) ∧ 就 (e3))))

2.5 SCT による意味処理 の概要

SCT は 、 自 然 言 語 の 文 の 意 味 理 解 を 行 う た め に 動 態 意 味 論 (Dynamic Semantics Groenendijk et al. 1991, Kamp et al. 1993 ) を 拡 張 ・ 発 展 さ せ た 形 式 言 語 理 論 で あ る 。 従 来 の 諸 理 論 に お い て は 、文 の 根 幹 を な す 依 存 関 係 を 統 語 論 的 な も の と し て 捉 え て き た の に 対 し 、 SCT で は 意 味 論 的 な 関 係 と し て 形 式 化 ・ 処 理 を 行 う こ と に 特 徴 が あ る 。 自 然 言 語 に は 、 関 係 節 に よ る 名 詞 修 飾 節 や 主 題 化 な ど の 非 有 界 依 存 関 係 (unbounded dependency) を 初 め と し て 多 様 な 複 雑 な 構 文 が 存 在 し 、 そ の 統 語 ・ 意 味 解 析 は 重 要 な 課 題 と さ れ て き た 。 こ の 問 題 を 解 決 し 、 多 様 な 構 文 を 解 析 す る た め に 、 従 来 の 形 式 文 法 理 論 で は 統 語 構 造 や そ れ に も と づ く 統 語 素 性 の 複 雑 な 操 作 を 行 っ て き た 。 こ れ に 対 し て SCT で

(26)

24 は 、 自 然 言 語 の 文 構 造 は 、 意 味 の 基 本 的 な 構 成 要 素 で あ る ス コ ー プ (変 項 の 値 ) を 導 入 し た り 、 操 作 あ る い は 評 価 す る こ と に よ っ て 形 作 ら れ る 依 存 関 係 を 直 接 反 映 し た も の で あ る (Butler 2010) と 考 え る 。 統 語 構 造 と し て は 単 純 な 表 層 統 語 構 造 の み を 仮 定 し 、 ス コ ー プ を 制 御 す る こ と に よ り 、 文 の 意 味 解 析 (評 価 ) を 行 う 。 文 の 解 析 や 解 釈 に お い て 最 も 重 要 な こ と は 、文 が 文 法 的 (well-formed) で ある ため の条件 を明 らか にする ことで ある が、SCT は こ れ を 、 文 の 各 領 域 に お い て 必 要 と さ れ る ス コ ー プ の 数 と 、 割 当 関 数 に よ っ て 供 給 さ れ る ス コ ー プ の 数 と が 一 致 す る こ と で あ る と 定 義 す る (表 現 統 合 性 条 件 )。こ の 条 件 の 下 に 、文 を 構 成 す る 領 域 ご と に ス コ ー プ が 導 入 さ れ た り 、 他 の 変 項 に シ フ ト さ れ た り 、 あ る い は 新 た な ス コ ー プ の 出 現 に よ り 一 時 的 に 不 活 性 化 し た り す る が 、 こ れ に よ り 自 然 言 語 の 文 の 複 雑 な 成 り 立 ち を 体 系 的 に シ ミ ュ レ ー ト 出 来 る と 考 え る の で あ る 。 以 下 、 ご く 単 純 な 文 の 意 味 解 析 過 程 を 示 す 。 (29) 约 翰 爱 玛 丽 。 yuēhàn ài mǎlì ジ ョ ン 愛する メアリ ー ジ ョ ン が メ ア リ ー を 愛 す る 。 ペ ン 通 時 コ ー パ ス 式 の 解 析 ス キ ー ム を 例 文 (29)に適用 する と、 ツリ ー (30)が得られ る。 (30) (IP-MAT (NP-SBJ (NPR 约 翰 /ジ ョ ン )) (VB 爱 /愛 す る ) (NP-OB1 (NPR 玛 丽 /メ ア リ ー )) (PU 。 )) 論 理 意 味 表 示 を 自 動 的 に 行 う た め に は 、 木 構 造 を 評 価 シ ス テ ム の 入 力 と し て 受 け 入 れ ら れ る 形 式 に 変 換 す る 必 要 が あ る 。 こ れ は 、 句 構 造 の 内 部 構 造 を 探 る こ と に よ っ て 実 現 さ れ る 。具 体 的 に は 、木 構 造 を 、ま ず 補 語 お よ び 修 飾 語 と ヘ ッ ド と の ス コ ー プ 関 係( [修 飾 語 [ヘ ッ ド [補 語 ]]]) を 含 む 中 間 レ ベ ル の 表 現 (31)に変換 する 。

(27)

25 (31)

NP-SBJ-in: (NPR 约 翰 )

NP-SBJ-out: (NP-SBJ npr "entity" "约 翰 "__LOCAL__) NP-OB1-in: (NPR 玛 丽 )

NP-OB1-out: (NP-OB1 npr "entity" "玛 丽 "__LOCAL__)

IP-MAT-in: (NP-SBJ npr "entity" "约 翰 "__LOCAL__)@IP-MAT@@(VB 爱 )@IP-MAT@@(NP-OB1 npr "entity" "玛 丽 "__LOCAL__)@IP-MAT@@(PU 。 )

(PU 。 )

IP-MAT-out: (IP-MAT-fact ((npr "entity" " 约 翰 ") "arg0") (((npr "entity" " 玛 丽 ") "arg1") (verb lc fh "event" ["arg0", "arg1"] " 爱 "))__LOCAL__"arg1"@NAME@"arg0")

次 に 、 こ れ ら の 表 現 に そ の 文 法 役 割 を 表 す 束 縛 名 称 (binding names) を 追 加 し た上 で 、 こ の 中 間 レ ベ ル の 表 現 を (32)のよう に一 連の 演算( some (不定 の限 定詞)、npr (固有名 詞)、 verb(埋 め 込 み を 含 め な い 動 詞 )、 past (過 去 テ ン ス )、 な ど ) に 置 き 換 え る 。 (32) ( fn fh => ( fn lc => ( ( ( npr "entity" "约 翰 ") "arg0") ( ( ( npr "entity" "玛 丽 ") "arg1")

( verb lc fh "event" ["arg0", "arg1"] "爱 ")))) ["arg1", "arg0", "h"])

["constant", "event"]

さ ら に 、 こ れ ら の 演 算 を シ ス テ ム が 評 価 可 能 な SCT 言語(Use、Hide、Close、Rel、 If、 Lam、 Clean な ど の 関 数 ) (33)に 変 え る 。

(28)

26 (33) Hide ("constant", CClose ("constant", Hide ("event", Close ("∃ ", ("event","event"),["event"], Clean (0, ["arg0"], "c",

CUse (C ("约 翰 ", "entity"), "constant", Lam ("constant", "arg0",

Clean (0, ["arg1"], "c",

CUse (C ("玛 丽 ", "entity"), "constant", Lam ("constant", "arg1",

If (fn, Hide ("h", Hide ("arg0", Hide ("arg1",

Rel (["arg1", "arg0", "h"], ["c", "c", "c"], "CHECK", [ Use ("arg1",

Use ("arg0", Use ("event",

Rel (["constant"], ["c"], "爱 ", [At (T ("event", 0), "event"), At (T ("arg0", 0), "arg0"),

At (T ("arg1", 0), "arg1")]))))])))), Hide ("h",

Hide ("arg0", Hide ("arg1",

Rel (["arg1", "arg0", "h"], ["c", "c", "c"], "CHECK", [ Use ("h",

Use ("arg1", Use ("arg0", Use ("event",

(29)

27

Rel (["constant"], ["c"], "爱 ", [At (T ("event", 0), "event"), At (T ("arg0", 0), "arg0"), At (T ("arg1", 0), "arg1"), At (T ("h", 0), "h")])))))]))))))))))))))) 最 後 に 、 こ れ に 対 し て 形 式 的 な 評 価 を す る こ と ( そ の 詳 細 は 、 Butler, 2010 を 参 照 の こ と 。) に よ っ て 、 文 の 述 語 論 理 式 (34)が生 じら れる。 (34) ∃ e1 爱 (e1, 约 翰 , 玛 丽 ) こ の よ う に 、SCT が インプ リメ ント された システ ム を 使っ て、ペ ン通時 コー パス 式の解 析 規 約 に 従 っ て 構 築 さ れ た 統 語 解 析 結 果 に 対 し て 処 理 ・ 評 価 を 行 う こ と に よ り 、 通 常 の ツ リ ー バ ン ク で は 取 り 扱 う こ と が 困 難 な 非 有 界 依 存 (unbounded dependency) な ど が 含 ま れ る 構 文 に お け る 格 名 詞 句 と 動 詞 と の 依 存 関 係 を つ き と め る こ と が 可 能 に な る 。 以 下 で は コ ン ト ロ ー ル 構 文 の 例 を 示 す 。

2.6 要素間コントロール関係の同定

一 般 的 に は 、 依 存 関 係 の 表 示 お よ び 述 語 ‐ 項 関 係 の 再 構 成 に 必 要 な た め 、 主 語 ま た は 目 的 語 が 動 詞 の 必 須 格 と し て 求 め ら れ る に も か か わ ら ず 文 中 で 表 現 さ れ て い な い 場 合 、 ゼ ロ 代 名 詞 の 追 加 を 行 っ て そ れ ら を 明 示 す る 必 要 が あ る 。 ゼ ロ 代 名 詞 は 、 一 般 的 に 純 粋 な 代 名 詞 類 の 性 質 を 持 つ pro およ び 代名詞 類の 性質 と照応 形 の 性 質 を 合 わ せ 持 つ PRO に分類さ れる 。従 来コン トロ ール 構文に 対する ゼロ 代名 詞のタ ギ ン グ は 、直 接 PRO を 付け加 える こと が主流 だった 。目 的語 コン ト ロール 構文 の(35)と主 語 コ ン ト ロ ー ル 構 文 の (36)に対 して 、(37)と(38)が示す よう に、中国 語 版ペン ツリ ーバ ンク 式 の 解 析 ス キ ー ム で は 、 コ ン ト ロ ー ル 補 文 で あ る IP に対 して 主語 PRO のアノ テー ション

(30)

28 を 行 っ て い る 。 (35) 张 三 今 晚 请 我 们 吃 饭 。 zhāngsān jīnwǎn qǐng wǒmen chīfàn 張 三 今 晩 招 待 す る 私たち 食事す る 張 三 は 今 晩 私 た ち を 御 馳 走 す る 。 (36) 李 四 帮 我 们 叫 医 生 。

lǐsì bāng wǒmen jiào yīshēng 李 四 手伝う 私たち 呼ぶ お医者 さん 李 四 は 私 た ち の た め に お 医 者 さ ん を 呼 ぶ 。 (37) (IP (NP-SBJ (NPR 张 三 /張 三 )) (NP-TMP (N 今 晚 /今 晩 )) (VB 请 /招 待 す る ) (NP-OB1 (PRO 我 们 /私 た ち )) (IP (NP-SBJ *PRO*) (VB 吃 饭 /食 事 す る )) (PU 。 ))

(31)

29 (38) (IP (NP-SBJ (NPR 李 四 /李 四 )) (VB 帮 /手 伝 う ) (NP-OB1 (PRO 我 们 /私 た ち )) (IP (NP-SBJ *PRO*) (VB 叫 /呼 ぶ ) (NP-OB1 (N 医 生 /お 医 者 さ ん ))) (PU 。 )) こ の よ う な コ ン ト ロ ー ル 構 文 の 解 析 の 仕 方 は あ る 意 味 で 論 理 的 だ が 、 精 度 の 高 い 述 語 ‐ 項 構 造 を 目 的 と し て PRO の値を確 定し よう と する際 に問 題が 出てし まう。 即 ち PRO をコ ン ト ロ ー ル し て い る 対 象 ( 主 文 の 主 語 か 目 的 語 か ) の 同 定 が 出 来 な い の で あ る 。 こ れ に 対 し て 、 本 研 究 で は 、 統 語 解 析 の 段 階 で 句 に そ れ ぞ れ 異 な る 機 能 タ グ を 付 与 し 、 IP、CP の 下 位 カ テ ゴ リ ー を 緻 密 化 す る こ と に よ っ て 、そ の 中 に 埋 め 込 ま れ た 主 語 や 目 的 語 の デ ィ フ ォ ー ル ト 的 解 釈 が 意 味 処 理 の 段 階 で 可 能 と な っ た 。 (39) (IP-MAT (NP-SBJ (NPR 张 三 /張 三 )) (NP-TMP (N 今 晚 /今 晩 )) (VB 请 /招 待 す る ) (NP-OB1 (PRO 我 们 /私 た ち )) (IP-INF (VB 吃 饭 /食 事 す る )) (PU 。 ))

(32)

30 (40) (IP-MAT (NP-SBJ (NPR 李 四 /李 四 )) (VB 帮 /手 伝 う ) (NP-OB1 (PRO 我 们 /私 た ち )) (IP-PPL (VB 叫 /呼 ぶ ) (NP-OB1 (N 医 生 /お 医 者 さ ん ))) (PU 。 )) 例 え ば 、 (39)と(40)では 、PRO のタギン グが 行 われず 、そ の代 りに、 補文の 二つ の IP が そ れ ぞ れ IP-INF(不 定 詞句 )お よび IP-PPL( 分詞句 )とされ てい る 。こ れに より 、SCT に お い て 、IP-PPL に対し て、「 そ れ に よ っ て 直 接 支 配 さ れ る 主 語 項( NP-SBJ 或いは IP-PPL-SBJ) が 文 中 に 明 示 的 に 表 示 さ れ て い な い 場 合 、 そ れ よ り 先 行 し し か も そ れ と 姉 妹 ( そ れ と 同 じ レ ベ ル に あ る 要 素 ) の 関 係 を 持 つ 主 語 項 が そ れ が 直 接 支 配 す る 主 語 項 と な る 」 と い う デ ィ フ ォ ー ル ト 的 解 釈 を( 今 の 段 階 で の 暫 定 的 な も の と し て )与 え る こ と が 出 来 る 。ま た 、IP-INF に 対 し て は 、「 そ れ に よ っ て 直 接 支 配 さ れ る 主 語 項 が 文 中 に 明 示 的 に 表 示 さ れ て い な い 場 合 、 そ れ よ り 先 行 し し か も そ れ と 姉 妹 の 関 係 を 持 つ 目 的 語 項 が そ れ が 直 接 支 配 す る 主 語 項 と な る 。」と い う デ ィ フ ォ ー ル ト の 解 釈 を 同 様 に 付 与 し さ え す れ ば 、ほ と ん ど の 場 合 、空 範 畴 を 表 す ゼ ロ 代 名 詞 PRO のアノテ ーシ ョン を行わ ずに済 む。こ れに よっ て、文全 体の 統語 構造 が 簡 潔 に な る と と も に 、従 来 の ゼ ロ 代 名 詞 PRO をタグ付 けす る方 法 と比べ てよ り精 密 な要 素 間 の 同 一 指 示 関 係 を 意 味 処 理 に よ っ て 捉 え ら れ る よ う に な る 。 (41) ∃ x4 t1 e2 e3 ( x4 = 我 们 ∧ 今 晚 (t1) ∧

(33)

31 (42) ∃ x4 x1 e2 e3 ( x4 = 我 们 ∧ 医 生 (x1) ∧ 帮 (e3, 李 四 , x4, 叫 (e2, 李 四 , x1))) (41), (42)が 示 す と お り 、(35)に お け る 主 文 目 的 語 と 補 文 主 語 、お よ び (36)の 主 文 主 語 と 補 文 主 語 と を 同 一 指 示 で あ る と し て 関 係 づ け る こ と が 出 来 る 。

2.7 句レベルのスコープアノテーション

さ ら に 、語 順 変 化 や 否 定 の 作 用 域 な ど の 問 題 も 視 野 に 入 れ る と 、制 御 は 一 層 複 雑 に な る 。 一 般 的 に 言 え ば 、中 国 語 は 世 界 の 多 く の 言 語 と 同 じ よ う に 主 語 が 文 頭 に 現 れ る 言 語 で あ る 。 し か し 、 場 合 に よ っ て は 、 そ れ 以 外 の 位 置 に 現 れ る こ と も あ る 。 (43) 我 喝 啤 酒 。 wǒ hē píjiǔ 私 飲む ビール 私 は ビ ー ル を 飲 む 。 (44) 啤 酒 我 喝 。 píjiǔ wǒ hē ビ ー ル 私 飲む ビ ー ル は 私 が 飲 む 。 (43), (44)は ご く 単 純 な 例 で あ る 。 情 報 伝 達 上 に 多 少 の 相 違 が あ る と し て も 、 二 つ の 文 に

(34)

32 お け る 各 要 素 が 同 じ 統 語 ・ 意 味 的 関 係 を 持 つ こ と は 確 実 で あ る 。 そ こ で 、 両 文 に そ れ ぞ れ (45), (46)の よ う な 統 語 解 析 を 付 与 す る こ と が 出 来 る 。 (45) (IP-MAT (NP-SBJ (PRO 我 /私 )) (VB 喝 /飲 む ) (NP-OB1 (N 啤 酒 /ビ ー ル )) (PU 。 )) (46) (IP-MAT (NP-OB1 (N 啤 酒 /ビ ー ル )) (NP-SBJ (PRO 我 /私 )) (VB 喝 /飲 む ) (PU 。 )) (43), (44)は ど ち ら も 単 文 で あ る た め 、(45)に 比 べ て 、(46)で は 目 的 語 が 主 語 の 前 に 移 動 し た と し て も 、 両 者 は 同 じ 意 味 処 理 の 結 果 (47)が得ら れる 。 (47) ∃ x3 x1 e2 (x3 = 我 ∧ 啤 酒 (x1) ∧ 喝 (e2, x3, x1)) し か し 、 こ れ は あ く ま で も 単 文 の 話 で 、 従 属 節 を 伴 う 複 文 を 対 象 と す る と 新 た な 問 題 が 出 て し ま う 。 (48), (49)は複文 の例 であ る。 (48) 张 三 因 为 昨 晚 熬 夜 了 今 天 没 去 学 校 。

zhāngsān yīnwèi zuówǎn áoyè le jīntiān méi qù xuéxiào 張 三 か ら 昨 夜 徹 夜 す る 完了 今日 否 定 行く 学校 張 三 は 昨 夜 徹 夜 し た か ら 今 日 学 校 へ 行 か な か っ た 。

(35)

33 (49)

张 三 今 天 没 去 学 校 因 为 昨 晚 熬 夜 了 。

zhāngsān jīntiān méi qù xuéxiào yīnwèi zuówǎn áoyè le 張 三 今 日 否 定 行く 学校 か ら 昨 夜 徹 夜 す る 完了 張 三 は 今 日 学 校 へ 行 か な か っ た 。 昨 夜 徹 夜 し た か ら 。 (48), (49)で は 、主 節“ 张 三 今 天 没 去 学 校 ”と 従 属 節“ 因 为 昨 晚 熬 夜 了 ”と の 順 番 が 逆 に な っ て い る 。 今 ま で 紹 介 し て き た 解 析 法 を 使 う と 、 両 方 の 統 語 解 析 結 果 は そ れ ぞ れ (50), (51) に な る 。 (50) (IP-MAT (NP-SBJ (NPR 张 三 /張 三 )) (PP (P 因 为 /か ら ) (CP-ADV (IP-SUB (NP-TMP (N 昨 晚 /昨 夜 )) (VB 熬 夜 /徹 夜 す る ) (AS 了 /完 了 )))) (CRD *) (NP-TMP (N 今 天 /今 日 )) (NEG 没 /否 定 ) (VB 去 /行 く ) (NP-OB1 (N 学 校 /学 校 )) (PU 。 ))

(36)

34 (51) (IP-MAT (NP-SBJ (NPR 张 三 /張 三 )) (NP-TMP (N 今 天 /今 日 )) (NEG 没 /否 定 ) (VB 去 /行 く ) (NP-OB1 (N 学 校 /学 校 )) (PP (P 因 为 /か ら ) (CP-ADV (IP-SUB (NP-TMP (N 昨 晚 /昨 夜 )) (VB 熬 夜 /徹 夜 す る ) (AS 了 /完 了 )))) (CRD *) (PU 。 )) (50), (51)を シ ス テ ム に 入 力 す る と 、そ の 意 味 処 理 の 結 果 は 次 の (52), (53)の と お り に な る 。 (52) ¬ ∃ x1 t2 t3 e4 e5 ( 学 校 (x1) ∧ 昨 晚 (t2) ∧ 今 天 (t3) ∧ 因 为 (熬 夜 _了 (e4, 张 三 ) ∧ tmp(e4) = t2, 去 (e5, 张 三 , x1) ∧ tmp(e5) = t3)) (53) ¬ ∃ x1 t2 t3 e4 e5 ( 学 校 (x1) ∧ 今 天 (t3) ∧ 昨 晚 (t2) ∧ 因 为 (熬 夜 _了 (e4, x1) ∧ tmp(e4) = t2, 去 (e5, 张 三 , x1) ∧ tmp(e5) = t3))

(37)

35 (48), (49)の 述 語 論 理 式 と し て の (52), (53)は 、 問 題 点 が 残 っ て い る 。 (53)で は 、 述 語 “ 熬 夜 ”の 動 作 主 は x1 の“ 学校 ”にな って しま っ ている 。そ れに 対し て 、(52)では 、述 語“熬 夜 ”の 動 作 主 は“ 张 三 ”で あ り 、こ れ は 言 語 デ ー タ の 実 情 に 合 っ て い る が 、(52), (53)とも、 否 定 (negation) のオペ レータ ー ¬ が述語 論理 式の最 初に 現れ ている 。そのた め、(52)の意 味 は 、「 張 三 は 昨 夜 徹 夜 し た か ら 今 日 学 校 へ 行 っ た と い う こ と は 真 実 で は な い 」と な る 。し か し 、 こ れ は 明 ら か に 文 の 元 の 意 味 を 捉 え そ こ な っ て い る 。 こ の よ う な 望 ま し く な い 処 理 の 結 果 が 出 た 理 由 と し て は 、 ま ず 、 CP-ADV( そ れ を 直 接 支 配 す る PP が存在す る場合 も同 様) が直接 支配す る主 語項 を、文 中にあ る 同 一指 示関係 を 持 つ 名 詞 句 と 同 定 す る た め に 、「 CP-ADV によって 直接 支配 される 主語項 が文 中に 明示的 に 表 示 さ れ て い な い 場 合 、 そ れ よ り 先 行 し し か も そ れ と 姉 妹 の 関 係 を 持 つ 目 的 語 項 ( 目 的 語 が 存 在 し な い 場 合 は 主 語 項 ) が そ れ が 直 接 支 配 す る 主 語 項 と な る 」 と い う デ ィ フ ォ ー ル ト の 解 釈 を 与 え て い る こ と に あ る 。 こ の よ う な デ ィ フ ォ ー ル ト の 解 釈 に よ り 、 ほ と ん ど の 情 況 に 対 応 で き る が 、 (49)の よ う に そ の 言 語 が 持 つ 一 般 的 な 語 順 に 従 わ な い 文 を 対 象 と す る 場 合 は 、 矛 盾 を も た ら し て し ま う 。 即 ち 、 (49)で は 、主 文 の 目 的 語 “ 学 校” は CP-ADV を 直 接 支 配 し て い る PP“因为 昨晚 熬夜了 ”よ りも先 行し しか もそれ と姉妹 の関 係を 持って い る に も 関 わ ら ず 、 そ れ が そ の 主 語 と は な ら ず 、 む し ろ 主 文 の 主 語 “ 张 三 ” こ そ 補 文 の 主 語 で あ る 。 さ ら に 、 (50), (51)を考 察すれ ばわ かる ように 、否定 のマ ーカ ー“ 没 ”はど ちら にお いて も 主 文 の 述 語 “ 去 ” に つ い て い る た め 、 そ の 述 語 論 理 式 で あ る (52), (53)では、否 定の オペ レ ー タ ー ¬ が共に 主節 に付加 され てい る 。即 ち、(48), (49)のような 従属節 を持 つ複 文は 、 そ の 主 節 に 否 定 が 付 く 場 合 、 否 定 の 作 用 域 が 従 属 節 を も 包 含 す る の か そ れ と も 主 節 だ け を 含 む の か に つ い て は 、 そ の 文 法 構 造 か ら 判 断 す る こ と が 不 可 能 で あ る 。 以 上 を ま と め る と 、 未 解 決 の 問 題 点 が ま だ 二 点 残 っ て い る 。 そ れ は 、 句 に 与 え た デ ィ フ ォ ー ル ト の 解 釈 が い か に 柔 軟 に 様 々 な 情 況 ( 語 順 の 変 化 な ど ) に 対 応 で き る か 、 お よ び 否 定 の 作 用 域 を 、 い か に 自 由 に 操 る か と い う こ と で あ る 。 以 上 の 問 題 点 を 解 決 す る た め に 、 SCT では 、第 2.6 節に 見られ た ように 句に 埋め 込まれ た 主 語 や 目 的 語 に 対 し て デ ィ フ ォ ー ル ト 的 解 釈 を 付 与 す る 他 に 、 ス コ ー プ の 階 層 (scope hierarchy) と い う 概 念 も 導 入 し た 。 ペ ン 通 時 コ ー パ ス 式 の 解 析 規 約 に 従 っ て 構 築 し て き た ツ リ ー は 常 に フ ラ ッ ト な た め に 、 句 レ ベ ル に お け る 各 要 素 間 の ス コ ー プ 関 係 は 基 本 的 に は 自 由 で あ る 。 と は い う も の の 、 複

(38)

36 数 の 修 飾 語・句 が 存 在 す る 場 合 は 、あ る 程 度 の 制 限 を 加 え る 必 要 が あ る 。Butler et al. (2013) に よ る と 、 基 本 的 な デ ィ フ ォ ー ル ト の 順 番 と し て 、 自 然 言 語 の 語 順 が 参 考 と し て 用 い ら れ る 。 従 っ て 、 よ り 最 初 に 現 れ る 修 飾 語 ・ 句 は よ り 広 い ス コ ー プ を 取 る こ と に な る 。 ス コ ー プ の 階 層 の デ ィ フ ォ ー ル ト 値 に 影 響 を 及 ぼ す 要 因 は 、自 然 言 語 の 語 順 の 他 に も 幾 つ か あ る 。 ま ず 、 文 ・ 句 の 述 語 ( そ れ が 補 語 (CP-THT や IP-INF など) を 伴う 場合は 、そ の補 語)は 常 に も っ と も 狭 い ス コ ー プ を 取 る 。 そ れ か ら 、 述 語 が イ ベ ン ト 束 縛 を 伴 う 動 詞 の 場 合 、 そ の イ ベ ン ト 束 縛 に 掛 っ て い る 全 て の 修 飾 語 ・ 句 が そ の イ ベ ン ト 束 縛 よ り も 狭 い ス コ ー プ を 取 る 。 た だ し 、 修 飾 語 ・ 句 に 付 く 機 能 タ グ ( TPC(主 題 ) や VOC( 呼 格 )な ど ) に よ り、 も っ と も 広 い ス コ ー プ に 変 え ら れ る こ と も あ る 。最 後 に 、機 能 タ グ -SBJ を持つ項 に対 して 、 他 の 修 飾 語 ・ 句 よ り も 高 い ス コ ー プ の 階 層 を 持 つ と い う デ ィ フ ォ ー ル ト の 値 を 設 定 す る 。 こ れ は 、(50)と (52)にお ける よ うに、自然 言語 の語順 に頼 らず に従属 節の主 語項 を自 動的に 主 節 の 主 語 項 に 同 定 す る た め で あ る 。 以 上 の よ う な ス コ ー プ の 階 層 を 決 め る た め の デ ィ フ ォ ー ル ト 的 設 定 に よ り 、 自 然 言 語 の ほ と ん ど の 情 況 に 対 応 で き る 。 更 に 、 (48), (49)のよう な特別 な例 外 を解決 でき る た めに、 -HIGH お よ び -LOW と い う 二 つ の 機 能 タ グ を 導 入 す る こ と に よ っ て 、 ス コ ー プ の 階 層 関 係 に 関 す る 精 密 的 な 調 整 も 可 能 に な る 。 以 上 を 踏 ま え て 、 ス コ ー プ の 階 層 を 降 順 ( 高 い → 低 い ) で 以 下 の (54)のよ うに規 定す る (Butler et al. 2013)。 (54) ① -TPC、-VOC およ び -HIGH によっ てマ ーク される 修飾 語・ 句 ② -SBJ を持つ項 ③ IP-PPL ④ MD(モダ リティ ー) ⑤ NEG(否 定) ⑥ -HIGH および -LOW によ っ てマー クさ れて いない 修飾語 ・句 ( 語 順順) ⑦ -LOW によっ てマ ークさ れ る修飾 語・ 句 ⑧ 述 語 ⑨ 補語 -HIGH あ る い は -LOW が 付 与 さ れ た 修 飾 語 ・ 句 が 二 つ 以 上 あ る 場 合 、 そ の ス コ ー プ の 階

(39)

37 層 が 自 然 言 語 の 語 順 で 決 ま る こ と に な る 。

ス コ ー プ の 階 層 を 導 入 す る こ と に よ っ て 、 CP-ADV も含め て、 第 2.6 節に示 し た IP-PPL お よ び IP-INF に 関す る ディフ ォー ルト の解釈 を以下 のよ うに 修正・統合す るこ とが 出来る 。

CP-ADV / IP-PPL / IP-INF :

そ れ ら に よ っ て 直 接 支 配 さ れ る 主 語 項 ( NP-SBJ 或いは IP-PPL-SBJ) が文中 に明 示的 に 表 示 さ れ て い な い 場 合 、 そ れ ら と 姉 妹 の 関 係 を 持 つ 要 素 か ら な る ス コ ー プ の 階 層 に お い て 、 そ れ ら よ り も 高 い 階 層 に あ り 、 し か も も っ と も 近 い 距 離 を 保 つ 必 要 項 ( NP-INST、 NP-OB2、 NP-LGS、 NP-OB1、 NP-SBJ) が 、 そ れ ら が 直 接 支 配 す る 主 語 項 と な る 。 な ぜ 、 (41), (42)では 、要素 間の 長距 離依存 関係の 確定 が出 来る の か、こ こで 考察 してみ よ う 。 以 上 で 規 定 し た ス コ ー プ の 階 層 に 、 (39), (40)にお ける IP-MAT によっ て直 接支 配さ れ る 各 要 素 を 当 て は め る と 、 そ の ス コ ー プ 階 層 は そ れ ぞ れ 以 下 の (55), (56)のよ うに なる 。 (55) [NP-SBJ (张 三 ) [NP-TMP (今 晚 ) [NP-OB1 (我 们 ) [VB (请 ) [IP-INF (吃 饭 )]]]]] (56) [NP-SBJ (李 四 ) [IP-PPL (叫 医 生 ) [NP-OB1 (我 们 ) [VB (帮 )]]]]

す る と 、 IP-PPL / IP-INF に 与え たデ ィフォ ールト の解 釈に より、 (55)では 、NP-OB1 が IP-INF よ り も 高 い ス コ ー プ の 階 層 に あ り 、し か も そ れ と も っ と も 近 い の で 、そ の 主 語 項 に な る の に 対 し て 、 (56)では、 IP-PPL よ りも 高 いスコ ープ の階 層を持 ちしか もそ れに もっと

参照

関連したドキュメント

C−1)以上,文法では文・句・語の形態(形  態論)構成要素とその配列並びに相互関係

いずれも深い考察に裏付けられた論考であり、裨益するところ大であるが、一方、広東語

方法 理論的妥当性および先行研究の結果に基づいて,日常生活動作を構成する7動作領域より

いない」と述べている。(『韓国文学の比較文学的研究』、

そのような状況の中, Virtual Museum Project を推進してきた主要メンバーが中心となり,大学の 枠組みを超えた非文献資料のための機関横断的なリ ポジトリの構築を目指し,

不変量 意味論 何らかの構造を保存する関手を与えること..

Research Institute for Mathematical Sciences, Kyoto University...

Amount of Remuneration, etc. The Company does not pay to Directors who concurrently serve as Executive Officer the remuneration paid to Directors. Therefore, “Number of Persons”