• 検索結果がありません。

計算機上で動作する日本語文法の構築

N/A
N/A
Protected

Academic year: 2021

シェア "計算機上で動作する日本語文法の構築"

Copied!
25
0
0

読み込み中.... (全文を見る)

全文

(1)

Kobe Shoin Women’s University Repository

Title

計算機上で動作する日本語文法の構築

Construction of a Working Japanese Grammar on

Computers

Author(s)

橋本 力(HASHIMOTO Chikara)

Citation

Theoretical and applied linguistics at Kobe Shoin,

No.6:41-64

Issue Date

2003

Resource Type

Bulletin Paper / 紀要論文

Resource Version

URL

Right

(2)

計 算機 上 で動作 す る 日本 語 文 法 の構築*

橋本 力

ConstructionofaWorkingJapaneseGrammaronComputers

HASHIMOTOChikara Abstract Therearetwokindsoflinguisticsthatseekmodelsofwecomputealanguage: TheoreticallinguisticsandNaturalLanguageProcessing.Theformershouldbe consideredascientificstudy,whereasthelatterisanengineeringproblemorprac-tice.Reflectingtheircharacteristics,theoreticallinguisticsisnotstrictlyspeaking formalizednordoesithavecomprehensivecoverage,whichanysystemofliguis-ticcomputationisexpectedtohave,andNLPfailstogeneralizetonewphenomena likealinguistictheory.WearedeveloppinganHPSG-basedJapanesegrammar thatisexecutableasacomputerprogramaswellascapableofexpressinglin-guisticgeneralizations,sothatitwouldconstituteaninterfacebetweentheoretical linguisticsandNLP.Wehavecurrentlyimplementedagra皿marthatisableto dealmoderatelywellwithbasicphenomena,withsomeprinciplesassumedwithin HPSGexplicitlyexpressed.Inthispaper,wereportonthedetailsofthisgrammar anddiscussitsinfluenceofitontheoreticallinguisticsandNLP. 言 語 の計 算 体 系 を研 究 す る分 野 と して 理 論 言 語 学 と 自然 言 語 処 理 が あ り、 前 .者は科 学 と して の 言 語 学 、 後 者 は 工 学 と して の 言語 学 と考 え られ る 。 そ れ ぞ れ の 学 問 と して の 性 格 に対 応 して 、理 論 言 語 学 に は計 算 体 系 と して の 厳 密 性 、 応 用 に 耐 え る だ け の 網 羅 性 が 、 自然 言 語 処 理 に は 言語 理 論 と して の 妥 当 性 、 記 述 の 一 般 性 が 欠 け て い る。 本 研 究 で は2つ の ア プ ロ ー チ の 橋 渡 し と な れ る よ う な 、 計 算 機 上 で 動 作 す る言 語 学 的 に 妥 当 な 日本 語 文 法 をHPSGに 基 づ い て 構 築 す る 。 現 在 ま で に 我 々 は 、 基 本 的 な 文 を扱 え る だ け の 文 法 を 、HPSG で 想 定 さ れ て い る い くつ か の 原 理 を 明 示 的 に 抽 象 化 した 形 で 実 装 した 。 本 稿 で は こ の 文 法 の 詳 細 を報 告 し 、 さ ら に 、 本 研 究 が 理 論 言 語 学 と 自 然 言 語 処 理 に 与 え る影 響 を考 察 す る 。 Theorenca!and/1ppliedLinguisticsutKobeSpain6,41-64,2003. OKobeS{toinInstituteforLinguisticSciences.

(3)

1.は じ め に 1950年 代 チ ョム ス キ ー に よ り始 め ら れ た 理 論 言 語 学 は 、 自然 言 語 の 規 則 性 を 厳 密 な 数 学 的 道 具 立 て を用 い て 記 述 して い た 。 そ の 成 果 は 、 当 時 機 械 翻 訳 研 究 で 盛 り上 が っ て い た 自 然 言 語 処 理 研 究 者 達 に 受 け 入 れ ら れ 、 自然 言 語 処 理 技 術 の 一 部 と して 積 極 的 に 活 用 さ れ て い た 。 しか し、 両 者 の 関 心 や 方 法 論 が 変 わ る に つ れ 、2つ の ア プ ロ ー チ の 溝 は 大 き くな っ て い っ た 。 理 論 言 語 学 で は 、 規 則 の 体 系 と して の 文 法 を捨 て 言 語 獲 得 の 事 実 の 説 明 を可 能 に す る よ り抽 象 的 な 原 理 の 体 系 を構 築 し、 自 然 言 語 処 理 に と っ て 重 要 で あ る 処 理 の 問 題 に つ い て は全 く注 意 が 払 わ れ な く な っ た 。 そ の 結 果 、 か つ て は そ の 大 き な特 徴 で あ っ た は ず の厳 密 性 と、 当初 持 ち得 て い た 幅 広 い 現 象 を扱 え る網 羅 性 が 失 わ れ る こ と と な っ た 。 一 方 自然 言 語 処 理 で は 、 処 理 対 象 の デ ー タ に現 れ る言 語 現 象 を 網 羅 す る た め に は 文 法 規 則 を 人 手 で 地 道 に作 成 す る よ り も コ ー パ ス を用 い た 統 計 的 手 法 の ほ う が 現 実 的 で 高 性 能 で あ る との 認 識 か ら 、 ル ー ル ベ ー ス で は な く コ ー パ ス ベ ー ス の 技 術 に 関 心 を 向 け 始 め 、 言 語 を説 明 の 対 象 で は な く完 全 に処 理 の 対 象 と見 なす よ う に な っ た 。 つ ま り 自然 言 語 処 理 で は 文 法 の 妥 当 性 や 一 般 性 な ど は 完 全 に考 慮 外 と な っ た 。 2つ の ア プ ロ ー チ は 、そ れ で もな お 、言 語 の計 算 体 系 を研 究 す る とい う点 で は な ん ら変 わ らず 、説 明 と処 理 を両 立 させ る 研 究 が 可 能 で あ る 。Head-drivenP㎞aseStructureGra㎜ar (HPSG)は タ イ プ付 き素 性 構 造 に基 づ い て厳 密 に形 式 化 さ れ た文 法 理 論 で あ り、 す で に多 くの 言 語 の 幅 広 い 現 象 の 分 析 が そ れ に 基 づ い て行 わ れ て い る 。 本 研 究 で はHPSGに 基 づ い て 説 明 と処 理 を両 立 させ る 日本 語 文 法 を構築 す る 。 つ ま り、 言 語 学 的 な 妥 当 性 一 般 性 を維 持 しつ つ 、 計 算 機 上 で 動 作 可 能 な ほ ど の 厳 密 性 と応 用 に耐 え う る 網 羅 性 を備 え た 文 法 を 構 築 す る 。 現 在 の と こ ろ 、 基 本 的 な 文 を扱 え る だ け の 日本 語 文 法 を、 主 辞 素 性 原 理 、 意 味 的 構成 性 原 理 な どのHPSGで 想 定 さ れ て い る い くつ か の 原 理 を 明 示 的 に 抽 象 化 し た 形 で 実 装 し終 え て い る 。 計 算 機 上 へ の 文 法 の 実 装 は 、 ス タ ン フ ォ ー ド大 学 で 開 発 さ れ て い る 文 法 開発 環 境LKB(Copestake,2002)を 用 い て 行 っ た 。LKBは 素 性 構 造 で 記 述 さ れ た 文 法 が 入 力 さ れ る とそ れ に 基 づ い て 構 文 解 析 、 文 生 成 を行 う。 以 下 、2、節 でHPSGの 概 要 に触 れ 、3.節 で 本 研 究 で 構築 した 文 法 の 詳 細 を 報 告 し、4. 節 で そ の 文 法 の 実 装 に つ い て 述 べ る 。 さ ら に5.節 で は 本 研 究 が 理 論 言 語 学 と 自然 言 語 処 理 に与 え る 影 響 を考 察 す る 。6,節 は 結 論 で あ る 。 2.HPSGの 概 要 HPSGは 制 約 に基 づ く語 彙 主 義 の 文 法 で あ り、 文 のwel1-fomlednessは 語 彙 項 目の1青報 と、 適 格 な 言 語 記 号(語 や句)の 構 造 に 関 す る 、 素 性 構 造 で 記 述 さ れ た 制 約 群 に よ り規 定 さ れ る 。 変 形 や 派 生 を 用 い な い の で 語 彙 項 目 や 制 約 群 が 膨 大 な 情 報 を抱 え 込 む が 、 そ れ らの 間 に 存 在 す る 一 般 性 や 個 別 性 が タ イ プ 階 層 と階 層 間 の 制 約 の 継 承(上 位 の タ イ プ の 制 約 が 下 位 の タ イ プ に 引 き継 が れ る)と い う仕 組 み に よ り言 語 学 的 に有 意 義 な 形 で 整 理 、 抽 象 化 され て い る 。HPSGで は こ の タ イ プ 階 層 が 文 法 の 中 核 を 担 う。 以 下 で はSagand Wasow(1999)に 基 づ き本 研 究 と関 連 の あ る 部 分 に の み 焦 点 をあ て 英 語 の タ イ プ 階 層 を概

(4)

計 算 機上 で動 作 す る 日本 語文 法 の構築 43 観 す る 。HPSGの 詳 細 に つ い て はGinzburgandSag(2000),SagandWasow(1999)を 参 照 。 Z1∫ 義gηの 階 層 階 層 は ま ず 言 語 記 号(8'8η)が 語(嫁 一舵 〃z)と句(ρ 加α∫の か ら成 る こ と を宣 言 す る(1)。 (1), ∫謬8「η A zα一`∫ε配 、P1診聯5ε 3'8η で は(2)の 素 性 が 導 入 さ れ る 。PHON、SYN、SEMは そ れ ぞ れ 記 号 の 音 、 統 語 、 意 味 情 報 を 担 う 。 (2) PH・M・ ちSYNSEM[SYN8m酷 鳳SEM一 ・1 SYNに 適 切 な タ イ プ8rロ 〃1-cα∫で は(3)の 素 性 が 導 入 さ れ る 。 (3)[田 ⑳ ρ・乱SPR駒 π・・峨C・MPS'㈲ …)1 SPRとCOMPSに は そ れ ぞ れ そ の 記 号 の 指 定 部 と補 語 が(も しあ れ ば)入 る。HEADに は 品 詞 に相 当 す る タ イ プ ρ05が 割 り当 て られ る 。 品 詞 はVθア猷 ρ澱2p、η0κη、48∫、α4γ、σの、 co'サが 想 定 さ れ て い る 。 各 品 詞 に は そ れ 特 有 の 振 舞 い を表 す 素 性 の 他 に 素 性MODが 導 入 され て お り、 そ の 品 詞 が ど う い っ た 要 素 を修 飾 し う る の か が 規 定 さ れ て い る 。 例 え ば ηo〃ηの 素 性 は(4)の よ う に な る 。 (4) M・Dn・n・ ・ 州A{+,一}・CASE{n・ 恥acc} つ ま り ηo研 は 何 も修 飾 せ ず 、 ま た 、 〃側 π に は 先 行 詞 を照 応 す る もの と し な い もの が あ り、 主 格 か 対 格 の 格 を持 つ 。 SEMに 適 切 な タ イ プ86配 一∫'r麗で 導 入 さ れ る 素 性 は(5)の 通 りで あ る 。 (5)M・DE{P・ ・四 畑 圃n・n・}INDEX'甑 盟S皿Z∫ ・∫圃 繍 π) MODEは 記 号 の 意 味 的 な 機 能(命 題 、 疑 問 、指 示 な ど)を 、INDEXは そ の指 示 対 象(動 詞 な どで あ れ,ば状 況 、 名 詞 な ど で あ れ ば個 体 な ど)を 、RESTRは そ の 意 味 の具 体 的 内 容 を 表 す 。RESTRはpハ84∫oσ'Joη の リ ス トを取 る が 、ρ眉84`cα∫'oηは(6)の よ うな 構 造 に な っ て い る。 (6) RELN{1・v亀w田kgiv軌 …}Sn・ ・ARG1… ・ 皿G2… ・ …

(5)

2.2Zε κ一舵 用 の 階 層

Zεx-∫f6〃2は 」召xθ〃τ6とwo雇 か ら 成 る(7)。wo厄 に お い て は"runs""ran""running"は 区 別 さ れ る がZε 肥 溺 ε に お い て は 区 別 さ れ な い 。 (7)Z α 一'陀配 A Zα2〃281レ レ0雇 ♂α 一∫'躍 で は 項 構 造 を 表 す 素 性ARG-STが 導 入 さ れ る(8)。 そ の 値 は3yη5ε 〃2の リ ス トで あ る 。

(8)[ARαST駒

醐1

'ε肥 配6の 階 層 嫁 例 εは 品 詞 と項 構 造 の 観 点 か ら の多 重 継 承 階 層 に よ り(9)の よ う に 表 され て い る 。 (9) 」α εη2ε

/一

/へ

v8zわ 一伽 〃zα ψ 一此 吻 」ARG-SELECTIONl

諺 η`α 一'π'πzη3〃 一α㎎ ‡"

'"訂 v一跳 η1μv-z耀'°'∫ ∫α 批 吻P'α 一此 配 dierdydea"fbnJ 例 え ば ∫'り一批 〃π(strictintransitiveverb)はv6rわ 一Zκ〃iと3'rεc∫ 一傭 眉伽 ∫一㍑ 配 の 制 約 を 継 承 し て い る。 さ ら に[POS]以 下 を 詳 し く見 る と屈 折 の 可 能 性 に よ り(10)の よ う に 分 類 さ れ る 。 (10)

△ 岬coη5∫ 屈 折 す る の σ励 は 名 詞 と動 詞 で あ る 。 動 詞 の 階 層 を も う少 し詳 し く見 て み る と(11)の よ う に 自動 詞 他 動 詞 の 観 点 か ら分 類 さ れ て い る 。 (11) v8酌 一zκ配 一 'y一㍑〃i∫y一 ㍑〃3 !!ア ㌔ \__一 '"μ v-zκ配3'y-zκ 配3加 一Zx配`か 一ゐじ配 μv-Zx襯'"

pfv-ZI〃1はprepositionalins血 ・ansitiveverb、3∫v-Zκ 配 はsUicttransitiveverb、4か 一伽 〃3はditran-sidveverbを 表 す 。

(6)

計 算機 上 で動作 す る日本 語文 法 の構築 45 wo冠 の 階 層 wo雇 の 階 層 は(12)の よ う に な っ て お り、wo雇 に は(13)の 制 約 が か か る 。 (12) wo㎡ /1\ η0麗η一W4yεrわ 一M/4COη ∫'一}ツ4 (13) P且ON1国,sYNsEM1回,STEM

翫_M1回1

STEMは そ のwo雇 の も と と な る 」εκθ〃昭 を 表 し、`ゾ は デ フ ォル ト値 で あ る こ と を 示 す 。 つ ま り(13)は も との 」α ε彫 のPHON値SYNSEM値 が デ フ ォル トでwo雇 に 引 き継 が れ る こ と を 意 味 す る 。 動 詞 の 語 階層 を 詳 し く見 て み る と(14)の よ う に な っ て い る 。 (14) v6rわ一w4 一 弄ルvわ ρ眉ε5ψθr∫ μ3∫ψαr'μ ∬二Pαr∫'げvわ 一_!一. 338ヲ 泥3-yわ ηoη338・πρ眉ε∫-vわ ρα∫∫-vわ こ れ らの 動 詞 の 下 位 タ イ プ が(13)の 制 約 の デ フ ォ ル ト値 を上 書 き し、 各 下 位 タ イ プ に適 切 な制 約 を生 み 出 す 。 例 え ばpα3∫一功 はPHON値 を上 書 き し過 去 時 制 を 表 す 形 態 素 を付 加 す る だ ろ う。

」α8〃2εがwoπ 」と して 文 中 に 表 出 さ れ る段 階 で 、ARG-ST上 の 項 は 項 具 現 化 原 理(A卜 gumentRealizadonPrinciple,ARP)に よ り統 語 的 に 実 現 さ れ る(15)。

(15)團SPR国,C・MPS回1

・ 一

團1

SPRを 取 らずCOMPSの み の 場 合 に は 国 が 空 と な る こ とで 対 応 す る。 盆3ρ 加 冴5εの 階 層 ρ加 α∫8の 階 層 は(16)の よ う に な っ て い る 。 (16) 助 眉α58 一 η0π一んεα464二助 加 α484ヲ ゐ ム一'裾 ヂ 〃ノ ノ ハ ㌔\ ∼ ψ ん 海4一πα 麗∫ヲ 〃 一 層 一〃2047ρみ1註4-CO配 ρヲ12ん4一 Ψ7ヲ 海 吻 ・・の 制 約 と して[NmDTRSli・t㈱ 】が 導 入 され る・ こ れ1ま・伽 ・・は 全 て 辮 で は な いdaughterを 取 る 、 と い う こ とで あ る。 さ ら に 意 味 的 構 成 性 原 理(17)が 適 用 さ れ る だ ろ う。

(7)

(17)sEM国e… ①回・ … 〈lsEM国1・ … ・[sEM回1>1

磁4伽

・の制約とし4]

HD.DTR∫ ∫8η が あ り、 加 α4ε4二ρ加 α3εは 主 辞 で あ るdaughter を 取 る 、 と い う こ と を 意 味 す る 。 舵 α4ε4助 ハα5εに は さ ら に 主 辞 素 性 原 理(18)、 意 味 的 継 承 原 理(19)、 結 合 価 原 理(20)が 適 用 さ れ る 。 (18)[SYNIHE佃 国 ・-R【SYNIHE副 (19)[SEMI一 国 ・H-[SEMI-□11 (2°)ISYN[SPR1国 ・ 一!回]・-R「SYN[SPRノ 国 ・C・MPS1回11

(18)(19)は そ れ ぞ れ 、HD-DTRのHEADの 値 、INDEXの 値 が 句 全 体 のHEAD値 、INDEX 値 に な る こ と を 保 証 す る 。(20)はHD-DTRのSPR値COMPS値 が デ フ ォ ル ト で 句 全 体 のSPR値COMPS値 に な る こ と を 保 証 す る 。 こ れ は デ フ ォ ル トの 制 約 な の で 下 位 の 制 約 に よ り上 書 き さ れ う る 。 掘 一Ψ 卜pん、 裾 一co'ηρ初 、 観 一〃104ジhは そ れ ぞ れ(21)(22)(23)の よ う に な る 。 (21)【SYNISPR〈 》m皿RIS姻ISPR国,Nm朋R回1 (22)lsmlc・MPS〈 》H-1SYNIC・MPS〈 国 ・… ・回〉 一 皿 〈国 ・… ・回〉] (23)[H匹D皿 国 ・N皿DTRIS則HE趙IM・D国1 (21)(22)は そ れ ぞ れ 、HD-DTRがNHD-DTRを 指 定 部 、補 語 と し て取 る こ と を示 す 。(23) は修 飾 句 で あ るNHD-DTRのMOD値 がHD-DTRのSYNSEM値 と 同 じ で あ る こ と を 示 す 。 文 の 開 始 記 号 は(24)に あ る よ う に 定 形 動 詞 の 投 射 でSPRとCOMPSが 飽 和 し て い な く て は な ら な い 。 (24) 助 槻5ε SYN HEAD ド6酌 FORM ,伽 .SPR〈 》COMPS〈 〉 2.4自 然 言 語 処 理 か ら観 たHPSG 以 下 で は 自然 言 語 処 理 研 究 の 視 点 か らHPSGの 特 徴 を概 観 す る。 制 約 に基 づ く文 法 制 約 に 基 づ く文 法 で は 、変 形 も し くは 派 生 と い っ た操 作 的 な概 念 を極 力 排 除 し、 制 約 と い う 非 操 作 的 な概 念 に よ り文 のwell-fomlednessを 規 定 す る 。 理

(8)

計 算機 上 で動 作す る 日本語 文法 の構 築 47 論 的 な観 点 か ら は変 形 を用 い るべ きか ど う か は 議 論 の 分 か れ る と こ ろ か も しれ な い が 、 自然 言 語 処 理 的 観 点 か ら は変 形 を 用 い る べ きで な い こ とは 明 らか で あ る 。 変 形 な どの操 作 的 な 概 念 を取 り入 れ た 文 法 を理 論 に忠 実 に計 算 機 に 実 装 す る の は容 易 で は な い 。 ま た 、文 法 を拡 張 して い く際 に 文 法 内 に矛 盾 を 生 じ させ や す い 。 一 方 制 約 に基 づ く文 法 は多 くの 場 合 、理 論 に ほ ぼ 忠 実 に実 装 で き、 文 法 の メ ン テ ナ ン ス も容 易 で あ る。 そ して変 形 や 派 生 とい っ た概 念 の な い 一 つ の 層 か らな る 文 法 は 、言 語 の 産 出 と理 解 を 同 じ よ う に扱 え る 。 表 層 指 向HPSGで は知 覚 可 能 な表 層 情 報 の み に基 づ い て 文 法 が 構 成 さ れ て い る 。 つ ま り 変 形 文 法 で 仮 定 さ れ て い る よ う な 空 範 疇 あ る い は 空 の 語 彙 はHPSGで は 用 い ら れ な い 。 これ も ま た理 論 的 な観 点 か ら は一 部 の 理 論 言 語 学 研 究 者 に と っ て は議 論 の 余 地 の あ る と こ ろ か も しれ な い が 、 自然 言 語 処 理 の 観 点 か らは 大 き な 利 点 で あ る こ と は 明 白 で あ る。 知 覚 で き る情 報 以 外 の 存 在 を仮 定 した 言 語 処 理 は 、計 算 量 的 に非 現 実 的 な も の に な り、 ま た 処 理 方 法 も複 雑 な も の と な る。 タ イ プ 付 き 素 性 構 造HPSGの 厳 密 な 形 式 化 は タ イ プ付 き素 性 構 造 とい う 数 学 的 構 造 に よ っ て 達 成 さ れ て い る 。 これ に よ りHPSGの 計 算 機 上 へ の 実 装 は 十 分 可 能 な もの とな る。 初 期 の 理 論 言 語 学 で 用 い ら れ て い た 単 純 な 句 構 造 規 則 は 、 自 然 言 語 の 豊 か な構 造 を 表 現 す る に は 不 十 分 で あ る と して捨 て去 られ た が 、 タ イ プ付 き素 性 構造 に 基 づ く形 式 化 は そ の 厳 密 性 に お い て 初 期 の 単 純 な句 構 造 規 則 と変 ら ず 、 か つ 、 そ の 表 現 能 力 に お い て変 形 文 法 に 見 劣 りす る こ と は決 して な い 。 様 々 な 言 語 情 報 の 統 一 的 記 述HPSGで は 形 態 音 韻 、統 語 意 味 、 文 脈 に 関 す る言 語 情 報 を タ イ プ付 き素 性 構 造 に よ り統 一 的並 行 的 に扱 う。 これ は 変 形 文 法 な ど に は 観 られ な い魅 力 で あ る 。 理 論 的 な利 点 も さ る こ とな が ら、 自然 言 語 処 理 にお い て も こ の よ う な様 々 な 言 語 情 報 を 同時 に扱 え る こ と は有 益 で あ る 。 例 え ば 、会 話 の 流 れ を考 慮 し た音 声 機 械 翻 訳 シ ス テ ム を構 築 し よ う とす る 場 合 、 統 語 情 報 の 他 に 、 明 らか に音 韻 情 報 と文 脈 情 報 も必 要 に な る 。 従 来 自然 言 語 処 理 で 使 わ れ て き た あ ま り にadhoc な 文 法 で は 音 韻 、 文 脈 情 報 は お ろ か 意 味 情 報 す ら扱 う の は 困 難 で あ る 。 Constr皿ctionism言 語 表 現 に は確 か に規 則 性 が 存 在 し、 決 して ラ ン ダ ム な 文 字 列 で は な い 。 しか し一 方 で 、 あ ら ゆ る 言 語 表 現 を一般 的 な 原 理 か ら導 き 出 そ う とす る と必 ず そ の 原 理 か ら はず れ て し ま うconstructionに 出 くわ す 。 しか し こ れ ら を"peripheral" な 現 象 と し て切 り捨 て て し ま っ て は 応 用 に 耐 え う る 文 法 は 構 築 で き な い 。様 々 な constructionの 共 通 性 と個 別 性 を 整 合 的 に 扱 う理 論 的 枠 組 み が 整 備 さ れ て お り、 最 近 のHPSGに もそ の 要 素 が 取 り入 れ られ て い る(Ginzburg&Sag,2000)。 3.日 本 語 文 法 本 研 究 で構 築 した 日本語 文 法 の詳 細 につ い て述 べ る。

(9)

3.15'8η の 階 層 タイ プ 階層 最 上 部 は(1)と 、5ε8ηで 導 入 され る素 性 は(2)と 、SYNに 適 切 な素 性8m配 一cα∫ は(3)と 同 じで あ る 。 品 詞 は 名 詞 η、動 詞v、 後 置 詞 ρ、 形 容 詞 αφ、 副 詞 α4vを 想 定 して い る 。 吻 と α4vの ス ー パ ー タ イ プ と し て 品 詞 配 を設 定 して い る 。 全 て の 品 詞 タ イ プ に は 素 性M・Dが 設 定 さ れ る ・ 粧 η と ・1まIM・D〈>1で あ り・ 爾 は[M・Dη1・ α4・は lM伽1か[M・D・1・ ρ はlM・D・1で あ る ・ π に はM・Dの 他 に 以 下 の よ う 嫌 性 が 割 り当 て られ る。 (25)[GR匹 ・S照 ・呵 GRは そ の 名 詞 の 文 法 関 係 を表 し、SFFXは 格 を 表 す 。 意 味 論 の形 式 化 は、 現 在 の と こ ろ 、 理 論 的 に動 機 づ け られ た もの とい う よ りLKBに よ る 実 装 の 簡 易 さ を考 慮 し た も の とな っ て い る 。SEMに 適 切 な タ イ プ ∫ε〃2-∫翻cで はSag andW註sow(1999)の よ う なMODEを 用 い な い 。INDEXはSagandW註sow(1999)と ほ ぼ 同 じで 、 動 詞 な どで あ れ ば 状 況(εv例)を 、 名 詞 な ど で あ れ ば 個 体(吻6c∫)を 指 示 す る (26)。

(26)「1-'ぬ ・ 田S皿 」'・∫㈱ 伽'・ η)I

RESTRの リ ス トの 値 と な る タ イ プP昭4εcα ∫'oπは(6)と ほ ぼ 同 じ で あ る が 、 該 当 す るRELN の 項(ARG)の 数 に よ り α㎎1うρ肥4'cα`'oη、α㎎1-2二那 召d'cα"oη、醐g1-2-3ヲ 擢4∫cα∫'oπが あ り、 項 を そ れ ぞ れ1個 、2個 、3個 取 る 。p忽'cθ`'oπ に は 必 ずARGOが 存 在 し 、 必 ずINDEX 値 と 同 一 視 さ れ る 。 つ ま りARGOは 動 詞 な ど で あ れ ば そ の 状 況 を 、 名 詞 な ど で あ れ ば そ の 指 示 対 象 で あ る 個 体 を 値 と し て 持 つ 。 意 味 論 的 枠 組 み はMin㎞alR㏄ursionSeman廿cs (MRS)に 依 拠 し て お り 、 よ り詳 し い 情 報 はCopestake(2002),Copestake,FlickingeちSag, andpollard(lgg9)を 参 照 。 3.2敏 一舵 配 の 階 層 Zα一漉 〃3の階 層 は(7)と 同 じで あ る 。 そ して(8)と 同 じ よ う に'α 一舵 〃2にお い てARG-ST が 導 入 され る 。 し か し我 々 のARG-STは た だ の リス トで は な く外 項(EXT)と 内 項(INT) の観 点 か ら構 造 化 され た もの で あ る(27)。 (27)[EXT駒 一)・INT1駒 一),一 ・・(騨 一)】 伽 ε配6の 階 層 我 々 の 伽8膨 階層 は(28)の よ う に 品 詞 の 観 点 か ら分 類 さ れ て い る 。 屈 折 す る の(ηoル coπ5のは 名 詞 だ け で あ る 。 (28) 」 α6剛6 -COη3'-1εXη0πCO〃5'一'α 一.l v郡 か 」εxρ03ゆ 一Zεπ αの 一'《㍑ α4v-'α ηo那η一」α

(10)

計算 機 上 で動作 す る 日本語 文法 の構 築 49 動 詞 の 階 層 動 詞 の 階層 は 郡 司(2000)に 基 づ い て お り、(29)の よ う に 、 項 構 造 の 観 点 か ら分 類 さ れ て い る。 (29)

v召rわ

η0ηα86η∫ZVθ α88彫iv8 .!!へ \ ㌔..一 α死9'8∬ 麗雁6c灘 ∫α∫'yε 配ηε耽9α∫加6吻 π3`'ゴv8 ;A, 一 雨 ダ 配oη¢冴ηαc4卿 αc来 ル 配解 ρ鯉 雌 ∫漉4'加 η∫ 沸 ク 預 カル 見 ル 会 ウ 好 キ ダ デキ ル 送 ル ま ず 外 項 の あ る 無 し で 分 類 さ れ 、 そ の 後 内 項 の あ る 無 し で 分 類 さ れ る 。 ま ずVθ め はCOη5レ Zεxの サ ブ タ イ プ で あ り、 か つ 、HEADがvで あ る こ と 、INDEXが8レ6η'で あ る こ と が 要 求 さ れ る 。 ηoηα8θ纏v6-vεrわ 一伽 で はv6酌 の 制 約 を 継 承 し さ ら に 外 項 が 空 で あ る こ と が 要 求 さ れ る 。o㎎ 」8∬-vθr尻α で は 上 位 タ イ プ の 制 約 を 継 承 した 上 で さ ら に2つ の 内 項 が 共 に 空 で あ る こ と が 要 求 さ れ る 。 躍 α6c醐 傭vθ 一昭r尻 εxで は1つ め の 内 項 が 主 格 の 主 語 名 詞 句 で 、 か つ 、 そ のINDEX値 がARG1の 値 で あ る こ と が 要 求 さ れ る 。配oηo配ηαc-v8rわ一'ε%はさ ら に2つ め の 内 項 が 空 で あ る こ と が 要 求 さ れ る 。4伽 αc-v8r尻 ε冗 は2つ め の 内 項 が 目 的 語 名 詞 句 で 、 か つ 、 そ のINDEX値 がARG2の 値 で あ る こ と が 要 求 さ れ る 。 α8ε肛'v8-v8rわ 一」εx

で は 外 項 が 主 格 の 主 語 名 詞 句 で 、 か つ 、 そ のINDEX値 がARG1の 値 で あ る こ と が 要 求 さ れ る 。 研6㎎ α癖8-v8r尻 εxは α86η癖 ε一vεrわ一燃 の 制 約 を 引 き 継 ぎ 、 さ ら に2つ の 内 項 が 空 で あ る こ と が 要 求 さ れ る 。 伽 η5'卿6-v6rわ 一敏 で は1つ め の 内 項 が 目 的 語 名 詞 句 で 、 か つ 、 そ のINDEX値 がARG2の 値 で あ る こ と が 要 求 さ れ る 。 配oηo伽 η∫-v8rわ一'εxは2つ め の 内 項 が 空 で あ る こ と が 要 求 さ れ る 。4f∫roη3-vεr尻 α は1つ め の 内 項 が 与 格 、2つ め の 内 項 が 対 格 の 目 的 語 名 詞 句 、 そ し て2つ め の 内 項 の 】NDEX値 がARG3の 値 で あ る こ と が 要 求 さ れ る 。

そ の 他 のZ8x6膨 ηo膿 は ηoηcoη3'から制 約 を引 き継 ぎ 、 さ ら にHEADが η、INDEX値 が0伽C'で あ る こ とが 要 求 され る 。 項 構 造 は外 項 内 項 と も に空 で あ る 。PO3{ρ はCOη3'か ら制 約 を引 き継 ぎ、 さ ら にHEADが ρ で あ る こ と が 要 求 さ れ る。 項 構 造 は1つ め の 内 項 に屈 折 して な い 名 詞 句 を取 る 。 α4ノはcoη ∬ か ら制 約 を 引 き継 ぎ、 さ ら にHEADが α4ノで あ る こ とが 要 求 され る。 項 構 造 は外 項 内 項 と も に 空 で あ る α4yはco競 制 約 を 引 き継 ぎ 、 さ ら にHEADが α4vで あ る こ とが 要 求 され る。 項 構 造 は 外 項 内 項 と も に空 で あ る 。 本 文 法 の 項 具 現 化 原 理 は1εx例6で 適 用 さ れ る 。(30)の よ う にARG-STが 外 項 を 持 つ か ど う か に よ り2つ に分 け られ る 。 (30)a. b

SUBJ国,C・M咀 …T[EXT〈 》INT1回 ・ ㎜2回1

(11)

woπ ∫の 階 層 全 て の 敏6〃昭 は何 らか の 語 彙 規 則 の適 用 を受 け てwoπ ノとな り文 中 に 現 れ る 。 まずwoπ! の 階 層 を(31)に 示 す 。 (31) woπ1 -COπ3'一レレ0π」 πOjp2CO733∫一レ1/0π1 1 兀0記η_WO雇 一

∫勿 一η0槻 一WO雇0丑 ヴーπ0醜 一WOπ!6即 砂 一π0配η一WO雇 一

WO-0勿 一ルWoπ 」 η'-0勿一η一WOπ」 wo冠 の 制 約 は(32)の よ う に な る 。

(32) SYN回,SEM回,ARG-ST回,STEM 1α8配6

SYN国,

SEM回,AR_国1

(32)で 述 べ ら れ て い る の は 、 対 応 す るwoπfと 厩8〃18の 間 で はSYN値SEM値ARG-ST

値 が 等 し く な る 、 と い う こ と で あ る 。 η0麗 侃3'-WO雇 に は 屈 折 変 化 の あ る 品 詞 が 属 し 、 屈 折 変 化 の な い 品 詞 はCOη ∫∫-1〃0ガに 属 す る 。 η0ηCOη∫∫-WO雇 に 属 す る の は 現 在 名 詞 だ け で あ る 。

嫁8膨 とwo㎡ の マ ッ ピ ン グ は 語 彙 規 則 に よ り行 わ れ る 。c侃3冠 α に 属 す る ぬ8〃 躍 と そ れ に 対 応 す るWO冠 の マ ッ ピ ン グ は 全 て 定 常 語 彙 規 則COη ∫'一勧Zθ に よ り行 わ れ る 。COη 距 ∫r那'8はカ テ ゴ リ を'εX6〃昭 か ら1〃0雇 に 変 え る だ け で 他 は 何 も し な い 。 η0ηCOη5'-」α に 属 す る 唯 一 の'εx飾8で あ る 名 詞 と そ れ に 対 応 す るwo雇 の マ ッ ピ ン グ を 担 う 語 彙 規 則 は 、 そ の 名 詞 の 格 を 表 すsu伍xに よ り主 格 名 詞 語 彙 規 則8α 一πo硯 一」雇8、 対 格 名 詞 語 彙 規 則 、〃o一πo研 一 伽16、 与 格 名 詞 語 彙 規 則 η'一η侃 η一伽'6、 無 接 辞 名 詞 語 彙 規 則 αηρり用 側 π一伽'6の4つ に 分 け ら れ る 。 こ れ ら は 全 て 接 辞 付 加 に の み 関 わ り、 そ れ ぞ れ 「が 」 「を 」 「に 」 「φ」 を 付 加 す る 。8α一η0朋 一伽'θ が 適 用 さ れ た 名 詞 は 吻 一η0膨η一WO雇 へ 、WO一 π侃 π一'川Z8が 適 用 さ れ た 名 詞 はWO-0勿 一η一WO雇 へ 、 η'一η0朋 一吻'8が 適 用 さ れ た 名 詞 は η'-0勿一η0槻 一WO雇 へ 、 躍 ρ砂一η侃 η一 ∫配18が 適 用 さ れ た 名 詞 は8卯 り1一η釧 η一W侃1へ と マ ッ ピ ン グ さ れ る 。 吻 一π側 η一1〃0π」で は 接 辞 が 「が 」 で あ る だ け で な く文 法 関 係 が 主 語 で あ る こ と が 要 求 さ れ る 。0毎 π侃 π一WOπfで は 文 法 関 係 が 目 的 語 で あ る こ とが 要 求 さ れ 、 そ の サ ブ タ イ プ で あ るWO-0毎 η一WO㎡ で は 接 辞 が 「を 」、WO一 吻 一麗一WO雇 で は 接 辞 が 「に 」 で あ る こ と が さ ら に 要 求 さ れ る 。6即 り磁 碑 η一WO雇 で は 文 法 関 係 の 指 定 は な く接 辞 は 「φ」 で あ る こ と が 要 求 さ れ る 。

3,3助 ㍑3ε の 階 層

本 文 法 で 扱 う 助rα58は ぬ4-3〃毎 功 、 乃4-co〃砕 功 、 み4-〃204抑 の3つ で あ り 階 層 は(33) の よ う に な る 。

(12)

計算機 上 で動 作す る 日本語 文 法の構 築 51 (33)P加 α56 1 ん8α4ε4ψ加 ∬6 一 雇 一配04ψ みh4-CO〃 甲 ψ13h4-∫ 醜勿 ヲ漉 h8磁64抑 川3θ の み な の で 助ra5ε の 段 階 で(34)の よ う な 素 性DTRSを 導 入 す る 。 (34)[田 ・'㈱ 澗1Z∫ 脚)・NH2制 ・'8η)1 Hはheaddaughter、NH1、NH2はnonheaddaughterを 表 す 。 ま た ρh螂6に は(17)と ほ ぼ 同 じ 意 味 的 構 成 性 原 理 が 適 用 さ れ る(35)。 (35)SEMlRESTR国 ㊥ 回 ㊥ 回

DTRIHISEMI昭STR国 ・NHIISEMIRESTR回 ・NH21SEMI昭STR回1

加 α虎4ッh酒α∫8には 主 辞 素 性 原 理(36)意 味 的 継 承 原 理(37)結 合 価 原 理(38)が 適 用 され る 。 (36)SYNIHEAD国 , (37) SEMl㎜EX国, (38)SYNlSUB」 ノ回, DTRSHIsYNsuBJ1国 , ぬ4一ぶ吻7pん 、 乃4-co卯:抑 、h4-〃304ヲ ん は そ れ ぞ れ(39)(40)(41)の よ う に な る 。 D皿S[HISYNI田AD国]

DTRs[HlsEMIINDEx国

】]

「[

c・MP1回111

(39)ISYNIS田J〈 》 皿1国1

(4・)ISYNI…

〈田ISmlC・

回>NH1…2回1

(41)【H国,NHIIsmlHEADIM・D国1 ま た 、本 研 究 の 文 法 で は文 の 開 始 記 号 は 助m38の サ ブ タ イ プ と して(42)の よ う に 定 義 され て い る 。 ⑭2)s姻[朋AD・ ・s鵬J〈 》c・MP〈>11 つ ま り文 の 開 始 記 号 は 動 詞 の 投 射 で 、 か つ 、SUBJとCOMPが 飽 和 して い な くて は な ら な い 。 4.日 本 語 文 法 の 実 装 3,節 で 述 べ た 日本 語 文 法 をLKB上 に 実 装 した 。 実 装 の 際 に はLKBに よ る 制 限 の た め 文 法 の 形 式 化 を い くつ か 変 更 し た 。

(13)

4.1文 法 開 発 環 境LKB LKB(LinguisticKnowledgeBuilding)は ケ ン ブ リ ッジ 大 学 でACQUILExプ ロ ジ ェ ク ト の 一 環 と して 開発 さ れ(そ の 当 時LKBはLinguisticKnowledgeBaseの 略)、 現 在 ス タ ン フ ォー ド大 学CSLIでLinGO(LinguisticGra㎜arsOnline)プ ロ ジ ェ 外 の 一 環 と して継 続 的 に メ ンテ ナ ンス され て い る文 法 開 発 用 ソ フ トウ ェ ア で あ る 。LKBは 、 図1に 示 した よ うに 、 タ イ プ付 き素 性 構 造 の 形 式 に 従 っ た文 法 が 入 力 され る と、 そ の 文 法 に した が っ て構 文 解 析(文 字 列 → 意 味 構 造 、 統 語 構 造)、 文 生 成(意 味 構 造 → 文 字 列 、 統 語 構 造)を 行 う。 LKBに 与 え る 文 法 は タ イ プ付 き素 性 構 造 の 形 式 に従 っ て い れ ば よ く、 必 ず し もHPSGで あ る必 要 は な い(LKBに 付 属 の サ ン プ ル文 法 に はCategorialGra㎜arの 実 装 の例 が あ る)。

文 法

文字列

意味構造

1

, r■ ■ ■ ■ ■ ■ 一 圏 ■ 1. 1■ 暉 闇 ♂ II L■ ■ 昌 一 ■ 一_■ ,

LKB

図1:LKBと そ の 機 能 LKBで 表 示 さ れ る 統 語 構 造 は 基 本 的 に タ イ プ付 き 素 性 構1造 に 従 っ た もの だ が 、 そ れ に 対 応 した 木 構 造 も表 示 可 能 で あ る(図2)。 ま たLKBで はMRS(Copestakeetal.,1999) に 基 づ く意 味 構 造 も 出 力 で き る(図3)。 こ れ らの 統 語 構 造 、 意 味 構二造 は 文 「犬 が 寝(る)」 ("inugane")に 対 応 す る 表 示 で あ る 。 4.2実 装 用 日本 語 文 法 以 下 で は 実 装 に お け る文 法 の 変 更 個 所 に つ い て 述 べ る 。 5∫8πの 素 性 まず5'8η で 導 入 さ れ る 素 性 に変 更 が 加 え られ る(43)。

(43)[・ 即H・4"・'・ ・SYN8m一 ちSEM一 伽c,ARGS・'司

oRrHはPHoNに 対 応 す る 。ARGsは 助 砺6とwo雇 で 用 い られ る 素 性 で あ り、ρ加056 で あ れ ば そ の 構 成 素(後 述 す る ρん燃8の 制 約 に よ りARGS内 の 要 素 がDTRSに マ ッ ピ ン

グ され る)を 、wo雇 で あ れ ばSTEM、 つ ま り基 と な る 」α8膨 に対 応 す る 。

項 具 現 化 原 理LKBで は(30)の よ う な振 舞 い を そ の ま ま 実 装 す る こ と は で き な い 。 つ ま り外 項 を取 る 場 合 取 らな い 場 合 だ け で は な く、 内項 を取 る 場 合 取 らな い 場 合 、項 を全 く取

(14)

計 算機 上 で動作 す る 日本 語文 法 の構築

図2:統 語構 造 の 出力例

(15)

図3:意 味構 造 の 出力例 ら な い 場 合 を そ れ ぞ れ 別 の 項 具 現 化 原 理 に よ り扱 わ な くて は な ら な い 。 本 文 法 で は(29) に 基 づ き項 具 現 化 原 理 を(44)の よ う に規 定 した 。 (44)α 町9'θ∬一αψイα8〃置6 SYN ARG-ST [s田J・ 醐 [EXT・ η・ZZ・, 配oηo房 παご一αη7-」α 召η1θ SYN ARG-ST 4'姻 αc一αワ ー'α6辮 θ SYN ARG-ST c・ 皿 ・η・z∫・1 INT1*η 〃 」*, ㎜2・ π・」Z・] [S田J国 ・C・MP・ η麗」Z・1 [EXT・ η・"・・mT1国 ・ ㎜2欄 ・1 「SUBJ回 ・C・MP回1 1EXT…Z'・ ・INT1国 ・ 皿2回] 槻6㎎ ・観v8一 α甲 一zε罪ε配6 S姻[SUBJ回, ARαST[EXT国, C・MP・ 纏Z・1 INT1*η 腸π*, mT2・ 欄 〃・1

(16)

計 算機 上 で動作 す る 日本 語文 法 の構築 55 ㎜ ηo路αη∫一αη7イ群6配8 SYN ARG-ST 4∫frαη5一α1ワイα6Pπ ε SYN ARG-ST [SUB」 国 ・C・ ㎜ 回1 [EXT国,㎜1回,INT2…ZZ・1, 『SUBJ国, [EXT国 ・ C・MP〈 回 ・回 〉] INTI回,INT2回 伽 ε規εの 階 層 実 装 用 文 法 の 伽 θ〃2θの 階 層 は ま ず(44)のARPに よ る 分 類 と屈 折 変 化 の あ る無 しに よ る 分 類 に従 う。 よ っ て 勉 ε膨 の 最 上 部 は(45)の よ う に な る 。 (45)' εxε配6

-CONS皿N㎜SS塵]

/へ__-COη3'-」 α π0πCOπ3'-」8Xα ㎎ ・Z6∬一αηり一'∬6'η8鷹0π0醜 αC一θη アー'α6配64'κ παC一のP-」 α 召鷹6'一

一 一 "聰 碗8流9α∫'γ6一αη2-」8π6那8アηoηo∫固脇 一α1アー'α6彫召6∫'∫π班3一σ1ワー1α召海8 現 在 屈 折 変 化 の あ る の は 名 詞 だ け で あ る 。 一 連 のARP群 は 動 詞 だ け に 適 用 さ れ る の で は な く名 詞 、 形 容 詞 、 副 詞 、 後 置 詞 に も 汎 用 的 に 適 用 さ れ る 。 具 体 的 に は ηo伽 一伽 、 α4ノー嫁 、 α4V一伽 に は ω ψ ∬ 研pが 、 ρ0吻 一」α に は 〃10π0〃0πε一αpが 適 用 さ れ る 。 助 螂8の 階 層3.節 の 日 本 語 文 法 に お い て 助 雌38は 、 そ のdaughter数 に 関 わ ら ず 一 律 に 規 定 さ れ て い る 。 例 え ば 履co叩 ρ抑 は(40)に あ る よ う にNHI、NH2が そ れ ぞ れ あ る 場 合 無 い 場 合 を ま と め て 規 定 さ れ て い る 。 し か しLKB上 に 実 装 す る 際 に はdaughterが1 つ(Hの み)の 場 合(∬ 順 ワ ツ んrα5の、daughterが2つ(HとNH1)の 場 合(わ'η αび 神m5ε)、 daughterが3つ(H、N且1、NH2)の 場 合@rη αり27ρ加 α56)を 別 々 に 規 定 し な く て は な ら な い(46)。 伽 一雇 ヲ伽3ε の よ う な 中 間 の タ イ プ を 設 定 す る の はgreatestlowerboundを 一 意 に 定 め る た め で あ る 。 さ ら に こ れ に 伴 い 、 意 味 的 構 成 性 原 理 も(47)の よ う に3つ に分 れ る 。

(17)

㈹ 「

国,坤1__田]

咀 一購謙

皿:1

飽武間 り門P鮎切5ε SEMlRESTR国 ㊥ 回 ④ 囹,DTRHlSEMlRESTR回 NHIlS][MIRESTR回 NH21SEMI蛆STR回 , 層 一``抑p抑 も 〔46)か ら 分 か る よ う に3つ に 分 か れ る(48)。 (4品} "'lf'り・・1冒4・`け川ρ一帥 用 甜 SYNISUB』 DTRS わ」瑚 η 一1㎡一co卿 二助 ㎎58 SYNISUBI DTRS 国 r H 晒・甜 雌 .SYN卜IBJ国 ・

Hl剛

_1

SYN[S冊J国, NH1回 'εη置αり[一ん4-`o〃 ψ7坤 ㎎8ε SYNISUBJ回 DTRS

_]1

H憾

陣_剛1

NHI囹 NH2回 デ フ ォル トの 扱 い ㈹ で は本 来 な ら結 合 働 鯉 よ り棚 班 るべ きm。th・・と 血剛 伽 呂ht・・ のSUBJの 同 一・性 が い ち い ち述 べ られ て い る.こ れ はLKBが デ フ ォ ル トを扱 え な い た め で あ る ・ こ の こ と は 帽 一測 妙P奴49)と'峰"如4一 ρ'卍(50)に もあ て は ま る 。

(18)

計 算機 上 で動作 す る 日本語 文法 の構 築 57 (49) (50) ぬ4-3κzヴ ツ1虚rθ38 s掴[SUBJ・ η・"㌔c・MP・ π・'」・1

_c。 側

雇 一〃ZO4ψ 加 口3ε SYN DTRS [SUBJ国 ・ NHl H c・認 回]

-1M°Dl:識

SYN[田AD回 ・SBJ国 ・ .SEMl㎜EX回

咽1

4.3解 析 例 本 節 で は 、 本 研 究 で 構 築 さ れ た 文 法 に よ りい か に し て 文 が 解 析 さ れ る の か を 例 示 す る 。 犬 が 寝(る) (51)統 語 構 造 S //へ \ \エP-SUB」-PHRASE NPVP uN岨HEAD-coMP-PHRAsEIiuN羅HEAI)-coMP-PHRAsE NV GA-NOUN-IRU田lICONST-IRULE ηOL例一蝕κ1粥8㎎ α∫距ε一vεrわ・陀x

ll

inugane 意 味 構 造 INDEXel RELSく 翻f一慌ぜ,π θ一副) ARGOxユARGOel,ARGlx2

統語構造 まず一

蜘u蜘

の適糊

て… とな燃

の よ う に文 法 関係 と接 尾 辞 が 決 ま る 。 次 にwo雇 、i皿gaは 朋 αη 一hεα4-co7叩抑ro38と し て 認 可 さ れ 助 鷹 εに な り、動 詞 句 に よ り主 語 と して 選 択 さ れ る こ とが 可 能 と な る。 一 方

(19)

槻8㎎ α"ソε一ソ6rわ一'εκ・neは00η5∫ 一〃κZθの 適 用 を 受 け てwo雇 と な っ た 後 、 朋 αry一舵04-co彫 ρ一 助rα58と し て 認 可 さ れ ρ加038に な る 。 最 後 に 蜘8α と η6が 雁3吻 ツ 加 撹8εと し て 認 可 さ れ る 。 意 味 構 造inugaとneの 意 味 構 造 は(52)の よ う に な っ て い る 。 (52}i皿 輔臼a: ne二 INDEX田o勿 セ亡`

RELS隠

_,,ARG.国

INDEX[コ8yε 班

RELS階

_ARG。

国,ARG1伽1

inugaは 名 詞 な の でINDEXの 値 と し てo勿6c'を と り、 一 方neは 動 詞 な の でINDEXの 値 と し て εvεπ∫を と る 。neは 鷹 町9α'∫y8な の でRELSの 値 と し て θ㎎12ρ 肥4∫oo"oη を と る 。ARGIが 槻 θ㎎ α∫'yεの 外 項 の 意 味 に 相 当 す る 。 こ の2つ がh4-5吻 助m56と し て 認 可 さ れ る 際 に 一 つ に な っ て(51)の 意 味 構 造 が 得 ら れ る 。 具 体 的 に は 、h4-5吻 助 鷹6は 舵 α4ε4ψ加 α36の 制 約 を 継 承 し て い る の で 意 味 的 継 承 原 理 の 適 用 を 受 け る 。 従 っ て 主 辞

で あ るneのINDEX値(εv6η'、el)がh4-5吻 ヲ 加 α∫ε全 体 のINDEX値 と な る 。 ま た 乃4-8吻 ψ 加 切∫召 は わ伽 び ッ 加 郡 θ の 制 約 も 継 承 し て い る の で 意 味 的 構 成 性 原 理 の 適 用 を 受 け

てinugaとneのRELS値2つ 力防4-∫ 吻 ゆ 加05θ 全 体 のRELS値 と な る 。neのARG1と inugaのARGOの 値 が 単 一 化(x2)す る の はneが α86η"v6一ソεrわ一」6κの 制 約 を 継 承 し て い る

た め で あ る 。 α8εη∫加召一y8rか16κは 外 項 の 名 詞 句 のINDEX値 とARG1の 値 を 同 じ に す る 。 犬 が 猫 を 食 べ(る) (53)統 語 構 造 NP UN舐Y-HEAD-COMP-PHRASEI N GA-NOUN-IRULEl η0麗72-1εX 」 inuga S 一 坦:型田一Pl引R且甑 VP 一 邑^RY-}田AD・OOMP-PHRA5E NP UNARY-HEAD十COMP-PHRASE N WO-NoqN-IRULE η014η 一Z8X

l

nekowo V lCONS㍗IRULE ηZOη0加 απ5一レεrわ_1εX l tabe

意味構造

INDEXe1

  S(圓

街,ARGI穐,ARG2勘

(20)

計 算機 上 で動作 す る 日本語 文法 の構築 59 統 語 構 造nekowoは ηo配η一Zα、nekoがwo一 ηo朋 一伽'θ の 適 用 を 受 け て 派 生 さ れ 、

が決まる一

は一

適用を受け…

雇となり・その後 一

と と も に わ加の 一舵 α4-60即 髄r〃38と して 認 可 さ れ る。 主 語 の格 は 必 ず 主 格 とな る よ う に し て い るが 、 目 的 語 の 格 は 動 詞 に よ り対 格 で あ っ た り与 格 で あ っ た りす る 。 動 詞tabeは 対 格 の 目 的 語 を取 る よ う に語 彙 的 に 指 定 さ れ て い る 。

意 味 構 造tabeは 〃20ηo伽 η5'∫'ソθで あ り αrg1-2-p肥4εc傭oη を と る 。 〃30ηo脚 η∫∫加8はog8η 一 ∫'vε、 ∫raη5∫∫`vθか ら 制 約 を 引 き 継 い で お り、 そ の 結 果 、ARG1が 外 項 の 名 詞 句 のINDEX 値(ARGO)と 、ARG2が 一 番 目 の 内 項(INT1)のINDEX値(ARGO)と 同 一 視 さ れ る こ と

に な る 。 大 き い 犬 が 家 で 寝(る) (54)統 語 構 造 ADJP

l

ADJ 妨 一'α ookii NP -OD一 SE NP

l

N l η0罵 π一」ε冗

l

inuga 意 味 構 造 INDEXel RELSく ρむ舶 」盟, ARGO晩 S AD一 駐UB」-P龍R VP :-MO9冒P}:此r阪 _ PPVP

猷ゆ

矧 ・RA・El

NPPV IIl Npo5砂 一'α 嗣8㎎ ・αだv8-vθrわ 一'α ・皿 帥 田 一凪ULEll πo配 η 一Z6κdene

I

ie

1制 憶 恥

`'乱 彫' , ARGOε1 ARGlx3 肥 一'忠' 》 AR(]OεI ARαx宝 .

統 語 構 造 αの 一zεx、ookiiはcoη5'一か配」6、朋oη 一舵04-co〃 ψ 一ρ加 α∫8の 適 用 を 受 け 、 そ の 後 修 飾 先 で あ る 名 詞 句inugaと と も に 舵 α4-〃304ツ加 ロ∫ε と し て 認 可 さ れ る ・ieは α叩 り・一η侃 η一'rπ'ε の 適 用 を 受 け てwo冠 と な り、 後 置 詞 句iedeは 後 置 詞deを 主 辞 と し た わ加αry一加 α4-co脚 一 沸z8∫ θ と し て 認 可 さ れ 、 そ の 後 修 飾 先 で あ るneと と も に ん8α4覗04ツ ん酒α3εと し て 認 可 さ れ る 。

意 味 構 造 αの一1αのINDEX値(ARGO)はMOD値 のINDEX値(ARGO)と 同 一 に な る よ うに 制 約 され て い る 。 よ っ て修 飾 先 で あ る名 詞 句inugaのINDEX値 がookiiのINDEX

(21)

値 と な る 。 後 置 詞deは 補 語 は 取 る が 主 語 は 取 ら な い よ う に 制 約 さ れ て お り、RELSの 値 と して α㎎1ヲ 泥4'cα∫'oηを 取 る 。ARG1の 値 は 補 語 のINDEX値 と 同 一 視 さ れ る 。 よ っ て deのARG1の 値 がieのARGOの 値 と同 じ に な る 。 ま たdeは 動 詞 句 を修 飾 す る よ う に制 約 さ れ て お り、rNDEX値 が そ の 修 飾 先 のINDEX値 と 同 一 視 さ れ る 。

5.計

算機 と言語理 論

4.節 で 計 算 機 処 理 可 能 な 文 法 に つ い て 述 べ た が 、 こ の よ う な 文 法 を構 築 す る こ との 、 理 論 言 語 学 と 自 然 言 語 処 理 に 与 え る影 響 に つ い て 考 察 す る 。 1.節 で 述 べ た が 、 現 在 の 自然 言 語 処 理 で 用 い ら れ て い る 文 法 で は 言 語 学 的 な 妥 当 性 や 一 般 性 は 全 く考 慮 さ れ て い な い。 自然 言 語 処 理 研 究 者 は 言 語 獲 得 の 事 実 の 説 明 に は 関 心 が ほ とん どな い の で 、 抽 象 的 で 計 算 機 処 理 が 困 難 な文 法 体 系 よ り単 純 で 明 示 的 な句 構 造 文 法 を好 む 。 ま た 句 構 造 文 法 用 の 処 理 効 率 の高 い構 文 解 析 ア ル ゴ リズ ム が 既 に 開発 され 実 用 レベ ル に 達 して い る の も理 由 の一 つ で あ る 。 しか し2.節 で 述 べ た よ う に 、HPSGは 言 語 学 的 な 妥 当 性 一 般 性 を 維 持 し た ま ま 自 然 言 語 処 理 の 要 求 に 応 え る こ と を可 能 に す る: i)そ の タ イ プ 階 層 を 用 い た 文 法 体 系 は 、 応 用 に 耐 え 得 る ほ どの 大 規 模 文 法 を構 築 す る 際 に伴 う メ ン テ ナ ンス の 困 難 さ を 軽 減 す る 。ii)制 約 に 基 づ く単 一・の 層 か らな る 文 法 は構 文 解 析 と文 生 成 を 同 様 に扱 う こ とが で き、 こ れ も 自然 言 語 処 理 に とっ て 大 きな 利 点 とな る 。 揃)高 度 な 一 般 性 抽 象 性 を持 ち なが ら も、 そ の 表 層 指 向 性 が 計 算 量 を 現 実 的 な レベ ル に押 さ え る 。i▼)HPSGの 形 態 音 韻 、 統 語 意 味 、文 脈 な どの 情 報 を並 行 的 に扱 え る記 述 能 力 は 、 自然 言 語 処 理 の 応 用 シ ス テ ム の 幅 を広 げ る 可 能 性 を 持 つ 。v)Constructionismを 取 り込 ん だ 最 近 のHPSGは 従 来 は例 外 的 と して 除 外 さ れ て き た よ う な現 象 も理 論 的 枠 組 み 内 で 捉 え る こ と を可 能 に し、 応 用 に 耐 え う る 規 模 の 文 法 を理 論 的 に整 合 的 に構 築 で き る 。 一 つ の 応 用 事 例 と して ス タ ン フ ォ ー ド大 学 の もの を挙 げ る 。 ス タ ン フ ォ ー ド大 学 で はHPSG に 基 づ く大 規 模 英 文 法ERGを 開 発 し、 そ れ をVerbmobil話 し言 葉 機 械 翻 訳 プ ロ ジ ェ ク ト (Wahlster,1997)の 翻 訳 シス テ ム に 組 み 込 ん だ 。 またERGは 言 語 障 害 者 の た め の 発 話 支 援 シ ス テ ム に も用 い ら れ て い る(Copestake,1997)。 こ れ ら の シ ス テ ム に 共 通 して い る の は 、 話 し言 葉 や 障 害 者 の発 話 に見 ら れ る 断 片 的 な発 話 に 対 し て 断 片 的 な 意 味 情 報 を生 成 し、 そ れ ら を 用 い て 完 全 な 文 の 意 味 情 報 を構 築 す る 、 とい う点 で あ る 。 こ れ らの シ ス テ ム で は 統 語 と 意 味 の 密 接 な 関 係 を 同 時 ・並 行 的 に 扱 え る と い うHPSGの 利 点 を う ま く活 用 して い る と言 え る 。 理 論 言 語 学 で 必 要 な もの は 母 語 話 者 の 直 観 で あ る 。 コ ー パ ス 言 語 学 の よ う に大 規 模 な デ ー タの 処 理 が 要 求 され る よ う な 分 野 で は 計 算 機 の必 要 性 は 明 らか だ が 、 理 論 言 語 学 に お け る計 算 機 の 役 割 は そ れ ほ ど 明 白 で は な い 。 し か し計 算 機 上 に文 法 を実 装 す る こ と の 理 論 的 な 観 点 か らの 利 点 が い くつ か あ る:i)実 装 に 際 して そ の 文 法 は 計 算 機 上 へ の 実 装 に 耐 え られ る ほ ど の 厳 密 性 明 示 性 が 要 求 され る 。 こ の 時 点 で 曖 昧 な個 所 や 不 明 瞭 な 個 所 は 排 除 され る 。ii)文 法 の 適 用 範 囲 が 広 が り規 模 が 大 き く な る に つ れ て生 じ得 る 矛 盾 は 、 人 間 の 目で 検 出 す る の は 時 と して 非 常 に 困 難 だ が 、 計 算 機 に と っ て は 容 易 で あ る。 矛 盾 が 生 じた 時 点 で 計 算 機 は す ぐ に そ れ を検 出 す る 。iii)実装 後 、 そ の 文 法 に基 づ い て あ る程 度

(22)

計算 機 上 で動 作 す る 日本語 文法 の構 築 61 の規 模 の デ ー タ を実 際 に解 析 す る こ とで 、 そ の 文 法 体 系 全 体 と して 当 初 の 期 待 通 り に振 る 舞 う か を確 認 で き る。iv)ま た現 実 の 発 話 デ ー タ の 解 析 を通 して 、 そ の 文 法 理 論 の 現 実 の デ ー タ に 対 す る説 明 力 、 網 羅 性 を検 証 で き る。 い か な る文 法 理 論 も、 そ れ が あ る 個 別 言 語 の 文 法 で あ る限 りは 、 そ の 言 語 の 現 象 を広 範 に扱 え る べ きで あ る 。v)い っ た ん 計 算 機 上 に 実 装 さ れ 電 子 化 さ れ た 文 法 は 、 様 々 な 媒 体 に よ り携 帯 、 保 存 が 可 能 と な る 。 そ し て 、 例 え ば ネ ッ トワ ー ク な ど に よ り多 くの 言 語 学 者 に共 有 され る こ と に よ り、 文 法 の 共 同 開発 が 可 能 と な る 。 ソ フ トウ ェ ア の オ ー プ ン ソ ー ス 化 に よ る 高 度 で 急 速 な 発 展 は 例 え ばUNIXの 世 界 を見 れ ば 明 白で あ る 。 `.結 論 本 稿 で は計 算 機 上 で 動 作 す る 言 語 学 的 に 妥 当 な 日本 語 文 法 に つ い て 述 べ た 。4.節 で 述 べ た よ う に、 本 研 究 で 用 い た文 法 開 発 環 境LKBに よ る 制 限 の た め 、 い くつ か の 点 で 理 論 と 実 装 の 間 にわ ず か な 乖 離 も見 られ た が 、 ほ ぼ 理 論 に 忠 実 に 、 そ し て 理 論 が 予 測 す る通 りの 振 舞 い を示 す よ う に 実 装 で き た 。 ま た 、 近 年 そ の溝 が 深 くな りつ つ あ る 理 論 言 語 学 と 自然 言 語 処 理 の 関 わ りに つ い て 述 べ 、 そ の2つ の ア プ ロ ー チ がHPSGを 接 点 と し て お 互 い に と っ て 有 益 な形 で 相 互 作 用 し得 る こ と につ い て論 じた 。 補 遺:語 彙 項 目 の 例 (55)Unergati▽everb3寝(る) 既8㎎ α∫1y6-v8r尻 εx ORTH SYN SEM ARG-ST ``ne,, HEADv SUBJ国 COMP〈 〉 ρ海m38 SYNI田AD[GR吻,S照8α1 SEMIINDEX回o切 召c∫ 正NDEX回 εり8π∫ RELS α㎎17P肥4`c副oπ PRED π6一彫',ARGO回,ARG1回 lEXT回,皿1〈 》mT2〈>1

(23)

(56)Monohmsi伽everb:食 べ(る) 〃20η0〃ηη5-yθrわイ8× ORTH``tabe" SYNHEADy SUBJ[コ 、Pゐ鷹6 smlHE⑳[GR吻, SEMlINDEX回o勿6c' COMP回SYNlHEADp加 ㍑ GR吻, SEMlINDEX囚o勿80' SEMINDEX固6v傭 RELSα ㎎・1-2二μ ε4`cα,,oπ PRED'α わε_耀J ARGO固 ARG1回 ARG2國 皿 αSTIEXT回 ・mTl回 ・INT2〈>1 (57)Noun3犬 冊0π川一'且τ ORTH``inu"

SYN-HEADI葱

創,S_

SEMINDEX国 吻6α

  s臨

_,_。

1岨 αST[EXT〈 》 皿1〈 田T2〈 〉]

80 照 S

1

0 W X 冊 S

(24)

計算 機 上 で動 作 す る 日本 語文 法 の構 築 63 (58)Postposition:で 、po∫㌍ 一」α ORTH SYN SEM ``de" HEAD PFORM46

M°D臨

DEx嗣

SUBJ回 〈〉 C・MP回SYN肥AD[GR8・ ・ SEMlINDEX囚o勿 θα INDEX国

  S「錨

ARG。国,

ARαST[EXT回 ・ INT1回,

mT2<>1

S冊X 

11

ARG1囚1

(59)Adjective:大 き い 04ノ ーlaκ ORコ 「1ヨ[``ooldi,,

sYNI田ADIM°Dl:叢

1-E撫

SEMINDEX国

  S膣

_,

ARG-ST [EXT〈 》 INT1〈 》

SFF  1

・NT2〈 〉]

参考文献

_。 国1

Copestake,A.(1997).AugmentedandaltemativeNLPtechniquesforaugmentativeandal-tematiVeCO㎜U㎡CatiOn.InP膨 伽83げ 伽 伽o沈 吻oηN伽1伽8混 α88 P即c6∬'η8プbrCoηz〃2侃 雇c厩 ∫oηA∫4∫.

Copestake,A.(2002).、 吻'6η τ8ηだη8乃 ρ66万 勿 ∫況形5「 ∫r部c伽肥G昭 η捌o君 ∫.CSLIPublications. Copestake,A.,Flickinger,D.,Sag,1.A.,&Pollard,C.(1999),MinimalRecursionSemantics:

(25)

GillzburgJ.&Sag,1.A.(2000)」 郁 εrm8α'`ソ ε 血vθ 漉8α"伽5.CSLIPubHcations .

郡 司 隆 男(2000).「 日本 語 の動 詞 の形 態 素 とそ れ に基 づ く タ グ付 け」.『 制 約 に基 づ く文 法 の 連 続 量 の 概 念 を 取 り入 れ た 拡 張 の 研 究 』,平 成9∼ll年 度 科 学 研 究 費 補 助 金 研 究 成 果 報 告 書.

Sag,1.A.&Wasow,T(1999).の 脚 σlc7物60り2'A1わ ηηα〃 加 κ[伽c∫ 加.CSLIPublicadons.

Wahlster,W.(1997).V¢rbMobil-Erkennung,Analyse,Transfbr,GenedenmgundSynthese vonSpontansprache.Tbch,rep.,VbrbMobilReport198.DeutschesForschungszentrum fUrK茸nstlicheIntenigenzGmbH,Saarbr邑cken,Gemlan}し

Author'sE-mailAddress:[email protected] Author,swebsite:http://sils.shoin.ac.jp/"chasi/

参照

関連したドキュメント

日本の生活習慣・伝統文化に触れ,日本語の理解を深める

一般社団法人日本自動車機械器具工業会 一般社団法人日本自動車機械工具協会 一般社団法人日本自動車工業会

単発持続型直列飛石型 ︒今 対缶不l視知覚

方法 理論的妥当性および先行研究の結果に基づいて,日常生活動作を構成する7動作領域より

単発持続型直列飛石型 ︒今 対缶不l視知覚

作品研究についてであるが、小林の死後の一時期、特に彼が文筆活動の主な拠点としていた雑誌『新

そればかりか,チューリング機械の能力を超える現実的な計算の仕組は,今日に至るま

事業セグメントごとの資本コスト(WACC)を算定するためには、BS を作成後、まず株