Machine Translation using Translation Grammar

全文

(1)九州大学学術情報リポジトリ Kyushu University Institutional Repository. Machine Translation using Translation Grammar 柴田, 雅博 九州大学大学院システム情報科学府知能システム学専攻 : 博士後期課程. 日高, 達 九州大学大学院システム情報科学研究院知能システム学部門. 冨浦, 洋一 九州大学大学院システム情報科学研究院知能システム学部門. https://doi.org/10.15017/1515819 出版情報:九州大学大学院システム情報科学紀要. 8 (1), pp.61-66, 2003-03-26. Faculty of Information Science and Electrical Engineering, Kyushu University バージョン: 権利関係:.

(2) 翻 訳 文 法 を用 い た機 械 翻 訳 柴 田 雅博*・ Machine. 日高. Translation. 達**・ 冨 浦 洋 一**. using. Translation. Grammar. Masahiro SHIBATA, Toru HITAKA and Yoichi TOMIURA (Received December 13, 2002) Abstract: The. This. grammar's. syntactic lation best. paper. tree. parsed. attached. trees Machine. the. rules. Machine. have. by this grammar. to a syntactic. syntactic. Keywords:. proposes. production. tree. the. Translation information. has the is used. using. information. not. only. newly. for translation. proposed. for translation. to derive. the. Translation. in addition too.. target. The. Grammar.. to grammar information. sentence,. but. also. rule,. so. for transto select. the. for translation. Translation,. Transfer-based,. Context. Free. Grammar,. Lexical. Cooccurrence. た は句. 1.. It. L. 6. I:. i~ 7 '^ ~ 77Translation). ● 訳 語 順:訳. '. yDOR (Transfer-based. 1) 4t1t. Oif ognix 'i. O4Jt~l. c yDRR. Machine. ~—'~Z. I),. ~F/.6:E< WEHtL -Cti``6.T~tA0). ~7^~77—Mt4::WJW~37~ , (1)APA51T-4,--11JC. 文 生 成 の 際 に,訳. 順序 ●additiORalfunctionphrase(AFP)=原 は 単 語 と し て 現 れ な い が,目. こ こ で,翻. t. 標 言語 で は単 語 また は. 訳 に お け る 主 な 問題 の 一 つ と して 単語 の訳. し 分 け が 挙 げ られ る.一. (3) NtA, A~1iAI7)>63. 言 語で. 句 と して 挿 入 す る 必 要 の あ る 機 能 語 の 句. AMU,U,I r:QhoW ®If~f~4M,((2))'JR~{Ii(AA t ,' IV)C/IJV\Z)Ap ")1f IJICIldFa[1q0 1ik4:VL,. して い く原 文 の 句 の. 般 に あ る 単 語 に 対 し て は,そ. 訳 語 の 候 補 が 複 数 存 在 し,そ し な け れ ば な ら な い,訳. の. の 申か ら妥 当 な訳 語 を選 択. し分 け を 行 な うた め に は,そ. の. 単 語 だ け で な く周 囲 の 情 報 ま で 考 慮 す る 必 要 が あ る.翻 訳 文 法 で は,特. に 語 彙 の 共 起 性 を 利 用 し て 訳 語 の 絞 り込. み を 行 な う, 翻 訳 文 法 を 用 い た 機 械 翻 訳 手 法 で は,翻 した 文 法 で 解 析 を 行 な うの で,解. A4=OPM.t. eRil /V 9, 144toVJI. aA I=1t A A Z7coD# I7)a L« fL1-6 C-"6t, NM-101/7 Lt,L,. 1[lho)01JM-#4. して,翻. 訳 情 報 を 利 用 し て,翻. 訳 情報 が付 随. 析 結 果 の 絞 り込 み に対. 訳 結 果 を 考 慮 に入 れ た絞. り込 み 基 準 を 設 定 す る こ と が で き る.こ. れ に よ り,例 外. 処 理 な どで シ ステ ム を繁 雑 に す る こ とな しに機械 翻 訳 シ ス テ ム を 構 築 す る こ とが 可 能 と な る.. Lffig< 7)-ot. 9,. ^~T~o~#t~a~I. a, Z 2.翻. 訳. 2.1翻. 文. 訳 文法 の枠 組. 翻 訳 文 法 は,文. 41,61. (. ). IR. ) ,. 脈 自 由 文 法(ContextFteeGrammar;. CFG)の. 生 成 規 則 に 翻 訳 情 報 を 付 与 した も の で あ る.た. だ し,語. 彙 の 共 起 性 を 利 用 した 単 語 の 訳 し分 け を 実. 現 す る た め に,語. • OE. . )Jcil=1.. -Wri 47 ft;1-6 FIM A0. a I. *知 **知. 受付. 能 シス テ ム学 専攻博 士 後 期課 程 能 シス テ ム学 部 門. 彙 共 起 綱 約 文 脈 自 由 文 法(Lexical. CooccurrenceConstraintsGrammar;LCCG)2)3)を. 基. に 構 成 さ れ る.LCCGは,統. の. 主 辞 とな る 単 語)とfuRctielt(係 語)と. 平成14年12月13繋. 法. 語 範 疇 をheadw◎rd(句. り の 種 類 を規 定 す る 機 能. で 細 分 化 した も の を 非 終 端 記 号 とす る 文 脈 自 由 文. 法 で あ る.LCCGは 語 彙 の 共 起 関 係(係. 非 終 端 記 号 を 細 分 化 す る こ と に よ り, る 句 のheadwordん. とfunctionfお.

(3) よ び 係 られ る 句 のheadw◎rdガ され る も の と す る)を 規 則 に は 句 のheadwordや w◎rd>と. の 三 つ 組(h,あ ゐ')で 表 わ. 生 成 規 則 上 に 表 現 で き,そ. の生成. 単 語 で あ るfunction(function. い っ た 語 彙 情 報 が 明 示 され て い る.翻. 訳文法で. (1…. ゴ. …mη1̀ η」 ¢9章 η犠). は こ の 生 成 規 則 に 付 与 され た 語 彙 に 対 し,直 接 訳 語 を 指 定 す る こ と で,語. 彙 共 起 パ ター ン と一 対一 に対 応 す る訳. し 分 け 規 則 を 表 現 す る.翻. 訳 文 法 は 次 の よ うに 定 義 さ. 英 語 で は 動詞 は 目的語 の前 にあ るが,旨 本 語 で は 動詞 は 文 末 にあ る とい うよ うに,一 般 に原 言 語 と 目標 言 語 とで は文 の 構 造 が 異 な り,翻 訳 の際 に は訳 す 順 序 を換 え る 必. れ る. 定 義1'翻. 要 が あ る.訳 文 生成 の際 に は,右 辺 の各 句 か らそ れ ぞ れ. 訳 文法. 生 成 され た 訳 文 の 句(訳 句)を 訳 語 順 に した が って 並 び. Gt=(Σ,N,pt,S) た だ し,. 換 える こ とで,貝 標 言語 の 文 と して妥 当 な順番 に直す.. Σ'(原. 言 語)終. 端 記 号 の集 合. N:(原. 言 語)非. 終端 記 号の集 合. cゴ(」=1,…,m)はAFPで. あ る.AFPは. 原書語 の文法. で は単 語 と して 現 れ な い機 能 語 の うち,目 標 言 語 の 文 法. Pε:翻. 訳 文 法規 則 の集 合. で は単 語 と して 陽 に表 わ す 必要 の あ る機 能 語 の句 で あ る.. S'開. 始 記 号(S∈!V). 例 え ば.英 語 で は 名 詞 句 の格 は,動 詞 の 前 な ら主格,他 動 詞 の 直後 な ら 目的 格 とい うよ うに位 置 に よって 与 え ら. こ こ で,グ 則 はLCCGの. は 翻 訳 文 法 規 則 の 集 合 で あ り,翻 訳 文 法 規 生 成 規 則 で あ る 構 文 情 報p∈Pと,こ. の構. 文 情 報 で 解 析 さ れ る 句 を 翻 訳 す る 際 の 翻 訳 情 報 ξか ら成 る.実. 際 の 翻 訳 文 法 規 則 は 次 の よ うに 表 現 され る.. 定 義2'翻. れ るが,日 本 語 で は 「が」や 「を」 とい った助 詞 に よって 格 が 与 え られ る.英 語 か ら 段本 語 に翻 訳 す る場 合 に は, 訳語 とは別 に,句 と句 の 間 に この よ うなAFPを. 訳 文 法規 則. 以 上 の よ う に,y→. η1ηiηm. 辺 の 各 句Xe"に. y→xf…xプ. … 礪(、). ら れ,ξ. Clc信Cm. ぜ. 以 下 の い ず れ か の 形 式 で あ る.. た,右. 統 語 範 疇 がXの. 辺 中 で他 の どの. 定 の 単語 が指 定 され て い る. よ びfuRctieAwer{lfに. の 訳 語 ゲ,野 を 与 え る,翻. の 訳 語 がf入. 雛)(2). 語が. る 」,句 評P(bath)のheadw◎rd̀̀b編. 「 風 呂 」 で あ る こ と を 表 わ す.ま. 語 順 は2,NP(bGth)の. 翻 訳 文 法 規 則 に は そ れ ぞ れ 次 の よ うな 翻 訳 情 報 が 与 え. headwordh,お. ユ. こ の 翻 訳 文 法 規 則 で は 句VT(take)のheadword"take". は*を 与 え る †1.. 辺 の 句 の う ち,特. Ψ. あ る句 を 導 出 す. 統 語 範 疇 がXでheadwordがh,. 辺 の 句 の う ち でheadphrase(右. られ る.右. して 与 え ら. 句 を 導 出 す る 非 終 端 記 号,. ノで あ る 句 を 導 出 す る 非 終 端 記 号 を 表 わ す.ま. 句 に も 係 っ て い な い 句)に. 襯,ん親,fS,,c.)と. 次 の 翻 訳 文 法 規 則 を 考 え る,. ∫諺 んε. 統 語 範 疇 がXでheadw◎rdがhで. fukctienが. 右 与 え. は 句 の 翻 訳 情 報 を 左 か ら 順 に 並 べ た. VP→ ワ 囎 る 非 終 端 記 号,X(f,h)は. ∈Pの. 例 ユ. んε. X(h)は. ㌔ ・・礪. れ る.. XorX(h)orX(ノ,h). こ こ で,Xは. … 雌. は 翻 訳 情 報(η 」,hl,ガ,cゴ)が. 列 ξ=(ηi,h至,ff,c1)…(η た だ し,X#は. 挿 入 しな. けれ ば な らな い.. 対 して,そ. れぞれ. 訳 文 法規 則 は 一つ の 語彙 共 起 パ. タ ー ン を 表 わ し て お り,生 成 規 則 上 の 単 語 情 報 に 直 接 訳. バ の訳. た,VT(take)の. 訳 語 順 は1で あ る.こ. 訳. こ で,句X. に 対 す る 訳 句 を[X】tと 表 わ す と す る と,(2)を. 適 用. した 場 合 の 訳 文 は 右 辺 の 各 句 の 訳 句 を 訳 語 順 に 従 っ て 〔NP(bath)]t,[yT(take)}tの. 順 に 並 び 換 え,そ. !VP(bαth)に. に 」 を挿 入 し た も の,す. 与 え られ たAFP「. わ ち̀̀[NP(bGth)]tに[VT(tGke)】t"と. の間 に な. な る.. 語 を与 え る こ とで語 彙 共 起 パ ター ン に応 じた単 語 の訳 し 分 け規 則 を 表 現 す る. ま た,右 れ る.右. 2.2翻. 辺 の 各 句 に は 訳 語 順 笏(ゴ=三,…,窺)が 辺 の 句 を 左 か ら 順 に 自 然 数1,…,mに. 与えら 対 応 させ. る とη∫は 次 の よ うな あ る 置 換 と し て 定 義 さ れ る 。. 訳 文法規 則 の分類. 翻 訳 文 法 で は,語 を 用 意 し,そ. 彙 共 起 パ ター ン ご とに翻 訳 文 法 規 則. れ ぞ れ の 語 彙 共 起 パ タ ー ン に 対 し て 訳 し分. け を 行 な う。 し か し,発. 生 し得 る 全 て の 語 彙 共 起 パ タ ー. ン を 網 羅 的 に 収 集 す る こ と は 現 実 的 に は 困 難 で あ る た め, 語 彙 共 起 パ タ ー ン の 一 般 化 を 考 え る 。 こ の よ うに,与 †1headphra8eはfunctiofiを の い ず れ か で あ る.. 持 た ず,Xtも. し く はX(hi)*. ら れ る 情 報 の 詳 細 さ に よ っ て,翻. え. 訳 文 法規 則 を次 の三 つ.

(4) に分 類す る. ● 汎 用規 則 右 辺 の全 ての句 につ いて そ のheadw◎rd,functiORが 特 定 され てお らず,統 語 構 造 の み を 表 わ す 翻 訳 文 法 規則.汎 用規 則 には 翻 訳 情 報 と して 訳 語順 とAFPが 与 え られ るが,訳 語 情報 は与 え られ ない. 。 語 彙規 則 生成 規 則 右 辺 が単 語(終 端 記 号)で あ る翻 訳 文 法 規 則.語 彙 規 則 には 翻 訳 情 報 と して,右 辺 の 単 語 に 対 Fig.1. す る訳語 が 与 え られ る.. Machine. Translation. system. using. Translation. Grammar.. ● パ ター ン規 則 右 辺 の 一 つ以 上 の句 につ い て,そ のheadwordあ. る. い は魚 駕 伽 豆が特 定 され て い る翻 訳 文法 規則.パ ター. 上 記 翻 訳 文 法 規 則 の うち で,(3),(4),(6)は. ン規 則 に は翻 訳 情 報 と して,単 語 情 報 が 与 え られ て. る.(7)〜(10)は. い る句 のheadword(functionword)に. 則 で あ る.. と,訳 語 順 お よびAFPが. 対 す る訳 語. 語 彙 規 則 で あ る.ま. 汎用規則 であ. た(5)は パ タ ー ン 規. 与 え られ る,. あ る単語 に対 す る訳 語 を,デ フ ォル トの訳 語 とそ れ 以 外 の 訳語 とに分 け る.デ フ ォル トの訳 語 は,そ の 単 語 に. 3.翻. 訳 文法 を用 いた機 械翻 訳 手法. 翻 訳 文 法 で は トラ ン ス フ ァ ー 型 翻 訳 方 式 を 採 用 す る.. 対 す る 最 も一 般 的 な訳 語 で あ り,普 通 は対 訳 単 語 辞 書 の. 従 来 の トラ ン ス フ ァ ー 型 翻 訳 方 式 は(1)原 文 解 析,(2)変. 第 一 語 義 の 訳語 に 当 た る.周 囲 の 状 況 が 分 か らず,そ の. 換,(3)訳. 単 語 単独 だ け を見 て 訳 語 を 選 択 す る場 合 に はデ フォル ト. 用 い ら れ る 生 成 規 則 と変 換 に 用 い る 変 換 規 則 と を 独 立 に. の 訳 語 を選 択 す る方 が 他 の訳 語 を選 択 す る よ り も誤 りが. 用 意 して い た.そ. 少 な い と考 え られ,ま た,デ フ ォル ト以 外 の訳 語 を選 択. 成 規 則 が 保 持 し て お り,解 析 結 果 の 絞 り込 み に 対 し て 翻. す べ き 場 合 に は,妥. 訳 情 報 を 利 用 す る こ と が で き る.ま. 当 な訳 語 を特 定 す る何 ら か の 情 報. 文 生 成 と い う三 っ の 過 程 か ら構 成 さ れ,解. 析に. れ に 対 し,翻 訳 文 法 で は 翻 訳 情 報 を 生. 文 木)に. た,解. 析 結 果 得 られ. (語 彙 共 起パ ター ン)が 存 在 す る と考 え られ る.そ こで,. た 構 文 構 造(構. は 文 法 に 与 え られ た 翻 訳 情 報 が. 語 彙 共 起 パ ター ン の うちデ フォル トの 訳 語 だ け で訳 せ る. 付 随 し て お り,構 文 木 に 与 え られ た 翻 訳 情 報 を 用 い て,. もの に つ い て は一 般 化 して 汎 用規 則 と し,訳 し分 け を必. 解 析 後 直 ち に 訳 文 を 生 成 す る.す. 要 とす る もの の み パ ター ン 規 則 と して 用 意 す る.ま た,. い た機 械 翻 訳 手 法 は(1)原. デ フォル トの 訳 語 は 語 彙 規 則 上 に与 え る.こ れ に よ り,. 程 で構 成 され る †2(Fig.1),. な わ ち,翻. 文 解 析,(2)訳. 訳 文 法 を用. 文 生 成 の二 過. 通 常 は 語彙 規 則 と汎 用 規 則 だ け で翻 訳 を行 な う こ と溺 で き,ま た訳 し分 け を必 要 とす る場 合 に はパ ター ン規則 を. 3.1原. 追 加す る ことで対 処 す る こ とが 可能 とな る.. 原 文 解 析 で は,原. 文解 析. 構 文 解 析 は,翻. 例2 次 の翻 訳 文法 を考 え る. ユ S→NPyp*(3). ゑ. は 21. ε. VP→y『. 訳 文 法 の 生 成 規 則 部 分 だ け を 使 用 して 実. 行 す る こ とが で き,翻. 訳 文 法 規 則 に 与 え られ た 翻 訳 情 報. の 影 響 は 受 け な い.従. っ て,既. を そ の ま ま 適 用 す れ ば,解 Fig.2は,例2の. ㌢(4). い う制 約 が あ り,ボ. ユ. NP→DETN*(6). 既. こ で,生. headphraseのheadwordが. ワ(オ α舵 入 る)*¥.P(雛)(5). こ の 制 約 に 従 っ て,構. ど ど. 萩(7). 文 解 析 手 法4)5). 成 規 則 の 両 辺 に は,右 左 辺 のheadwordで. 辺の あると. トム ア ッ プ に 解 析 を 行 な う こ と で, 文 木 の 各 句(構. 文 木 の 各 ノ ー ドを. 根 とす る部 分 木 が 表 わ す 句)のheadwordお. よ びfunction. を 全 て 特 定 す る こ と が で き る 。 ま た,構. 文木 の各 ノー ド. に は,翻. γT→ 驚(8). 存 のCFG構. 析 は 実 現 で き る.. 翻 訳 文 法 を 用 い て 解 析 した 結 果 の 構 文. 木 の 一 例 で あ る.こ. VP→. 文 を 構 文 解 析 し て 構 文 木 を 求 め る.. 訳 文 法 規 則 に よ っ て 訳 語,訳. 語 順,AFPと. いっ. た 翻 訳 情 報 が 与 え られ る こ と と な る. DET→. α(9) ど. N→. 雛. α・ 〉. †2実 装 に対 して は,後 処理 と してfi本 語 の活用 処 理 を行 な った 後 に最 終 的な 訳文 を出力 す る..

(5) た だ. し ・X許. ・,…,X. ,r・(h)',…X義. ・は そ れ ぞ. れ 構 文 木 π に お け る 根 ノ ー ドY(h)の F",X,r・(h)*はh・. ・d伽. 子 ノ ー. ・e・ま た 各 π・は 聴. と す る 部 分 木 で あ る.ま. た,y(h)を. 根. 作 る と. き に 適 用 し た 翻 訳 文 法 規 則 が 定 義2の(1) '. [y(ω),π,司. ●. 亡'=[y(ω),π,司. εc. C. Fig.2. An example of the syntactic tree parsed by Translation Grammar (using rule (5) at the node (c)).. 3.2訳. ・. 文 生 成. 訳 文 生 成 で は,原. 文 解 析 で 得 られ た 構 文 木 に 与 え ら れ. た 翻 訳 情 報 を 用 い て 訳 文 を 生 成 す る. こ こ で,構 とAFPは. 文 木 に 与 え ら れ た 翻 訳 情 報 の う ち,訳. 句 単 位 の 情 報 な の で 問 題 な い が,訳. な く原 文 中 の 単 語 に 対 す る 情 報 な の で,次 が あ る.訳. の よ うな 問 題. 語 は 構 文 木 の 各 ノ ー ドに 対 して,(翻. 則 に 訳 語 が 与 え られ て い れ ば)そ の た め,同. じ単 語 に 対 して,そ. ら れ る 可 能 性 が あ る.例. 語順. 語は句では. 訳 文 法規. れ ぞ れ 与 え ら れ る.そ の訳 語 が 複 数 箇 所 で 与 え. え ば,Fig.2の. ノ ー ド(d)と ノ ー. ド(i)にお い て,そ. のheadwordは. あ る が,CCtake"に. 対 す る 訳 語 は ノ ー ド(d)で は 「入 る 」,. ノ ー ド(e)で は. よ りは,広. り妥 当 な 訳 語 を選 択 す る こ と が で き る とい う仮 定 を 置 き,. て い る も の,つ. う に 実 行 さ れ る.た. だ し 式 中 で,π. [S(take),π. 構 文 木 中の. 。,・]t. ‑[NP(1),π. 、,・]t'[VP(¢. ・k・),π 。,・]t'. ε. ニ[NP(1),πb,*]亡. は[VP(如. 舵),πc,*]t. ‑[1,・,・]t'は[VP(t・k・),π. 。,・]t. 私 二 私. は[VP(take),π. 。,*]t. =私. は[NP(bath),π. 。,*]t'[VT(take),πd,*]t'. も大 き な句 をカ バ ー し. ま り は で き る だ け 上 位 ノ ー ド(根 か ら の. 、 。はFig.2の. ノ ー ド(勾 を 根 と す る 部 分 木 を 表 わ す も の と す る.. い 範 囲 の 文脈 を 見 て訳 語 を決 定 す る. 等 し い 句 の う ち,最. 翻 訳 情 報 付 き 構 文 木 に 対 して 訳 文 生 成 は 次 の よ. は. い 範 囲 の 文 脈 を 見 て 訳 語 を 決 定 し た 方 が,よ. headwordが. Fig.2の. 共 に 同 じ単 語"take"で. 「取 る 」 と 異 な る も の が 与 え ら れ て い る.. こ の 問 題 に 対 し,狭. 例3. に =私. 風 呂. ε. は[NP(bαth),7r。,風. 入 る. 呂]tに. 深 さ が 最 も 浅 い ノー ド)で 与 え ら れ た 訳 語 を選 択 す る. [VT(take),πd,入. 以 上 を 踏 ま え て,訳. た だ し簡 単 の た め に,functionを wordだ. る]t. 文 生 成 は 以 下 の よ うに 実 行 さ れ る. 含 む 句 を 考 え ず,head. け を 持 つ 句 に つ い て の み 考 え る こ と とす る.上. 二 私. は[N(bath),πg,風. 呂]t'に. ど. 位. [VT(tαke),πd7入. 優 先 で の 訳 語 選 択 を 実 現 す る の で,あ に 対 し て,上 と,ま. 位 ノ ー ドで 既 に 訳 語 が 与 え ら れ て い る 場 合. 文 木 を π(ノ. ー ドy(h)を. ー ドが 葉 の と き は π=ε)と. し,更. に上位. 対 す る 訳 語 をu(上. で ま だ 訳 語 が 与 え ら れ て い な い と き はu=*)と. [xη 一 ・(h 第)*,㌃. [VT(take),rd)入 二 私. る]t. π.・,・]t'…. η1η1". ・,U]t…[X義. は[bath,ε,風. 呂]tSに[VT(tαke),πd,入. 風 呂 =私. は 風 呂 に[VT(take),πd,入. 二 私. は 風 呂 に[如. ̲私. 文[y(h),π,u]t. [y(h),π,司 亡=[X㌔. 呂]tに. る]t. す る と. に 定 義 さ れ る.. ●. 位. 文 木 πか ら 生 成 され る 訳 文[y(ん),π,u]tは 次 の よ う. 定 義3'訳. は[N(bath),πg,風. 根 とす る翻 訳 情 報付 き構. ノ ー ドで 決 定 され たheadwordhに. き,構. ;私. だ 訳 語 が 与 え られ て い な い 場 合 と に 分 け て 考 え な. け れ ば な ら な い.ノ. る]t. る 句 のheadword. ・,π,FL・,・]t. は 風 呂 に. 舵,ε,入. 取 る 入 る. る]ε'. る]t.

(6) た 方 が 妥 当 だ と考 え る こ とが で き る.ま た,パ タ ー ン規 則 の 中で も右 辺 の長 い規 則 は,よ. り広 範 囲 の 文 脈 を 詳 細. に表 現 して お り,こ の よ うな翻 訳 文 法 規 則 で 与 え られ た 訳 語 の方 が よ り妥 当で あ る と仮 定す る. そ こで,原 文sを 解 析 して得 られ た翻 訳情 報 付 き構 文 木 7rに対す る評 価値G(π)を 次の よ うに定義 す る. 定 義4'翻. 訳情 報 付 き構 文木 πに対 す る評価 値 れ. G(π)一. Σ9(ωi,π) i=1. 9(ωi,π)='(P(ωi,π)). Fig.3. An example of the syntactic tree parsed by Translation Grammar (using rule (4) at the node (c')).. た だ し, s=ω1…. ωn'原. 文(Wi=Σ). p(ω,π)'構 4.解. 一般 に構 文 解 析 の 結 果 得 ら れ る た め,解 ば,例2の. を 決 定 した 翻 訳 文 法 規 則. ,複 数 の 構 文 構 造(構. 翻 訳 文 法 を 用 い て"Itakeabath."と. を 解 析 す る と,Fig.2の. 他 にFig.3の は,ノ. 1(p)'翻. 文 木)が. 析 結 果 の 絞 り込 み が 重 要 と な る.例. 構 文 木 も 得 ら れ る.Fig.2で. え. い う原 文. 訳 文 法 規 則pの 右 辺 長. 原 文8を 構 文 解 析 した 結 果,得. られ る構 文 木 の 全 体 集 合. をn。 とす る と,. よ うな 翻 訳 情 報 付 き ー ド(c)か ら(5)の パ. タ ー ン規 則 が 適 用 され て い る の に 対 し,Fig.3で. は,ノ. 7rrnαx=argmaxσ(π) π ∈n3. ー. ド(c')か ら(4)の 汎 用 規 則 が 適 用 され て お り,こ の 構 文 木 か ら は 「私 は 風 呂 を 取 る 」 と い う不 自 然 な 訳 文 が 生 成 さ. な るπmaxを 訳 語 選 択 に 関 し て 最 も 妥 当 な 訳 文 が 生 成 さ れ る 構 文 木 で あ る と し,π 翫。。を 選 択 す る. 例4. れ る. 翻 訳 文 法 で は 翻 訳 情 報 付 き 構 文 木 に よ っ て 生 成 され る 訳 文 が 決 定 さ れ る た め,構. 文 木 の選 択 が そ の ま ま訳 文 の. 選 択 に 直 結 す る こ と と な る.絞. り込 み を 行 な うた め に は,. 解 析 結 果 に 対 して 何 ら か の 評 価 基 準 を 設 け る 必 要 が あ る が,翻. 文 木 πで 単 語 ω の 訳 語. 析 結 果 の 絞 り込 み 評 価 基 準. 訳 で は,原. 文 の 意 味 を 保 存 した 訳 文 を得 る こ と が. 目的 で あ る か ら,最. Fig.2とFig.3の れ 定 義4の Fig.3の. 十9(̀̀α,,,π1)十9(̀̀batん,,,π1). 来 手 法 と異 な り,. り込 み に 対 し て,こ. の 翻訳. =1十2十1十2 =6(11) G(π2)=9("1",π2)+9("take",π2). 情 報 を 利 用 す る こ とが で き る. こ こ で,妥. 当 な 訳 文 に つ い て だ が,訳. を 保 存 して い る た め に は,少. れ ぞれ の構 文木 に対す る. σ(π1)=9(̀̀1,,,π1)十9(̀̀take,,,π1). 翻 訳 文 法 を 用 い て 解 析 した 結 果 得 られ る 構 文 木 に は 翻 訳 情 報 が 付 随 し て い る た め,絞. 構 文 木 をπ2と す る と,そ. れぞ. 構 文 木 を π1,. 評 価 値G(π1),G(π2)は. 終 的 に 生 成 され る 訳 文 が 妥 当 と な る. よ うに 評 価 基 準 を 定 め る べ き で あ る.従. 翻 訳 情 報 付 き 構 文 木 に つ い て,そ. 評 価 値 を 計 算 す る.Fig.2の. +9("α",π2)+9("bath",π2) 文 が原 文 の 意 味. =1十1十1十1. な く と も原 文 の 各 単 語 に 対. =4(12). し て 適 切 な 訳 語 が 与 え られ て い る 必 要 が あ る と考 え ら れ る.そ. こ で,本. 稿 で は 訳 文 の 妥 当性 を 原 文 中 の 各 単 語 に. 対 す る 訳 語 選 択 の 妥 当 性 と置 き 換 え て 評 価 し,で け 妥 当 な 訳 語 が 選 ば れ て い る 訳 文 を,ま 文 を 生 成 す る 構 文 木 を 選 択 す る.ま 性 は,次. た,訳. き るだ. た そ の よ うな訳 語 選 択 の妥 当. 方 を選 択 す る こ とが で き る. 上 記 の よ うに,翻. 訳 文 法 を用 い た機 械 翻 訳 で は原 文 解. 析 結 果 の 絞 り込 み に 対 し,訳. の よ う に 考 え る.. 人 間 が 翻 訳 を 行 な う場 合 に は,原. と な り,パ タ ー ン 規 則 を 適 用 し た π1の 方 が 評 価 値 が 高 く な り,「私 は 風 呂 に 入 る 」 と い う訳 文 を 生 成 す る 構 文 木 の. 文 中に 熟語 や 成 句 表. 現 と い っ た 語 彙 共 起 パ タ ー ン が 見 つ か っ た ら,ま. ず その. パ タ ー ン に 照 ら し合 わ せ て 翻 訳 を 試 み る も の と 思 わ れ る.. う観 点 か ら,明. 語選 択 に対 す る妥 当性 と言. 確 で 統 一 的 な 評 価 基 準 を 設 け る こ とが で. き る. 5.お. わ. り. に. 翻訳 文法 で は この 語 彙 共 起 パ タ ー ン はパ ター ン規則 と し て 用 意 さ れ て お り,パ. ター ン規 則 を使 って訳 語 を選 択 し. 本 稿 で は,翻. 訳 文 法 お よ び翻 訳 文 法 を用 い た機 械 翻 訳. 手 法 を 提 案 した.翻. 訳 文 法 は,生. 成 規則 が翻 訳 情 報 が付.

(7) 随 して お り,こ の 文 法 を用 い て 原 文 解 析 を 行 な うの で,. し て い る.. 解 析 結 果 の絞 り込み に対 して,訳 語 選 択 の 観 点 か ら翻 訳 参. 結 果 を考 慮 した評 価 基 準 を定 め る こ とが で き る.こ れ に よ り,変 換過 程 に お け る シ ステ ムの 繁 雑 さ を解 消 す る こ. 1)長. 尾 真 編:自. 考. 文. 然 言 語 処 理,岩. 献. 波 講 座 ソ フ ト ウ ェ ア 科 学15,. 岩 波 書 店,1996.. とがで き,見 通 しの よい機 械 翻訳 シ ステ ム の構 築 が 可 能. 2)田. とな る. この翻 訳 文 法 を用 いて 簡 単 な予 備 実 験 を行 な った が6), 十 分 なパ ター ン規 則 を用 意 で き なか っ た こ とも あ り,十 分 な絞 り込 み が行 な えな か っ た.こ れ は,単 語 辞 書 で あ る語 彙 規 則 を除 く と,語 彙 レベ ル で のマ ッチ ン グ を要 求 す る非 常 に詳 細 な パ ター ン 規則 と,逆 に 非 常 に荒 い汎 用 規 則 しか な く,ま た翻 訳 文 法 の 評価 基 準 は汎 用 規 則 に対 して 全 く効 か な い こ とが 原 因 で あ る.こ れ に 対処 す る た. 辺 利 文,冨 浦 洋 一,日 日 本 語 へ の 適 用,情. 高 達:係. り受 け 文 脈 自 由 文 法 と そ の. 報 処 理 学 会 論 文 誌,Vol.41No.01,. pp.1234‑1243,2000. 3)田. 辺 利 文:語. 彙 共 起 制 約 文 脈 自 由 文 法,九. 州大 学 大学 院 学位. 論 文,2000.. 4) Earley, J.: An Efficient Context-Free Parsing Algorithm, CACM, Vol.13, No.2, pp.94-102, 1970. 5) Kay, M.: Algorithm Schemata and Data Structure in Syntactic Processing, Technichal Report CSL-80-12, XEROX PARC, 1980. 6)柴. 田 雅 博,冨. め に,意 味 カ テ ゴ リー を利 用 し,汎 用 規 則 とパ タ ー ン規. の 実 装,九. 則 の中 間 に 当 た るカ テ ゴ リー 規則 を導 入 す る こ とを検 討. 2002.. 浦 洋 一,日. 高 達:翻. 訳 文 法 に よ る機械 翻 訳 とそ. 州 大 学 情 報 基 盤 セ ン タ ー 年 報 第2号,pp.71‑79,.

(8)

Updating...

参照

Updating...

関連した話題 :

Scan and read on 1LIB APP