中日機械翻訳に適応した書法ルール習得テキストの開発
65
0
0
全文
(2) 目次. 第1章 中日機械翻訳の利用と問題点. 一 一 一 一 一 一 一1. 1.1情報化の進展. 一 一 一 一 一 一 一1. 1.2多言語間コミュニケーションの手段の比較. 一 一 一 一 一 一 一1. 1.3機械翻訳の現状と問題点. 一 一 一 一 一 一 一2. R. 1.3.1誤訳の発生原因と対策. 一一一一一一一. 1.3.2原文の改善に関する先行研究. 一一一一一一@一9. 1.3.3先行研究から見る課題. 一一一一一一 @一9. 1.4研究の目的と方法. 一一一一一一一. 1.4.1研究目的. 一一一. 1.4.2研究方法. 一一一一一一一. 第2章 書き換えルール習得のためのテキストの作成. 一一一一一一一. P0. @一 一 一 一10. P0. P2. 2.1書き換えルールの整理. 一 一 一 一一 一 一12. 2. 2課題文の狙いと作成. 一一 @一一 一 一 一20. 2.3テキストの作成. 一 一 一 一 一 一 一26. 第3章 テキストの効果検証実験. 一 一 一一 一 一 一28. 3.1実験の手順. 一 一一 一一 一 一28. 3.2実験の結果. 一 一 一 一 一 一 一28. 3.2.1ルールの習得容易度評価. 一 一 一 一 一 一 一31. 3.2.2翻訳文の忠実度評価. 一 一 一 一 一 一 一31.
(3) 第4章 実験の考察. 一 一 一 一 一 一 一37. 4.1ルールの習得容易度についての考察. 一 一 一 一 一 一 一37. 4.2翻訳文の忠実度についての考察. 一 一 一 一 一 一 一37. 4.3文の一致性に関する考察. 一 一 一 一 一 一 一38. 4.4書き換えルールの考察と改善. 一 一 一 一 一 一 一39. 4,5折返し翻訳についての考察. 一 一 一 一 一 一 一39. 第5章 むすび. 一 41. 参考文献. 一43. 参考URL. 謝辞. 資料. 1:山下らが整理した「良い翻訳結果を得るためのルール集合」 2:テキスト. 3:被験者Aの解答 4:被験者Bの解答. 一一. @44. 一45.
(4) 第1章中日機械翻訳利用の問題点 1.1情報化の進展. 現代社会では、インターネットの普及により、さまざまな情報化が進んでい る。パソコンがあれば、誰でも簡単にインターネット上の情報を手に入れるこ とが可能になった。. 母国ではなく、他のいろいろの国の情報を知りたい場合、母語以外の多くの 言語を習得することができればよいが、それは容易ではないため、別の方法を 考えなければならない。そのため、機械翻訳を使うという方法が一つ良い方法 として出てくる。つまり、他言語で書かれた文書を、機械翻訳を利用して母語 の文章に翻訳して情報を受けることである。. 機械翻訳を用いるインターネット上の情報の受発信だけでなく、多言語間の コミュニケーションへ、機械翻訳の利用の多様化が進行しつつある。. 1.2多言語間コミュニケーションの手段の比較 多言語間コミュニケーションの手段として、以下の方法が考えられる。 ①相手の言語を習得する。 ②誰かに通訳してもらう。. ③共通言語(英語)でコミュニケーションをする。 ④機械翻訳を利用する。 まず①の方法では、相手の言語を習得できたら、うまく相手とコミュニケー ションすることが出来て良いが、この方法を使えるのは相手の言語を習得した 者だけに限られている。相手の言語を習得していない人がその言語を習得する には多くの時間が必要である。別の言語のコミュニケーションをする場合、そ れに対応する言語をまた習得する必要がある。. 次に②の方法では、誰かに通訳してもらうと他言語コミュニケーションが可 能である。しかし、通訳者の時間、言語の習得水準、などにかかわっている。 そして、通訳者にお金を払わなければならない。. そして③の方法ではコミュニケーションをする人は英語を習得した人だけ に限られる。確かに、英語が出来る人は多くなっているが、出来ない人も多く いる。. 最後④の方法では、それぞれの言語に対応することができれば、母語しかで きない人でも多言語コミュニケーションが可能となる。インターネットでは無. 料で使えるYahoo翻訳、 Excite翻訳などの翻訳サイトが増えてきて、機械翻 訳を利用することができる。しかし、機械翻訳では、翻訳精度に限界があると いうような欠点もある。誤訳の問題は機械翻訳にとって大きな問題となってい る。使用者は他言語が分からないから、母語を他言語に翻訳すると他言語の誤 訳が意識できないことがある。それは、コミュニケーションの障害のひとつと 1.
(5) なっている。本研究では、多言語コミュニケーションの中から、母語が中国語、. 他言語が日本語の一対一のコミュニケーションの方法として、機械翻訳の利用 を考える。. 1.3機械翻訳の現状と問題点. まず、機械翻訳という言葉の意味、翻訳文の精度評価、機械翻訳の方式から 見る。. 機械翻訳の基本認識 「機械翻訳」という言葉は、英語に訳すとmachine translationである。 「自動翻訳」ともいう。実際、機械翻訳とはコンピュータを使って自動的に翻 訳を行わせるということである。. 機械翻訳の精度に関する問題 「翻訳」とは発話文のもっている意味、感情、芸術性などのすべてが翻訳言 語の世界に完全に移されるような表現を作り出すことである。いわば一つの文 化から他の文化へ物事:の考え方の変換・伝達である。文学作品の優れた翻訳は このような立場のものであろう。いずれにしても理想的な翻訳を行うためには 言語の理解が行わなければならないとするものである。現在のコンピュータに よる翻訳はこのようなレベルに達しているとはいえない。」と長尾は『機械翻 訳はどこまで可能か』で述べている(長尾 1986)。 機械翻訳の翻訳方式. 現在の機械翻訳システムは以下の二つの翻訳方式のいずれかを採用してい る。. 規則に基づく翻訳方式. この方式では翻訳を、解析・変換・生成の三つのフェーズに大きく分 け、まず、原文の形態、句法、語意の解析を行う。語意のレベルから原 言語の語意構造を目的言語の語意構造に変換し、そして、目的言語の言 語特徴に基づいて語意、句法、形態を生成し、目的言語を得る。これは 規則に基づく翻訳方式である。「Yahoo翻訳1、「Excite翻訳」などはこの 翻訳方式の典型である。. 統計に基づく翻訳方式. この翻訳方式は規則に基づく翻訳方式と違って、新しい機械翻訳方式 である。この翻訳方式では、大量の実例をデータベースに格納しておけ ば、翻訳精度が期待される。現在多く使われている「Google翻訳」の翻 訳方式は統計に基づく翻訳方式である。. 2.
(6) 利用者にとっては、無料で使える翻訳サイトのほうがいいだろう。機械翻訳 をするとき、有料な翻訳ソフトをつかうという方法と、ネットでウェブページ. にある無料な「web翻訳」をつかうという方法とがある。前文にある「Yahoo 翻訳」、「Excite翻訳」、「Google翻訳」は全て「web翻訳」である。この中、「Excite. 翻訳」は中日翻訳と日中翻訳に翻訳精度のいい「web翻訳」と筆者が認めてい る。翻訳サイトが違うと同じ文を機械翻訳しても、違う翻訳結果が出てくる可 能性が多いから、中日、日中の翻訳結果が相対的によい翻訳サイトに限定して 翻訳する。これによって、本研究では「excite翻訳」を中日機械翻訳に使う. 翻訳サイトとして用いる。そして、本論文の全ての機械翻訳作業も「excite 翻訳」を使うことにする。. L3.1誤訳の発生原因と対策 言語間のずれ もし二つの言語が、語順は全く同じで、単語の語彙も一対一に対応すれば、 機械翻訳はかなり簡単なこととなる。しかしながら、言語間の「ずれ」は、 機械翻訳の誤訳が起こる原因の一つである。 佐藤は『アナロジーによる機械翻訳』で、言語間形式的対応のずれについて 「語彙の対応のずれ」、「文法レベルと語彙レベルの対応(レベルのずれ)」、「単. 語と句の対応(層のずれ)」、「語順の違い(構造のずれ)」、「異なる品詞間の対. 応(範疇のずれ)」、「明示的に表現する情報のずれ」の6つのずれを挙げてい る(佐藤 1997)。この本では、日本語と英語を例として、二つの言語間のず れが説明された。ここでは、二つのずれを中国語も加えて、ずれを比較して簡 単に説明する。. 「語彙の対応のずれ」というのは「二つの言語間において、単語が一対一対 応していない」ということである。例えば、日本語には「服を着る」、「めがね をかける」、「帽子をかぶる」など、「身につける」ことを表す動詞が多数ある。 英語には、put on the「coat, eye shadow, hat」といった、「身につける」こ. とを「put on」という一つの言葉だけで表せる。中国語では、この三つの動作 を表すとき、「穿衣服(服を着る),戴眼鏡(めがねをかける),戴帽子(帽子 をかぶる)」という。ここからみると、中国語の「戴」と日本語の「かける」、 「かぶる」が対応している、そして一対一の対応ではない。言い換えると、共 通点があれば、違う点もあるということである。. 「語順のずれ1というのは「文における構造のずれのこと」である。たとえ ば、次の3つの文はほぼ同じ意味である。 He wears a black suit.(主語+述語+目的語:英語). 彼は黒いスーツを着ている。(主語+目的語+述語:日本語) 他穿下黒色的西服。 (主語+述語+目的語:中国語) 3.
(7) このように、日本語と中国語の間、日本語と英語の間に、語順のずれが見出 される。. そして、中国語では中国語として特別の特性がある。この特性について、成 田は『パソコン翻訳の世界』で、「中国語は一つの語が名詞、形容詞、副詞、 動詞、いずれの機能にも使われるため、文法関係の認定には意味・文脈情報が 必要で、機械による解析が難しい面があることも否定できません。」と述べて いる(成田 一、1997)。. ここでは、“姑”という中国語の使用例をあげて説明する。 a我姑遠里。(私はここに立つ。). b遠里是上海帖。(ここは上海駅である。). 例aでは、明文の“軸”は「立つ」の意味で、動詞である。 例bでは、中文の“立占”は「駅」の意味で、名詞である。 中国語では、「一つの語が名詞、形容詞、副詞、動詞、いずれの機能にも使 われる」という特性があり、これを「語の兼類」と言う。兼類とは、いくつか の品詞種類を持つことである。つまり、一つの語は文中での意味、文脈情報に よって、違う品詞の機能に使われる。その場合、形態の変化がない。たとえば、. 例aにおいては、中国語の“靖”は「立つ」という意味で、動詞として使われ ている。ところが、例bにおいては、中国語の“帖”は「駅」という意味で、 名詞として使われている。中国語では、意味の変化、文法表現など、全てを、 「語を加える」ことによって実現する。つまり単語の形態変化がない。日本語 と比べて、この点について、違いがはっきりしている。例えば、日本語におい. ては、名詞の「学習」と動詞のF学習する」などである。名詞を動詞に変える ときは単語の形態を変える(「する」を付ける)。. 機械翻訳の誤訳の問題は二つの言語間のずれというものだけではない。翻訳 自身の複雑性そして言語自身の複雑性も機械翻訳の誤訳の原因となる。. 翻訳の複雑性 人による翻訳は翻訳者が原文を理解して、分析して、選択して、そして頭の 中に別の言語で再生する過程である。翻訳者は原文の意味を結び付けて、自分 の両言語の知識と、歴史、文化、地理、風習などの背景知識で原文を改めて組 み合わせる。機械では、限定された範囲で一対一の選択しかできない。そのた め、いろいろな「わけのわからない」誤訳が出てしまうことがある。例えば、. 人の名前“黄思錦”を機械翻訳すると。excite翻訳は「黄思の錦」という正 しくない翻訳結果で、yahoo翻訳では「黄濁錦という正しい翻訳結果である。 また、人の名前“黄巣”の翻訳では、excite翻訳の結果は「黄興」であって、. yahoo翻訳の結果は「黄色の興」である。. 4.
(8) 自然言語の複雑性 自然言語は複雑なものである。言い換えると一つの言語形式は一つ以上の意 味を持つことである。そのため、機械翻訳に対しては、この一つ以上の意味か らどちらかを選択することは大変な問題となる。自然言語では文法、単語の意 味、句法、文の意味などの面には多義性が多くある。多義性は言語の複雑さの 一つの体現でもある。単語の多義性を言えば、日本語の「身につける」は「着 る」の意味を表す一方、「把握する」の意味もある。中国語では日本語と同じ ように、ひとつの品詞分類のなかにいくつかの意味を表すことができるという 単語の多義性がある。多義性は言語自身が持つ重要な特徴であって、なくすこ とができない。中国語と日本語の形態、句法、文法上の違いも中目機械翻訳の もう一つの難しい点である。爆撃は論文『机器翻深ヌ佳点所在』で、中国語の特 徴の面から、翻訳が難しい原因について、次のように述べた(張政 2005)。. ①汲浩訣適確欧活言那祥二子的形恣。 (日本語訳:中国語は印欧の言語のような豊かな形態を持つことがない。) ②汲i吾的斜頚、立華和島組之同器財限恨模糊。 (日本語訳:中国語の語素、単語、連語間の限界は明らかでない。). ③測吾的洞炎和句法成分之向没有明礁的一一対庇美系。 (日本語訳:中国語には、品詞の種類と句法成分の問に、明確的な一対一 の対応関係がない。). ④測量中田暇河量然有事要的句法功能但是根津情況下五選球省略。 ⑤双眼句子成分和与文之同也没有明礁的一一対庇美系。. ⑥双浩需面高中有分洞達引,即字題字下向没有空格,按句田螺即事面測吾 去失了較多的漕言信息。. ここで、①から③まで、例をあげて、説明する。. ①中国語は印欧の言語のような豊かな形態を持つことがない。日本語にも過 去形、連用形、連体形、未然形、終止形、仮定形、命令形があって、一つの単 語をそれぞれの形態に変えることができる。中国語ではこのような形態変化が ない。代わりに、文のなかに、“了”“假如”“正在”“着”などの単語を加えて、. 完了形、仮定形などの文法機能を表す。 ②中国語の語素、単語、連語間の限界は明らかでない。たとえば、“螺子里” と“院子嚢面”,“魚子”は「庭」の意味で、“里”と“里面”は「中」の意味. で、“院子下面”と“院子里”は両方同じ「庭の中」の意味である。前者は中 国語の連語として認められているが、後者は名詞か連語か、まだ争議が存在し ている(任宣知1986)。人がこれを理解するのは簡単であるが、機械翻訳する とき、連語として解析するか、単語として解析するか、なかなか難しい点であ る。. ③中国語には、品詞の種類と句法成分の間に、明確的な一対一の対応関係が ない。品詞の種類とは、名詞、動詞、形容詞などのことである。句法成分とは、 5.
(9) 形容詞を述語とし ト用いる 形容詞を連体修飾 黷ニして用いる. 述語. 他的房向根干浄. 彼の部屋はとてもき 黷「です。. 連体. 干網的衣服. きれいな服. C飾. 形容詞を目的語と. 目的. 他愛干浄. 彼はきれい好きです。. オて用いる 形容詞を補語とし. 補語. 洗群群. きれいに洗濯する。. ト用いる 形容詞を主語とし 主語 干浄是最要累的 きれいであることは 齡ヤ大事です。 ト用いる 形容詞を連用修飾 連用 他干徳利索地把向州解決 彼はこの問題をきち と解決しました。 黷ニして用いる C飾 ケ。. 注:連用修飾語(用言を修飾する修飾語、大辞泉) 連体修飾語(体言を修飾する修飾語、大辞泉) 表1−1の中の名詞“屯活(電話)”の例文をexciteで機i械翻訳をした。その 結果、“屯活”は主語のとき「電話は」と翻訳された。“屯活”は目的語のとき、 「電話を」と翻訳された。“屯活”は連体修飾語のとき、「電話jと翻訳された。. しかし、“屯’活”が連用修飾語のときの例文“三一活朕系”の意味は「電話で連. 絡します」だが、excite翻訳では、 f電話は連絡します」と誤訳された。この 例文の“屯活(電話)”という連用修飾語が主語として解析された。. 機械翻訳の限界 機械翻訳をするのは、実際はコンピュータとソフトである。コンピュータの 構造は人の脳の構造に比べて、かなりの差がある。コンピュータを人の脳の代 わりに翻訳するのは、いくつかの高い山があると言っても言い過ぎではない。. 翻訳文から見る誤訳 三光父らは論文「槍机器翻洋辰量的坪佑」において、機械翻訳の精度が影響 した様々な間違いに対して、「systran」翻訳システムを調査の対象として、調 査の結果を16に分類した(周壁父ら1989)。次に、原文を載せる。 1輸入錯幌,原文有錯,或者没有輸入。 2六甲和国没有包括在高頻洞江:中。. 3塗筆包括某些慣用五和寺用生合木浩。 4有的一般単洞、縮略洞、人名等没有包括在洞典内,鉄乏単洞的附加信息。 7.
(10) 5没有包括某些寺並木活。. 6所塞源系有錯俣,省略不能夏原。 7数的一致性有錯俣。. 8不能技到洞炎。 9我不到系洞。 10未遊行分析。 11冠着使用不当。. 12介洞的修飾美系有戸俣。 13介洞的穿下有尊爵。 14日寸恣宇昔i昊。. 15i吾略筆昔俣。. 16紅舌錯俣。. この結果は具体の面から、誤訳の現象を示している。また、その誤訳の原因 の一部分は翻訳辞書の不完備であって、辞書を改善したら、誤訳を直すことが でき、そして、その他の誤訳は翻訳前の編集、翻訳後の再編集などで直すこと が出来ると彼らは言った。. 誤訳の改善へ 機械翻訳の過程は原文(原言語の文)をある方式から構築される機械翻訳シ ステムで翻訳して、翻訳文(目的言語の文)にする過程である。機械翻訳の誤 訳を減らすため、翻訳システムと原文の二つの出発点から、改善が行われる。 翻訳システムの改善 規則に基づく翻訳方式の他、統計に基づく翻訳システムの出現は、翻訳シス テム改善の一つの足跡ともいえる。統計に基づく翻訳システムは多量の実例を データベースにする必要があり、データが多いほど、翻訳の精度が高くなる。 そして、この翻訳方式は言語の句法、文法などの解析をしない。しかし、規則 に基づく翻訳システムより、翻訳の精度が高いとはまだいえない。データの収 集がまだ足りないともいえる。. 原文の改善 ある原文は機械翻訳すると、誤訳が常にある。このことは原文が機械翻訳し にくいということである。しかし、ある原文は機械翻訳すると誤訳がない。こ のような原文は機械翻訳しやすいともいう。なぜなら、このような原文は機械 翻訳システムで解析・変換・生成の三つの処理が正しいからである。しかし、 単に機械翻訳システムでうまく処理できないことがあるから、この場合、若し も人がこの原文を機械翻訳にシステムがうまく処理できるように変換すれば、 機械翻訳システムでうまく処理できるようになることが可能である。ここで、 原文を機械翻訳システムがうまく処理できない文から機械翻訳システムでう まく処理できるようにする過程を「原文を機械翻訳に適応させる」という。あ 8.
(11) るいは、「原文を書き換える」という。このように、原文の書き換えによって、. 誤訳を減らして、翻訳精度を向上させる。原文を書き換えて機械翻訳に適応す ることが原文の改善の目的である。しかし、どのような文は機械翻訳に適応し た文かというと、抽象的には言えるが、答えは唯一ではない。すなわち、一つ のことを良く説明するために、言い方は一つだけではなく、たくさんあるとい うことである。これは、言語自身が固いものではないからである。これは書き 換えの問題点の一つである。現行の機械翻訳の研究は、翻訳システムについて の研究はたくさんあるが、原文の改善については少ない。そして、原文の改善 についての研究も、規則に基づく翻訳システムに関する研究である。 1.3.2原文の改善に関する先行研究. ①機械翻訳へのユーザの適応と書き換えの教示効果に関する分析. 山下らは機械翻訳に関する知識をあまり持たないユーザが母国語だけを用 いて書き換え作業を実施する場面を想定し、ユーザが機械翻訳に初期適応する 際にかかる書き換え作業量を減らすための方法を考案する実験を実施した。 ユーザに「良い翻訳結果を得るためのルール集合」を教示することによってユ ーザにかかる作業量を減らすことができることが分かった(山下ら 2006)。. ②折返し翻訳を用いた翻訳リペアの効果. 宮部らは翻訳リペアのコストに見合うだけの翻訳精度が得られるかについ て検討するために折返し翻訳を用いた翻訳リペア実験を行った。実験では、15 文字以上32文字以下の文を実験の対象として用いた。その結果、一部の修正 が困難な単語を含む文を除いて、約6回の翻訳リペアにより、英語・中国語・ 韓国語の3言語を正しく意味伝達が可能な文へ改善可能であった。3言語の平 均では、コミュニケーションに問題なく利用可能な翻訳精度へと、100文中65 文を修正できた(宮部ら 2007)。. ③機械翻訳に適応するための書法ルール習得テキストの開発. 橘は誰もが機械翻訳に適した文の書き方をできるだけ短時間で効率的に習 得するために、機械翻訳に適応するための書法ルールを学習できるように整理 した。そのルールを自学自習で習得できるように、機械翻訳に適した書法ルー ル習得テキストの開発を行った(橘 2007)。 1.3.3先行研究から見る課題. 折り返し翻訳と書き換え作業には大きなコストがかかるという問題点があ る。山下は「良い翻訳を得るためのルール集合」を整理して、大きなコストが かかという問題を改善したが、ルールを教示する実験からみると、ルールの習 得が問題点になっている。「操作指示型ルール」と「操作自由型ルール」とで は、習得難度が違う。そして「良い翻訳を得るためのルール集合」は万能でも ない。ルールによって全ての文を誤訳のない翻訳文に書き換えることは不可能 9.
(12) だと思われる。折返し翻訳を用いた翻訳リペアが母語で書き換え作業を行うた めの手段として有効であることは確認されたが、相手の言語の文(翻訳文)の 翻訳精度について検証されていない。そして、一人で検証することは難しい。 原文と折返し翻訳文の比較によって、翻訳文の精度が推測できるけれども、原 文と折返し翻訳文の意味が一致しても、翻訳文の精度がよくない場合もありう る。橘は機械翻訳に適した文の書き方を短時間で習得できるように、「良い翻. 訳結果を得るためのルール集合」から19の重要なルールを対象として、習得 テキストを開発した。しかし、「良い翻訳結果を得るためのルール集合」は日 本語体系による分類のルール集合であり、この中には、日本語特有な言語表現 に関する書き換えルールもあれば、中国語に適応可能な普遍性のある書き換え ルールもある。原文が日本語のときには、これらのルールに従って書き換えす るのがいいが、原文が日本語ではない場合、その言語に適用したルール体系に 整理し直さなければならないと思われる。 1.4研究の目的と方法 1.4.1研究目的. そこで、本研究の目的を以下のように設定する。. ①山下らが示した「良い翻訳結果を得るためのルール集合」を参考にし て、中国語体系による書き換えルールに整理すること。 ②中国語体系による書き換えルールを習得させるために、機械翻訳に適 した書法ルール(書き換えルールともいう)習得テキストを開発する。. ③中国語が母語の人を対象として、②で開発した折返し翻訳を用いるテ キストの習得効果検証実験を行う。. ④実験で出てきた書き換えた文を、筆者が「excite翻訳」で、日本語の. 文(本論文では、母語は中国語、話し相手の言語は日本語)に機械翻 訳する。そして、その翻訳文(相手の言語の文)の翻訳精度を日本語 が読める人の協力で評価をする。 1.4.2 研究方法. 研究方法は以下のようになる。. ①山下らが示した「良い翻訳結果を得るためのルール集合」と、橘が選び出. したICE2002(異文化コラボレーション実験)に頻出の19のルールを参考に して、日本語言語特徴がはっきりしていないルー一・・ルを抽出し、そのルールが中. 日翻訳に適応できるかどうかを検討する。また、橘が対象とした19のICE2002 に頻出のルールを検討して、中国語体系による書き換えルールの整理に参考と する。また、言語の多義性、中国語の特徴を検討して、それに関する書き換え ルールを整理する。 10.
(13) ②書き…換えルV・・一一一ルによって書き換えをすれば翻訳結果がうまく改善できる. ような中国語文を書き換えの例文として、書き換えルール習得テキストを開発 する。このテキストは中国語の体系による書き換えルールを習得させるテキス トだから、中国語で書くことになり、元の言語は中国語である。. ③作成したテキストの習得効果を検証するために、テキスト習得効果の検証 実験を行う。この実験は大学生レベルの中国語の語学力がある中国人を対象と して行う。実験では、被験者はテキストを見て、テキストにしたがって、指定 された「excite翻訳」を使って、折返し翻訳を用いる書き換え作業をする。 折返し翻訳を用いれば、日本語が分からなくても書き換え作業ができるから、 中国語しかわからなくても、書き換え作業ができる。本論文では、折り返し翻 訳の時、翻訳文(相手言語の文)を見えないようにする。これで、日本語のわ かる中国人留学生でも、被験者になれる。翻訳文(相手言語の文)が見えない から、わからないはずである。. ④折返し翻訳を用いる書き換えた文の精度を検証するために、実験のデータ に翻訳文(日本語文)主観的評価実験を日本人の一協力で行う。つまり、原文の. 意味と翻訳文の意味を比べることによって、翻訳文の意味は、どのぐらい原文 の意味に忠実であるかを評価してもらう。あるいは、翻訳文の忠実度を評価し てもらう。忠実度の評価の基準は長尾が示している(長尾 1986)。. 注:本研究では、機械翻訳で翻訳したい文を原文とする。原文の言語を原言語 とする。機械翻訳で目的言語に翻訳した文を翻訳文とする。中国語を日本語に 翻訳する場合、原言語は中国語であり、目的言語は日本語である。翻訳文を原 言語にすると、折返し翻訳文となる。原文と折返し翻訳文の言語は原言語で、 翻訳文の言語は目的言語である。 原文を二回翻訳して、折返し翻訳文にする過程は折返し翻訳である。原文と折 返し翻訳文を比較して、原文の言い方を書き換える過程は「折返しを用いる書 き換え作業」である。この中、原文の言い方を書き換える時に従うものは「書 き換えルール」あるいは、「書法ルール」である。. 11.
(14) 第2章書き換えルール習得のためのテキストの作成 2.1書き換えルールの整理. 2.1.1書き換えルールの必要性 「適切な言い換えを短時間で考え出すことが出来れば、より少ない修正コス トで翻訳精度を上げることができると考えられる」と宮部らは言っている。こ こに「言い換え」とは機械翻訳したい文を書き換えることである。 2.1.2書き換えルールを整理する方法. ①山下らの「良い翻訳結果を得るためのルール集合」を参考した。このルー ル集合は日本語体系により分類されたので、日本語を書き換える時に適したル ール集合である。例えば、「格助詞を明記する」と「漢字を使用する」の二つ のルールは日本語に特有なルールとも言える。「漢字を使用する」とは漢字で 書けるところを平仮名で書かないようにするという意味である。平仮名は日本 語特有の文字であり、そして中国語は全部漢字で書いているので、このルール は日本語に特有なルールである。また、格助詞は日本語に特有なものである。 結論づけると、これらのルールは中国語のルール体系に適用する可能性がない。 一方、「主語を明記する」「述語を明記する」などは、別の言語でも「主語」「述 語」があるから、この二つのル・一一一一一ルは中国語体系にも適用できるかどうかを検. 討することができる。. ②橘が整理した19のルールを検討する。 ③言語の多義性、中国語の特徴などからの誤訳に応じて、ルールを整理する。. 2.1.3書き換えルv・一・ルの整理. 良い翻訳結果を得るためのルール集合と橘が整理した19のルールの検討 良い翻訳結果を得るためのルール集合と橘が整理した19ルールから、中 国語に適応可能なルールを、以下のように抽出した。. 1複数の意味を持つため、うまく翻訳されない名詞を適切に書き換える。 2正しい訳語がでない動詞を適切に書き換える。 3動詞は名詞と解釈されないような形に書き換える。 4熟語の使用を避ける。. 5システムにとっての未知語の使用を避ける。 6日本語特有な物事名の使用を避ける。 (中国語用のルールを整理する場合は下線部を「中国語」にする) 12.
(15) 7多義語は一意に意味が特定できる表現に書き変える。 8冗長な表現を避ける。. 9削除してもその後の文の意味が変わらない語句は削除する。 10不必要な同一語句を削除する。 11不必要な同義語は削除する。 12主語を明記する。 13述語を明記する。 14目的語を明記する。 15目的語を長くしない。 16長い修飾語を付けない。. 17修飾語は直近の述語、体言に係るようにする。 18修飾語の書き換え。 19句読点の使用に注意。. 20長い文を避け、短い文にする。 21文法的でない構造は避ける。 22口語表現の使用を避ける。 23感情表現の使用を避ける。 24慣用表現の使用を避ける。 25複雑な否定表現を避ける。 26敬語表現の使用に注意。 その他の検討(ルール集合以外から整理した). 言語の多義性に関するルール 27単語の多義性で誤訳が発生したら、多義性のない単語に書き換える。 28多義性のある連語と句は一意に意味が特定できる表現に書き換える。. 29文(連語)の中、単語と単語、連語と連語間の修飾関係をあきらかに する単語は省略しない。 中国語の兼類に関するルール 30語の兼類に注意。名詞を動詞に解釈しないように、文を書き換える。 中国語の文型に関するルール 31文型“主導胃梧句”を文型“劫洞溜活句”に変換する。(詳しくは後述。). 32強調のための文型“反頃来”を平易な文型“隊述句”に変i換する。. 中国語についてのその他のルール 33目的語がうまく翻訳されてない場合、目的語を名詞性の連語に書き換え 13.
(16) る。. 34中国語にある文法的な省略、習慣的な省略などに注意する。うまく翻訳 できない場合、省略しない。. 最後に整理したルール 上記の34のルールから、いくつかのルールを抽出し、これらを本研究でテ キスト作成する対象ルールとして、最も効率的に学習できるよう以下のように 整理した。ただし、テキストでルールを説明するとき、中国語文法の用語も少 し含めている。中国語文法と日本語文法は全く同じものではないので、ルール の説明を理解しやすくするため、本論文では中国語文法の用語を以下のように 表している。. 字(中国語)→語素(日本語) 洞(中国語)→単語(日本語) 短目、洞組(中国語)→連語(日本語) 旬子(中国語)→文(日本語) 主脳(中国語)→主語(日本語) 情浩(中国語)→述語(日本語) 箕沼(中国語)→目的語(日本語). 定量(中国語)→連体修飾語(日本語) 収量(中国語)→連用修飾語(日本語) ネト漕(中国語)→補語(日本語). 産子成分(中国語)→句法成分(日本語) ルール1:在野改変原意的前提下,可以通迂添加、変換、捌除.単洞、改変句. 型、分一等手段改写原文。(文の本来の意味が変わらない上に、単語、連語の. 増加、変換、削除、そして、文型の変換などの手段によって文を書き換える ことが出来る。). このルール1には書き換えの手段と書き換えの基本規則(文の意味を変え ないこと)が簡単に示されている。次に書き換えの手段の一つである単語の変 換について説明する。. 我仕ム西都不想考慮。→我任但:事都不審考慮。. “任何”と“什広”は同じではないが、この二つの文は同じ「どんなこと でも、考えたくない。」、「すべてのことは全部考えたくない。」という意味であ. る。したがって、文“什広事都不想考慮”は “什広”を“任何”に書き換え ることができる。. 以下は中国語“什広”と“任何”について、『精逸双日日汲洞典』という辞 書の中に載せられた解釈の一部分である。 什広:①[疑問を表す]何、どんな。△“遠是仕室?”→「これは但ですか。」 14.
(17) ②[“也”と“都”の前について範囲内の「すべて」を表す]なんで も、一切。. △“他什広也不拍。”→「彼はなんでも恐れない。」. 任何:いかなる……,どんな……。 △“没有爵何希望。”→「いかなる望みもない。」. ルール1に従うと、単語の変換以外、文型の変換をすることができる。たとえ ば、. 1我不得不承喜雨介二野軸組西。 2我承杁那介是我的奈西。. 3我承杁那介恥曝是我的。 4那・↑’奈西是我的,我承杁。. 以上の文は次のように直訳できる。. 1あれは私のものだと私は承認しない訳には行かない。 2あれは私のものだと私は承認します。 3あの物は私のだと私は承認します。 4あの物は私のです。私は承認します。. 文1から文4までは、中国語の分かる人は大体変換することができる。この 四つの文は同じ意味である。ただし、これらの文型については中国語の文法知 識が必要であるため、ここでは、詳述しない。. ルール2:保証句子必要的沼緊結単射整性。 (文中、必要な文法構造の不完全に注意する。) このルールはルール12「主語を明記する。」、ルール13「述語を明記する。」、. ルール14「目的語を明記する。」、ルール34「文法的な省略、習慣的な省略な どに注意する。うまく翻訳できない場合、省略しない」をまとめた。. 保持句子的皓杓畔塗性。注意由干主活,箕梧等的悟法省略和刀慣省略而造 成的難事坪数。(文に必要な文法構造の不完全に注意する。また、主語、目的 語などの文法的な省略、習慣的な省略による誤訳を避け、省略しないようにす る。). 省略は言語の中に常にある言語現象である。そして、省略現象はいろいろ な便利がある。ここには、中国語における省略現象を文法的な面から説明 しないで、一つの具体の例文から、見てみる。 例文:正在看薄紙的是日浩寺並朔旦老師。. この文の意味は「新聞を読んでいる人は日本語専門の李先生です」。主語は 15.
(18) 「人」で、「新聞を読んでいる」は「人」を修飾している。しかし、例文“正 号看扱紙的毎日活寿並的李老師。”には、「人」を意味する主語が出現していな. い、なぜなら、この主語が省略されているのである。省略された主語を加える と、“正在看立紙的人影日劇寺量的李老師。”になる。加えた部分には二重下線 を付している。. この例文から、中国語の省略現象の一つが見える。もちろん、これ以外の省 略現象はいろいろあるが、ここには示さない。省略された部分を加えると、翻 訳文の翻訳精度が上がる可能性があることは否定できない。詳しくは、課題文 と共に説明する(後述)。. ルール3:避免夏奈的表迭方式。如反向句,双重圏下句等。 (複雑な表現方式を避ける。例えば、反問句、二重否定句。) このルールはルール25「複雑な否定表現を避ける」、ルL一・一・・ル32「強調のた. めの文型“直向句”を平易な文型“隊述句”に変換する。」をまとめた。. 中国語の反問句では、答えは問題の中にあって、そして肯定と否定のいず れかであって、唯一である。多くの場合語尾は“?”で終わる。日本語の「こ んな簡単な問題が分からないの?」は、実は話し手は「こんな簡単な問題は分 かる」という意味を強く伝えたい。中国語では、あることを強く強調したい時、 反問句を使用することができる。. 中国語の二重否定句では、字面から理解すると、否定表現が二つ重なると いう特徴がある。それは正しいのである。日本語の「分からないはずはない。」 ように、二つの否定表現があって、「分かるはず」に転換することが出来る。 具体の例文から、反問句と二重否定句をもう一度見てみる。 反問句:唯道亜属不知道喝?(まさかわたしが分からないの?) この反問句は「私は分かる」ということを強調している。 そのため、反問句は普通の言い方に変えることが出来る。 普通の言い方では“我知道(私は分かる).”である。反問句を普通の言い 方にすると、文の構造が簡単になって、翻訳精度を向上させることができる。 二重否定句:我不得不承杁那介是我的奈西。(あれは私の物であると承認し ないわけにはいかない。). 普通の言い方:尊皇承引那ノi/K西是動的。(あれは私の物であると承認しま す。). この二つの文の訳文から、語気の強さ以外、表す意味が同じであることが よく分かる。普通の言い方は二重否定句より、簡単であるので、機械翻訳の場 合、二重否定句を普通の言い方にするほうがよい。二重否定句の他、三重否定 16.
(19) 句などの多重否定句もあり、それは二重否定句のように書き換えることができ る。. ルール4:踏台使用慣用活以羅文化性辰特有的洞漕。習慣用醤,成浩,姓名 等。(慣用句、姓名、熟語、などの文化的な特徴のある語の使用に注意する。) このルールはルール4「熟語の使用を避ける。」、ルール6「日本語特有な物 事名の使用を避ける。」、ルール24「慣用表現の使用を避ける。」をまとめた。. 機械翻訳に用いる辞書の不完備などの原因で、慣用句、姓名、熟語などが 上手く翻訳されないことが多くある。例えば、「excite翻訳」の結果から見 ると、姓名“魚巣”のように「黄興」と正しく翻訳されている場合もあれば、 姓名“高峰”のように「ピーク」と誤訳されている場合もある。. 熟語は、日本語にもあり、中国語にもある。それぞれの定義が違うが、文 化的な特徴を強く持つ言葉である。日本語には「一期一会」、「会者定離」など の四字熟語があって、中国語にも「温故知新」、「四面楚歌」などの熟語がある。. これらの四字熟語は機械翻訳すると、誤訳される場合がある。例えば、“坐以 待期”を機械翻訳すると、「座して死を待ちます」となる。これは正しいが、 四字熟語を使う場合、話者が四字熟語“坐以待望”の字面的な意味「座して死 を待ちます」でなく、字面的な意味から出てきた深い意味「ある困難に解決策 を考えず、ただ待つだけ。」に良く使われている。そのため、“我佃不能坐以待 謡。”という文は「私達は座して死を待つことができない。」の意味でなく、「私. 達は困難に解決策を考えず、ただ待つことができない。その代りに、何かをし なければならない」という意味を表す。. すなわち、話者は四字熟語の裏面の意味を伝えようとするのだが、機械翻 訳が伝えるのは字面的な意味である。相手が字面的な意味から、深く意味を得 るかどうかは別にして、四字熟語の使用を避けて、意味が伝わるような別の言 い方にするほうがよい。“我輩不能坐以酔臥。”を“我伯必須融点什広。「私達. は何かをしなければならない」”に書き換えたら、四字熟語の使用を避けるこ とができる。前者は熟語を使っていて、後者は普通の言い方である。もちろん、 書き換え方法は一つだけでなく、文の意味が伝わるように書き換えたらよいと いうことである。. ルール5:通冠虚洞,明硝修飾浴与被修怖醤之同謹厚系、消除岐叉。 (ある単語を加えることによって、多義性のある文を一意にする。). このルールはルール7「多義語は一意に意味が特定できる表現に書き変え る。」、ルール28「多義性のある連語と句は一意に意味が特定できる表現に書 き換える。」、ルール29「文(連語)の中、単語と単語、連語と連語間の修飾 関係をあきらかにする単語は省略しない。」をまとめた。. 17.
(20) 文脈を離れて、単に“学刀使用遠台屯脳”という文だけを見ると、この文 には、二つの意味がある。一つは「このパソコンを学習し、使用する。」で、. もう一つの意味は「このパソコンの使用方法を学習する。」である。これは前 述した「文の多義性」である。 以下の説明から、詳しく見てみる。 中国語: 学刀 使用 島台屯脳。. 日本語: 学習 使用 このパソコン。 (逐語訳). 意味A: 学習する 使用する このパソコン (このパソコンを学習し、使用する。). 意味B: を学習する 使用すること パソコンを (このパソコンの使用方法を学習する。). 中国語“学刀使用逮台屯腋”にはAとB二つの意味がある。文脈を考えな いと、話者がどちらの意味を伝えたいのかが分からない。すると、誤訳の可能 性がある。この文の多義性を一意にするため、単語“和(and)”、“急広祥(how)”. のどちらかを加えることができ、次のようになる。 “学酔裏使用遠台屯脳”(このパソコンを学習し、使用する。). “学刃雌使用遠台慰留”(このパソコンの使用方法を学習する。) すなわち、“和”を加えると、“素月和使用遠島屯脳”は「このパソコンを 学習し、使用する。」というAの意味になり、いっぽう、“学刀使用遠台屯脳” に“急広祥”を加えると、“学二念広祥使用遠台屯倉。”は「このパソコンの使. 用方法を学習する。」というBの意味になる。このように、多義性を一意にす ることができる。. ルール6:将華語成分中的幼洞性洞組改匿名洞性軸組。 (目的語を動詞性の速語から名詞性の連語にする。). このルールはルール33「目的語がうまく翻訳されてない場合、目的語を名 詞性の連語に書き換える。」と同じである。. 次の例で詳しく説明しよう。. 例=我留学刀忽銀魚イ用遠台屯脳。→鬼瓦学一il pmpmtlEEI. この二つの文中、“我伯(私達)”は主語で、“学刀(学習)”は述語で、下 線部分“急広祥イ用逮台屯脳(how to use the com uter)”、“遠台屯脳的使用. (このパソコンの使用方法)”は目的語である。前者の目的語は“パソコンを使. 用する”であり、後者は“パソコンの使用”である。ここに、前者の“使用” は「使用する」の意味で、動詞性の連語である。いっぽう、後者の“使用”は 「使用方法」という名詞の意味で、名詞性の連語である。 類似的な書き換えは、 18.
(21) 堂≧1弔本→F9本的堂≧L. “学刀需本”の“宝刀”は動詞で、“新本的馬刀”の“学刃”は名詞である。. “学刀”は動詞としての「学習する」の意味と、名詞としての「学習」の 意味があることは中国語の「兼類」という特徴の一例である。中国語には、語 の兼類はたくさんあるので、このような変換がたくさんある。. ルール7:主情短才充当滑量的“主凋滑沼句”翻深錯俣吋,裳試將主i胃滑語 句改写成幼洞性成分充当謂語的“幼洞凋浩句”。(主語と述語を一緒にした述 語成分にすると上手く翻訳できない場合、述語成分を動詞にする。すなわち、 文型“主動溜濡句”を文型“幼洞う昂吾句”に書き換える。). このルールはルール31「文型“主滑溜活句”を文型“劫軽軽浩句”に変換 する。」と同じである。. 文型“劫洞溜工区”では、述語成分は動詞である。例えば、“我看小悦(私 は本を見る)。”という文の述語は動詞“看(見る)”である。. いっぽう、文型“主i胃滑活字”の述語成分は動詞ではなく、主語と述語を 連語として、一緒に述語成分とする。以下は文“面包我吃了。(パンは私が食 べた。)”を“主i胃凋活句”の例文として説明する。. 面包 我 吃了。. パン 私 食べた. 上埜麺⊥ 大述語 ⊥主超⊥⊥述麺⊥ この文は、大主語は“面包(パン)”で、大述語は“我吃了(私が食べた)”. である。あるいは、述語成分は“我吃了(私が食べた)”である。この述語成 分は、動詞だけではなく、主語としての“我(私)”と述語としての“吃了(食 べた)”を連語として、それを述語成分とする。「大述語」ともいう。. この文を“我吃了面包。(私はパンを食べた)”のように、述語成分を動詞“食 べた”として書き換えると、“劫洞i胃活句(述語成分は動詞である)”に書き換 えることができる。. 我 吃煙 面包。. 私 食べた パン 主語 述語 」_9EtOEE9’mb⊥. このルールによって、文“遠件事我事有所悦泄”を書き換えると、“我没有. 所悦近送件事.”になり、文“我任何事都 鑑”を書き換えると、“我 墨 考慮任何事。”になる。二重下線部分は述語である。二重下線部分に示したよ うに、このルールによって文を書き換えると、一つの現象は、文中の述語の位 19.
(22) 置が後ろから前に移ったことである。具体の説明は省略する。. 以上の7つのルールには、すべての中日機械翻訳の書き換えルールを含む 訳ではない。しかし、筆者の中国語知識、機械翻訳の実践、時間などの原因で、. 本研究では、まずこの7つを実験の対象ルールとして扱う。 2.2課題文の狙いと作成 課題文の条件と狙いは以下の三つである。 1、日常使う言い方であること。. 2、意味がはっきり伝わる文であること。 3、文によって書き換えルールがよく習得できること。 2.2.1課題文の作成方法. まず、論文、Webページなどを参考にして文を選び出す。選び出した文を、. 筆者が「excite翻訳」を使って折返し翻訳する。誤訳された文は、誤訳の原 因を分析し、折返し翻訳を用いて書き換え作業をする。すると、何回かの書き 換えで、原文と折返し翻訳文が同じ意味になっていると筆者が判断した場合、 その文を課題文とする。何回書き換えても、原文と折返し翻訳文が同じ意味に ならない場合、その文を放棄する。ある文は書き換えなくても、正しく翻訳さ れたと筆者が判断したら、その文の言い方を変えて、課題文として使うことも ある。なお、課題文としての適切性は翻訳サイトに依存するので、学習者も 「excite翻訳」を使うことになる。 2.2.2課題文の作成例 例1:ルL一一・一ル1とルール7を習得するための課題文 [課題文 例1]. 我什封事都不想考慮。. ルール1:在不改変原意的前提下,可以通這添加、変換、捌除単洞、改変句 型、分旬凶手段改写原文。(文の本来の意味が変わらない上に、単語、連語の 増加、変換、削除、そして、文型の変換などの手段によって文を書き換えるこ とが出来る。). ルール7:主i胃短浩充当滑沼的“主i胃清脚韻”翻唐網野津,裳拭將主i胃情引 句改丁成劫洞性成分充当凋活的“劫洞t胃転句”。(主語と述語を一緒に述語成分. にすると上手く翻訳できない場合、述語成分を動詞にする。) 20.
(23) まず、課題文を日本語に翻訳した文と、さらに折返し翻訳を行った文を示 す。. [課題文 例1]. 我仕ム裏都立想考慮。. (意味:私はどんなことでも、全部考えたくない。全部否定) [翻訳文 例1]. 私のどんな事がすべて考慮したくありません。 [折返し翻訳文 例1]. 我的急祥瓢虫不想全部考慮。 (意味が分かりにくい中国語になっている。). (意味:私のどういうことが全部考えたくない。). 上の翻訳文のように、どのような文でも、機械翻訳を使って翻訳すれば、 必ず翻訳結果が表示される。しかし、日本語未習得の場合には、その日本語が 正しいかどうか判断することができない。そこで、課題文と折返し翻訳文を見 ると、折返し翻訳文の下線部分“急祥的事”は元の文“什広事”と違う意味に 誤訳されている。それで、課題文の下線部分“什広事”が誤訳されていると推. 測する。そして、この課題文を機械翻訳に適応した書法ルール1によって書き 換える。次に、ルール1と、ルール1によって書き換えた文の翻訳結果を示す。 ルール1:在府改変原意的前提下,可以通道添加、変換、捌除単洞、改変習 慣、分野等手段筆写原文。(文の本来の意味が変わらない上に、単語、連語の 増加、変換、削除、そして、文型の変換などの手段によって文を書き換えるこ とが出来る。). [課題文 ルール1によって書き換え後 例1] 離任何事都不想考慮。 (意味:私はどんなことでも、全部考えたくない。) [翻訳文 例1]. 私のいかなる事はすべて考慮したくありません。 [折返し翻訳文 例1]. 我的任何事愛想全部考慮。 (意味が分かりにくい中国語になっている。). (意味:私の全ての事を考えたくない、一部分だけ考える。). ルール1によって、課題文“我幅広事都不悉考慮。”を“藍鼠何事都迷想考 21.
(24) 慮。”に書き換える。その文を日本語に翻訳し、折返し翻訳を行うと、折返し. 翻訳文の下線部分“任何事”はルール1によって書き換えた文の下線部分“任 何事”と同じ意味であり、この誤訳が解消されている。折返し翻訳文と課題文 を比べて見ると、元の全部否定から部分否定になるなど誤訳は全部解消されて. はいない。ここで、ルール1によって書き換えた文をさらにルール7で書き換 える。次に、ルール7と、書き換えた文の翻訳結果を示す。 ルール7:主電量浩充当i胃黒板“主滑愕梧句”翻澤・譜俣吋,労試将主凋i胃活. 句改写成劫洞性成分充当滑浩的“劫洞図心句”。(主語と述語を一緒に述語成分 にすると上手く翻訳できない場合、述語成分を動詞にする。すなわち、文型“主 潮胃活句”を文型“劫司t胃重句”に書き換える。). [課題文 ルール1とルール7によって書き換え後 例1] 我理想考慮任何事。 (私はどんなことでも、全部考えたくない。) [翻訳文 例1]. 私はいかなる事を考慮したくありません。 [折返し翻訳文 例1]. 我不想考慮任何事。. 課題文“我什広事都不想考慮。”はルー一一ル1(単語、文型の変換、増加、削. 除など)によって“我任何事都不想圭虚”に書き換え、そして、ルール7(述 語を主恩連語から動詞にする。)によって“我不想墾任何事.”に書き換える。. 書き換えて、日本語に翻訳し、折返し翻訳を行うと、折返し翻訳文は書き換え た文とくらべ、両方の意味が同じであるので、書き換えた文が誤訳されていな いと推測する。これで、ルールによって、折返し翻訳を用いる書き換え作業が 終わる。これが、書き換えルールによって折返し翻訳を用いる書き換え作業の 全過程である。ただし、このテキストの使用者は、中国語母語者で、日本語が 分からないので、推測しかできない。また、折返し翻訳文と原文の意味がどの 程度同じなら原文が誤訳されていないか、または、翻訳文が相手に文の意味を 伝えるかについて、本論文では、詳しく研究していない。本論文では、誤訳、 翻訳文についての評価は被験者により、主観的に評価している。 例2:ルv・一・Lル2を習得するための課題文. 例2 正在看扱紙的是日量寺動的李老師。 ルール2:保持句子的結椅完癌性。注意由戸主浩,奪ミ1吾等五心法省略和刀慣 22.
(25) 省略而造成的翻犀錯俣。(文に対する必要な文法構造の不完全に注意する。ま た、主語、目的語などの文法的な省略、習慣的な省略を避け、省略しないよう にする。). 折返し翻訳を用いる書き換え作業のステップ1からステップ4を、次のよう に示している。詳細は後述する。. 1 課題文を折返し翻訳する。出てきた折返し文を課題文と比較し、両方の 意味が同じかどうかを主観的に判断する。意味が同じなら、4へ。意味が違う なら、2へ。 正在看扱紙的麗日活歯並的李老師。(課題文:中国語) ↓折返し翻訳 振紙的看着告口的寺豊的李老師的事。(折返し翻訳文). 2 課題文を書き換える。 聖母皇籍紙的是日浩寺並的李老師。(課題文:中国語) ↓(ル・・一・・一ル2によって省略された主語を加える). ↓ 省略された主語 正写受理紙・人 日暮寺神的李老師。(書き換え文:中国語). 3 2から出てきた書き換えた文を折返し翻訳する。出てきた折返し翻訳文 を書き換えた文と比較する。両方の意味が同じなら、4へ。両方の意味が違う なら、2へ。. 正在看扱紙的人骨日傘邪思華墨老師。(書き換え文:中国語) t. ↓折返し翻訳(中国語→日本語→中国語) s. 慎継紙的人骨日沼的寺田重事老師。(折返し翻訳文:中国語). 4 折返し翻訳を用いる書き換え作業が終わる。翻訳文は相手に意味が伝わ ると推測する。あるいは、書き換えた文が正しく翻訳されたと推測する。. 本論文では折返し翻訳を用いる書き換え作業を以上の4っのステップにわ ける。以上のように書き換えると、翻訳文は「新聞のが日本語の専門の李先生 なことを見ています。」という文から、「新聞を読んでいる人は日本語の専門の 李先生です。」に修正することが出来る。. 23.
(26) 例3:ルール5とルール6を習得するための課題文 例3 学刀使用屯脳。. ルール5:通辻虚洞,明硝都立軽愚被修怖活之同的美系、消除岐文。 (ある単語を加えることによって、多義性のある文を一意にする。) ルール6:将蒼白成分中魂呼洞性洞組改成名洞性酒豪。 (目的語を動詞性の連語から・名詞性の連語にする。). 折返し翻訳を用いる書き換え作業は次のようになる。 学刀使用屯脳。(課題文). ↓書き換える(ルール5によって、“急広祥”を加える。) 学刀忽広祥使用屯腕。(書き換えた文). ↓書き換える(ルール6によって“急広祥使用遷都”を“屯脳的使 ↓ 用”に書き換える。). 学心門脳的使用。(書き換えた文). ↓折返し翻訳 学月屯倉的使用。(折返し翻訳文). ルール5を紹介する時に示したように、文脈などにかかわらず、例文“学)」 使用逆運。”が伝える意味は二つある。一つは「パソコンを学習し、使用する。」. であり、もう一つは「パソコンの使用方法を学習する。」である。もし、例文. の意味は「パソコンの使用方法を学習する。」であれば、この文をルール5と. ルール6によって書き換えると、翻訳結果は「学習はコンピュータを使いま す。」という文から「コンピュータの使用を学びます。」という文に修正するこ とが出来る。. 例4:ルール3とルール1を習得するための課題文 例4称不可能不憧。 ルール3:避i免夏朶的表迭方式。如反向句,双重否定句等。 (複雑な表現方式を避ける。例えば、反問句、二重否定句). ルール1:在不尽変原意的前提下,愚妻通N添加、変換、捌除単洞、改変句 型、分降等手段改悪原文。(文の本来の意味が変わらない上に、単語、連語の 増加、変換、削除、そして、文型の変換などの手段によって文を書き換えるこ とが出来る。). 24.
(27) 称不可能不二。(課題文). ↓書き換える(ルール3によって、否定表現を肯定表現に書き換える。) 称肯定憧。(書き換えた文). ↓書き換える(ルール1によって、. ‘肯定”を“一定”に書き換える。). th 一定憧。(書き換えた文). ↓折返し翻訳 弥一定明白。(折返し翻訳文). “祢不可能不憧。”という課題文の意味は「君が分からないはずがない。」で. ある。この課題文を上が示したように書き換えると、翻訳結果は「あなたは知 らないことがあり得ません。」すなわち、「あなたはきっとわかります。」に修 正することが出来た。. 課題文5については例として説明することを省く。課題文とそれに対応して いるルールを表2−1でまとめると、以下のようである。. 課題文. 表2−1 ルールを習得するための課題文と対応ルール 書き換え例 獲得ルール. 1我什広事 我不想考慮 1)文の本来の意味が変わらない上に、単語、連. 都率想考. 任何事。. 慮。. 語、の増加、変換、削除、そして文型の変換など の手段によって文を書き換える。. 7)主語と述語を一緒に述語成分にすると上手く 翻訳できない場合、述語成分を動詞にする。. 2正在看扱 正在看扱紙. 2)文中、必要な文法構造の不完全に注意する。. 紙的野日沼 的野是日浩 寺並的戦勢 寺豊的李下 師。. 師。. 3学刃使用 学期屯脳的 5)ある単語を加えることによって、 屯脳。. 使用。. 多義性のある文を一意にする。. 6)目的語を動詞性の連語から名詞性の連語にす る。. 4休不可能. 称一定明白。. 不憧。. 1)文の本来の意味が変わらない上に、単語、連 語、の増加、変換、削除、そして文型の変換など の手段によって文を書き換える。 3)複雑な表現方式を避ける。. 5遠本需借 清把遠本杉 1)文の本来の意味が変わらない上に、単語、連 我好喝?. 借給我。. 語、の増加、変換、削除、そして文型の変換など の手段によって文を書き換える。 25.
(28) 2.3テキストの作成 「ユーザは書き換え作業繰り返す過程で良い翻訳結果を得るためのルールを 学習する。もし良い翻訳結果を得るためのルールをあらかじめユーザに教示す ることが出来れば、ユーザの学習過程を短縮し書き換え作業量を減らす事がで きるはずである。」と山下らは言っている(山下 2007)。. 2.3.1テキストの目的. このテキストの目的は機械翻訳に適した書法ルールを習得させることであ る。すなわち、ルールの原理を説明しながら、実際にルールの効果を体験させ ることによってルールを納得させることである。 2.3.2 テキストの内容. このテキストは折返し翻訳を用いる書き換え作業の意味と操作方法、実践部. 分、ルールとその説明、問題(ルール習得容易度を評価させる)の4つの部分 を含んでいる。テキストは資料2に示す。 折返し翻訳を用いる書き換え作業に必要な説明と操作方法。 この部分は、「excite翻訳」を開く、折返し翻訳機能の選択、などを含めて、 操作方法を図で詳しく説明している。. 書き換える作業の実践部分 実践部分は5つの課題文を書き換えることである。 1正在園扱紙的是日漕寺並肉李老師。 (日本語の意味:新聞を読んでいるのは日本語専門の李先生です。). 2祢不可能不良的。 (日本語の意味:君が分からないはずがない。). 3細塵使用屯腋。 (日本語の意味A:パソコンを学習し、使用する。). (日本語の意味B:パソコンの使用方法を学習する。). 4我輩広事都不想考慮。 (日本語の意味:私はどんなことでも、全部考えたくない。全部否定) 5底本#借給我北郷? (日本語の意味:この本を私に貸してもいいですか。). ルールとその説明 テキストには、7つのルールを次のように載せてあり、そして中国語でもっ と詳しく説明している。. 1在不改変原意的前提下,可以通則添加、変換、捌者一単洞、改変砂型、分句 26.
(29) 等手段改写原文。(文の本来の意味が変わらない上に、単語、連語の増加、変 換、削除、そして、文型の変換などの手段によって文を書き換えることが出来 る。). 2保証句子必要的結杓完無性。 (文中、必要な文法構造の不完全に注意する。). 保持句子焼結杓完身性。注意由財主活,宴浩等的活法省略和刀慣省略而造 成的士卒借俣。(文に対する必要な文法構造の不完全に注意する。また、主語、. 目的語などの文法的な省略、習慣的な省略による誤訳を避け、省略しないよう にする。). 3避免田奈的表迭方式。如反巻句,双調否定句等。 (複雑な表現方式を避ける。例えば、反問句、二重否定句など。) 4避免使用慣用強陣及文化性根特有的洞浩。習慣用酒,成活,姓名等。 (慣用句、姓名、熟語、などの文化的な特徴のある語の使用に注意する。) 5通冠虚洞,明硝修喧嘩与被修夕陰之同的美系、消除岐又。 (ある単語を加えることによって、多義性のある文を一意にする。) 6肇国浩成分中的劫洞性番組改町名洞性洞組。 (目的語を動詞性の連語から名詞性の連語にする。). 7主滑短浩充当滑活的“主滑情i吾句”翻洋措i昊吋,裳試將主滑凋活句改写成 劫洞性成分充当滑浩的“劫年季浩句”。(主語と述語を一緒に述語成分にすると. 上手く翻訳できない場合、述語成分を動詞にする。すなわち、文型“主i胃iMg 句”を文型“栄福滑麗句”に書き換える。) 調査問題(評価させる). テキストの最後では、テキストによって、ルールの習得程度について調査す るために、習得難度をa、b、 c、 d、 eの5つのレベルに分けて、調査問題を作. っている。5つのレベルは次のように示す。. a恨容易就明白了,也知道具体該急激改。 (ルールの説明がよくわかる、書き換えは難しくない。) b明白悦的什仏意思,但書自己対男能不能倣到把握不大。 (ルールの説明が分かる。書き換えはすこし難しい。) c大概明白悦的是什/A意思,但是具体恋広倣只是稽微有些美堵。 (ルールの説明が大体分かる。書き換えは難しい。). d不様明白悦跡取広意思,族急公也没什公把握。 (ルールの説明があんまり分からない。書き換えもあんまりできない。) e完全不明白悦的是什広意思,也不知道具体該四仏倣。 (ルールの説明が全然分からない、書き換えも全然できない。). 27.
Outline
関連したドキュメント
地図 9 “ソラマメ”の語形 語形と分類 徽州で“ソラマメ”を表す語形は二つある。それぞれ「碧豆」[pɵ thiu], 「蚕豆」[tsh thiu]である。
用 語 本要綱において用いる用語の意味は、次のとおりとする。 (1)レーザー(LASER:Light Amplification by Stimulated Emission of Radiation)
これはつまり十進法ではなく、一進法を用いて自然数を表記するということである。とは いえ数が大きくなると見にくくなるので、.. 0, 1,
日本語で書かれた解説がほとんどないので , 専門用 語の訳出を独自に試みた ( たとえば variety を「多様クラス」と訳したり , subdirect
つまり、p 型の語が p 型の語を修飾するという関係になっている。しかし、p 型の語同士の Merge
なお︑この論文では︑市民権︵Ω欝窪昌眞Ω8器暮o叡︶との用語が国籍を意味する場合には︑便宜的に﹁国籍﹂
1、研究の目的 本研究の目的は、開発教育の主体形成の理論的構造を明らかにし、今日の日本における
配慮すべき事項 便所 ・介助を要する者の使用に適した構造・設備とすること(複数設置で、車い