• 検索結果がありません。

機械翻訳に適応するための書法ルール習得テキストの開発

N/A
N/A
Protected

Academic year: 2021

シェア "機械翻訳に適応するための書法ルール習得テキストの開発"

Copied!
104
0
0

読み込み中.... (全文を見る)

全文

(1)学位論文. 機械翻訳に適応するための書法ルール習得テキストの開発. 兵庫教育大学大学院 学校教育研究科 修士課程 教科・領域教育専攻 総合学習系コース. MO6306D 橘 守亮 主任指導教官 : 長・瀬 久明 教授. 指導教官 : 長瀬 久明 教授.

(2) 目次. 第1章 機械翻訳を用いた情報発信と問題の所在 1.1 情報化の進展と国際化 1.2 未習得言語での情報受発信の手段の比較 1.3 先行研究から見る機械翻訳の現状と問題点. 1.3.1 誤訳の発生と対策 1.3.2 ユーザ適応に関する先行研究の現状 1.3.3 先行研究から見る課題 1.4 研究の目的及び方法 1.4.1 研究の目的 1.4.2 研究の方法. ・1 。1. ・2 ・3 ・3. ・4 ・9. ・10. ・10 ・10. 第2章 書法ルール習得のためのテキストの作成. ・12. 2.1 書法ルールの精選 2.2 課題文のねらいと作成方法 2.3 書法ルール習得難易度調査のための予備実験 2.3.1 予備実験の概要 2.3.2 予備実験の結果と分析 2.4 書法ルール習得のためのテキストの作成 2.4.1 社会人対象実験用テキスト 2.4.2 中学生対象実験用テキスト 2.4.3 高校生対象実験用テキスト. ・12 ・18 ・25 ・25 ・25 ・27. ・29 ・34 ・38. 第3章 実験によるテキストの効果検証. ・40. 3.1 実験の概要 3.2 社会人を対象とした実験 3.2.1 実験の方法と内容 3.2.2 実験の結果と分析 3.3 中学生を対象とした実験 3.3.1 実験の方法と内容 3.3.2 実験の結果と分析 3.4 高校生を対象とした実験 3.4.1 実験の方法と内容 3.4.2 実験の結果と分析. ・40 ・40. ・40 ・41. ・42 ・42. ・44 ・48. ・48 ・50.

(3) 第4章 実験の分析と考察 ・… 53 4.1 機械翻訳に適した書法ルール習得に関する分析 4.2 書法ルール習得テキストの評価と改善点について 4.3 今後の課題 ・… 56. 参考文献. 参考URL 言射辞. ・・…. ・… ・…. 53 55. 58. ・・… 60 ・ ・ …. 61. 資料. 1.課題文解答例(原文・中間の韓国語文・折り返し文). 2.予備実験配布資料 3.予備実験翻訳データ(原文・中間の韓国語文・折り返し文) ①被験者A 翻訳データ ②被験者B 翻訳データ ③被験者C 翻訳データ 4.テキスト効果検証実験データ(原文・中間の韓国語文・折り返し文) ①社会人対象実験 データ例 ②中学生対象実験データ例 ③高校生対象実験 データ例 5.機械翻訳に関するアンケート,社会人対象実験.

(4) 第1章機械翻訳を用いた情報発信と問題の所在 1.1情報化の進展と国際化 現代社会において、インターネットの普及など、めざましい情報化が進ん でいる。インターネットの普及により、さまざまな情報を誰でも簡単に入手 することができるようになった。その情報とは、日本国内の情報に限らず、. 例えば海外のWebサイトにアクセスすれば、日本にいながら海外の情報を 入手することも可能である。また、単に情報を得るだけではなく、Webサイ ト上の掲示板やチャット等を用いれば、海外の人々に対して自分の意見を発 信することも可能である。つまり、インターネットの普及がめざましい現代 社会においては、情報の収集や発信を国際的な範囲で行うことができる。今 後も情報通信技術の発展は行われ、ネットワーク上での国際化はますます進 むと考えられる。. このような国際化の中で、大きな問題となるのが、共通して使用すること ができる言語がないという、言語の壁である。上で述べたように、情報通信. 技術が発展し、海外のWebサイトにアクセスすることは誰にでも可能であ る。しかし、そのサイトから情報を得ることができるのは、そのサイトが記 述されている言語が理解できなくてはならない。例えば、今最も世界中で使 用されている言語は英語であろう。わが国においても、英語教育は義務化さ れ、小学校からの必修化も決定されている。ところが、このように誰もが学. 習しているはずの英語で記述されているWebサイトからでさえ、誰もが十 分に情報を収集できるかといえば、困難であるというのが現状であろう。専 門的な用語や複雑iな内容の文章から、必要な情報を得るには、経験と学習が 必要であると思われる。そして、世界中には英語だけではなく、さまざまな. 言語が存在する。それらすべての言語で記述されたWebサイトから情報を 得るためには、すべての言語を理解できなくてはならないが、それは非常に 困難である。. 国際化が進む現代社会においては、国境や言語の壁を越えてインターネッ ト上で情報の受発信を行えることが理想である。これを実現させるために、 未習得言語での情報受発信の手段として機械翻訳を用いることを考える。. 1.

(5) 1.2未習得言語での情報受発信の手段の比較 未習得言語での情報受発信の手段については、以下の方法が考えられる。 ①相手言語を習得する。 ②通訳を介する。. ③相手も理解できる共通言語(英語)を習得する。 ④機械翻訳を利用する。 まず①の相手言語を習得する方法については、例えば実際に相手の国で、 その国の文化を学んだり、人々と交流する手段としては最も良いと思われる。 しかし、言語の習得には多くの時間を要する。また、その他の言語を用いる 人々に情報を発信する場合には、またそれに対応した言語を習得する必要が ある。このようなことから、①の方法では情報発信が可能な範囲が限られる と思われる。. 次に②の通訳を介する方法については、情報発信を行いたい言語を習得し た通訳者を介すれば、ほとんど苦労することもなく、情報を発信することが 可能であると思われる。しかし、この方法では常に通訳者に身近にいてもら わなくてはならないし、情報発信を行いたい言語を習得した通訳者がすぐに 見つかるという保障もない。また、通訳者に対して報酬を払う必要もあると 思われる。. 次に③の相手も理解できる共通語を習得する方法については、前節でも述 べたが、現在は世界の共通語として英語が用いられている。確かに英語を習 得すれば、情報を発信できる範囲は相当に広くなると考えられる。しかし、 それで世界中の人々に対して情報発信ができるかといえばそうではない。ま た、それぞれの国には当然それぞれの国の文化が存在するが、そのすべての 人々が共通語である英語で情報の発信・受信を行うようになると、それぞれ の文化が英語特有の表現方法に変化してしまう恐れもある。 最後に④の機械翻訳を用いる方法については、それぞれの未習得言語の翻 訳に対応した翻訳ソフトを用いれば、誰でも自動で翻訳することができる。 さらに近年は、Yahoo翻訳など、誰でも無料で使用することができる翻訳サ イトが増えており、手軽に機械翻訳を利用することができる。しかし、機械 翻訳には、誤訳が発生するという問題点がある。誤訳の問題に対して、誤訳 の発生を完全に無くすことは容易ではない。しかし、ユーザが機械翻訳に適 応することによって、誤訳の発生を軽減することは可能である。本研究では、 未習得言語での情報受発信の手段として、機械翻訳の利用を考える。. 2.

(6) 1.3先行研究から見る機械翻訳の現状と問題点. 1.3.1誤訳の発生と対策 現在の機械翻訳の現状については、先にも述べたとおり、Webサイトに アクセスが可能であれば、誰でも無料で使用できる環境にある。Yahoo 翻訳やExcite翻訳などはその例であり、これらの翻訳サイトについて は本研究の実験の中でも使用した。また、このような無料の翻訳サイト以外 にも、様々な企業から機械翻訳ソフトが発売されている。本研究においては、. クロスランゲージ社の日韓翻訳ソフト「高麗2007」を使用した。このソ フトは、単純に日本語から韓国語への翻訳や、韓国語を日本語に翻訳するこ と以外にも様々な機能を備えている。例えば、韓国語に翻訳したい日本語を 入力し、翻訳を行う。この際、翻訳結果の韓国語が表示されるが、たいてい の場合韓国語は未習得であるために、結果の韓国語が正しい文になっている かわからない。また、文は正しくても、伝えたい内容と違った内容の文にな. ってしまっている危険性がある。そこで、高麗2007には翻訳結果の韓国 語をさらに日本語に翻訳し直して表示する機能が備わっている。これを翻訳 エディタ機能と呼んでいる。. このように、無料で誰もが使用できるWebサイト上の翻訳ソフトや、各 企業からユニークな機能が備わった翻訳ソフトも多く発売されている。この ようなことから、機械翻訳への期待や、気軽に使える利便性が感じられる。 しかし、現状の機械翻訳には問題点も存在する。最も大きな課題は、誤訳 されてしまうという問題である。現状において、日英翻訳や日韓翻訳など、 かな.り高い精度で翻訳できる言語も存在するが、いまだ誤訳がされないとい うことはない。. この誤訳が発生するという問題点に対する対策としては、次の2通りの方 法がある。. ①機械翻訳のシステムを改善することにより翻訳精度の向上を目指す。 ②ユーザが機械翻訳に適応することにより誤訳の減少を目指す。 ①の方法の中で現在研究中であるのが、翻訳メモリである。翻訳メモリと は、誤訳を減らすために、文法に基づく翻訳だけでなく、大量にデータが蓄 積された対話データベースからの検索を用いて翻訳を行うものである。この ような翻訳メモリの研究はすでに進められている。ところがこのような機械 翻訳が主に使われるにはまだ時間が必要と思われる。現在の主な機械翻訳の 3.

(7) システムは文法に基づく翻訳を行っている。つまり、現在の機械翻訳を用い るためには、②の方法であるユーザの適応が必要であると思われる。次節で は、②のユーザの機械翻訳への適応に関する先行研究について述べる。. 1、3.2ユーザ適応に関する先行研究の現状 現在の機械翻訳には、上で述べたように誤訳が発生するという問題点があ る。しかし、事前に機械翻訳では誤訳が発生するかもしれないという前提で、 未習得言語を使用する人々との意思疎通を行った実験が行われた。次に、ユ ーザの機械翻訳への適応に関する先行研究について示す。 ①高校生による情報収集の授業実践. 松原は、機械翻訳を利用して未習得言語から情報収集を行った(松原 2004)。その方法は、未習得言語で書かれたWebページからの翻訳による情 報収集と、英語と韓国語を使用する外国人協力者と電子メールを送受信する という2つの方法で行われた。研究の対象となったのは、高校生であった。 生徒は機械翻訳に適した文の作成法、往復翻訳の学習を1時間行った。松原 の研究では、機械翻訳に適した文の作成法として以下を示している。 (1)主語や目的語を明確にする。 (2)表現を明確にする。 (3)省略語を使わない。 (4)漢宇のある言葉は、漢字で書く。. (5)長い文章はNG。いくつかの短い文章に分けましょう。 これら5つの機械翻訳に適した文の作成法や往復翻訳・書きi換え作業の学 習を1時間行った。その後、生徒各自が設定した課題に関して、Webページ からの翻訳による情報収集を2時間、外国人協力者との電子メールの交換か らの情報収集を6時間の計9時間の実践を行った。松原の行った研究により 以下のような結果が得られた。. ●2時間でのWebページからの情報収集活動では、翻訳された内容を理解 することができたが、新しい情報を得るには十分ではなかった。 ●6時間での電子メールを使った情報収集では、5往復の送受信が行われ、 多くの生徒は外国人協力者からの電子メールの内容を理解し、情報収集活動 を行うことが出来た。 4.

(8) ●機械翻訳を利用することで、他言語の壁が低くなり、交流相手と意欲的に 関わろうとする姿勢が見られた。 機械翻訳に関する研究では、そのほとんどが翻訳精度に関する研究であり、 機械翻訳を用いて意思疎通を実際に行ってみる研究は少ない。松原の研究で は、機械翻訳に適した文の作成法を1時間学習し、外国人協力者と電子メー ルの交換を行っている。その結果として、多くの生徒は外国人協力者との電 子メールの交換で情報収集を行うことができた。この結果から、機械翻訳を. 用いて未習得言語を使用する人々と意思疎通をすることが可能であること が証明された。. ②小学校における機械翻訳利用に関する研究. 加藤は、小学校における総合的な学習の時間の授業で機械翻訳を利用する 実験を行った(加藤2006)。被験者である小学生70名は、機械翻訳を用い. て海外のWebページからの情報収集及び未習得言語を使用する外国人協 力者と電子メールの交換を行った。実験では、機械翻訳に適した文の作成法. の指導に1回、機械翻訳を用いた海外のWebページからの情報収集に9回、 機械翻訳を用いて未習得言語を使用する外国人協力者との電子メール交換 に2回の全13回の授業が行われた。1回目授業は90分であった。実験の 評価として、実験終了後に被験者50人に対して質問紙調査を行った。質問 紙調査では、Webページの内容が理解できたとの質問に対して90%が理 解できたと解答した。また、外国人協力者からのメールが理解できたとの質 問に対しては、74%が理解できると解答した。 加藤が行った研究から以下の結果が得られた。 ●小学生でも機械翻訳の操作を習得できた。. ●小学生でも機械翻訳を用いて海外のWebページから情報収集を行うこ とが可能であった。. ●小学生でも機械翻訳に適した文を作成できた。 ●外国人協力者からの返信メールを日本語に翻訳して理解できた。. 加藤が行った研究と松原が行った研究の相違点は、研究の被験者が小学生 か高校生かという点である。機械翻訳に適した文を作成するためには、ある 程度の国語力が必要であると考えられるため、高校生に比べて小学生は、機 械翻訳に適した文の作成法を理解することが難しいと考えられた。しかし、 小学生を対象として機械翻訳に適した文の作成法の学習を行った結果、外国 5.

(9) 人事力者と機械翻訳を用いて電子メール交換を行い、内容を理解することが 可能であった。このことから、小学生でも機械翻訳に適した文を作成するこ とが可能であると思われる。また、対象となった小学生が中学校に進学した 後で、外国語を学習する自信とプライドを生む力及び外国に対する親近感に ついてアンケートが行われた。この結果、小学校において機械翻訳について. 学習した生徒は、外国のWebページを理解できることや外国人に機械翻訳 を用いて電子メールを送れることで、外国語の理解に自信を持っていること が解った。. ③日中韓馬連の5言語を用いた異文化コラボレーション実験. 野村らが実施した異文化コラボレーション実験(野村2003)では、日中 韓馬英の5言語の翻訳機能付き掲示板システム上で多言語コミュニケーシ ョンが行われた。この際、掲示板のユーザはメッセージを投稿する際、英語 の翻訳結果を参照しながら原文を繰り返し書き換えていた。野村らが行った 研究により以下の結果が得られた。. ●英語の翻訳結果を参照しながら原文を書き換えることによって、メッセー ジの翻訳精度が向上することが示された。 ●ユーザの書き換え作業は機械翻訳を介した相互理解を構築するうえで有 効な手段である。しかし、ユーザの書き換え作業の問題点として、書き換え 作業に多大な作業コストがともなうことである。 ●もう一つの問題点として、英語の言語知識を持ったユーザにしか書き換え 作業が実施できなかったことである、 野村らが行った研究は、先に述べた松原・加藤が行った研究と比べ、大規 模な研究であるといえる。また、日中韓馬英の5言語での交流を行ったとい う点において、機械翻訳を介した相互理解が可能であることを示している。 ④ユーザの適応と書き換えへの教示効果に関する分析. 山下らがおこなった、「機械翻訳へのユーザの適応と書き換えへの教示効 果に関する分析(山下ら2006)」では、野村らが行った研究を基に、ユーザ の書き換え作業コストを軽減する方法を提案した。その方法とは、機械翻訳 に適した文を作成するためのルールを整理し、ユーザに教示することである。 山下らの研究では、良い翻訳結果を得るためのルール集合として、機械翻訳 システム作成者の提供するガイドライン「原文作成時に有効なルール」を考 えた。機械翻訳システム作成者が提供するガイドラインから重複部分とシス 6.

(10) テム特有のルールを取り除き、残されたルールを日本語文法体系に従って分 類して総計70のルールに整理したものを「良い翻訳結果を得るためのルー ル集合」と定義した。. 山下らは、往復翻訳を用いた書き換え作業の実験を実施した。対象者は 65名の大学生であった。全10文の書き換え作業を実施し、魚文には獲得 すべきルールが1つから4つ含まれており、ユーザは10文の書き換え作業 を行う過程で19個のルールを獲得することが求められた。ここでの19個 のルールとは「良い翻訳結果を得るためのルール集合」のうちでIC:E2002 に良く現れたものを用いた。山下らの研究により以下の結果が得られた。 ●往復翻訳が母国語で書き換え作業を行うための手段として有効であるこ とを確認した。. ●母国語に関する知識が豊富なユーザほど、多くのルールを容易に獲得でき た。. ●ユーザに事前に「良い翻訳結果を得るためのルール集合」の教示を行うと、. 母国語に関する知識が豊富でないユーザでも多くのルールを容易に獲得で きるようになり、書き換え作業のコストが大幅に減った。. 山下らが行った研究では、機械翻訳に適した文を作成するためのルールが 整理された。松原の研究や野村らの研究により、機械翻訳を介しての意思疎 通はある程度可能であることが示されたが、その際に行われる書き換え作業 に大きなコストが必要であるという問題点が示された。この問題点を改善す るために、山下らは機械翻訳のユーザに「良い翻訳結果を得るためのルール 集合」を教示すれば良いと考えた。しかし、山下らが行った実験においては、 良い翻訳結果を得るためのルール集合の教示を行ったが、どのタイミングで どのルールをどのように呈示すると効果的であるかについては示されてい ない。また、10文の書き換え作業を行う実験では、実際に外国人協力者な どからの評価を得ることは行っておらず、書き換えによって未習得言語を使 用する人々と意思疎通が可能であるかは示していない。 ⑤往復翻訳を用いた翻訳リペアの効果に関する研究. 宮部は、翻訳リペアによる翻訳結果への影響と、修正にかかるコストにつ いての検証を行った(宮部2007)。翻訳リペアとは、機械翻訳を用いてコミ ュニケーションを行う際に、文中の不適切な翻訳箇所を減少させるために、 入力文を書き換えることである。宮部は、これまでに、翻訳リペアが行われ た場合、その翻訳リペアの結果がどの程度の翻訳精度をもつかは評価されて 7.

(11) おらず、翻訳リペアのコストに見合うだけの翻訳精度が得られるかについて 検証を行った。検証にあたり、往復翻訳を用いた翻訳リペア実験及び翻訳リ ペア結果の評価実験が行われた。往復翻訳を用いた翻訳リペア実験では、5 名の大学生を被験者として、英語・中国語・韓国語の3言語への翻訳リペア を行っている。実験で利用した日本語文は、機械翻訳機能試験文のうち、1. 5文字以上40文字以下である文から100文選択したものを用いた。 宮部の研究により以下の結果が得られた。. ●一部の修正が困難な単語を含む文を除いて、約6回の翻訳リペアにより、 英語・中国語・韓国語の3言語の翻訳結果を正しく意味伝達が可能な文へと 改善可能であった。3言語の平均では、コミュニケーションに問題なく利用. 可能な翻訳精度へと100文中65文を修正できた。 ●原文を未修正で往復翻訳し、折り返し文と原文を比較した結果、折り返し 文が原文に近い意味になっている場合とそうでない場合がある。しかし、ど ちらの場合も、修正1回当りの精度の増加量は同程度であった。 ●原文を未修正で往復翻訳し、折り返し文と原文を比較した結果、折り返し 文の精度が低いほど、翻訳リペアの修正コストは大きくなった。そのため、 1回の修正で大幅に精度を改善することは難しいと考えられる。また、修正 困難な語句・表現を含んでいる場合修正コストが増加し、修正の放棄につな がっていた。. 宮部の研究では、翻訳リペアによる翻訳精度への影響についての検証及び 修正コストと翻訳精度の改善の関係についての検証が行われている。翻訳実. 験では、英語・中国語・韓国語の3言語への翻訳を行い、100文中65文 がコミュニケーションに問題なく利用可能な翻訳精度へと修正できた。翻訳 精度の評価にあたっては、宮部は日本語試験文と往復翻訳文の比較を行って いる。評価は5段階で行われ、評価値は5:All(同じ意味)、4:Most(文 法などに多少問題があるが、大体同じ意味)、3:Much(意味は何となくつ かめる)、2::Little(雰囲気は残っているが、もとの意味は分からない)、. 1:None(全く違う意味)である。宮部は評価値が4以上の場合をコミュ ニケーションでは問題なく利用できるレベルの往復翻訳であるとした。また、 中間言語(往復翻訳文)については、一般に往復翻訳の精度が良ければ中間 言語の翻訳精度も良いとして、中間言語の翻訳精度評価については議論して いない。. 8.

(12) 1.3.3先行研究から見る課題 機械翻訳に関する研究では、機械翻訳の翻訳精度に注目する研究が多く、 機械翻訳を介したコミュニケーションに注目する研究は少ない。これまで上 げた5つの先行研究は、数少ない機械翻訳を介したコミュニケーションに注 目した研究である。その中でも、松原・加藤の研究では、高校生と小学生が それぞれ機械翻訳に適した文を作成し、意思疎通を行うことが可能であるこ とを示した。また野村らが行った研究では、日中韓馬英の5言語の翻訳機能 付き掲示板システム上でコミュニケーションが行われ、機械翻訳を介したコ ミュニケーションが行われた。これら3っの研究に関しては、機械翻訳を介 したコミュニケーションの実践事例として見ることができ、それぞれコミュ ニケーションが可能であったことを示している。しかし、機械翻訳を介した コミュニケーションを行う際に必要である、往復翻訳と書き換え作業には大 きなコストがかかるという問題点も示された。 山下らは、この問題を改善するため、「良い翻訳結果を得るためのルール 集合」を整理し、このルールを機械翻訳のユーザに教示することによって、 往復翻訳と書き換え作業にかかるコストを削減することを考えた。山下らの 行った実験の結果としては、前節で述べた通り、良い翻訳結果を得るための ルール集合を教示することによって、書き換え作業にかかるコストが削減さ れたことを示している。. また、宮部の研究においては、翻訳リペアによって翻訳精度がどの程度向 上するか検証を行った。翻訳実験では英語・中国語・韓国語の3言語への書. き換えを行い、100文中65文をコミュニケーションに問題なく利用可能 な精度へと修正した。ところが、宮部が行った翻訳精度の評価実験は、日本 語試験文と往復翻訳文を比較することによって行われており、中間言語の翻 訳精度については検証されていない。また、修正コスト増加要素を考慮した 翻訳リペア支援の仕組みが必要であることを示している。 そこで、今後の課題として以下のことが上げられる。 ●機械翻訳のユーザに対して、どのタイミングでどのルールをどのように呈 示すれば効果的であるかを調査する必要がある。 ●ユーザがルール習得を行うための教育が必要である。 ●外国人留学生の協力で中間言語を評価するなどの方法で、往復翻訳を用い て翻訳を行った際の中間言語の精度の検証を行う必要がある。 ●ルールを教示することによって外国人等に内容を伝達できる文が作成で きるかの検証は行われていない。 9.

(13) 1.4研究の目的及び方法 1.4.1研究の目的 情報化や国際化が進めば、インターネット上でグローバルなコミュニケー ションを誰でも行う必要がある。そのコミュニケーションのツールとして機 械翻訳を考えると、これまで行われた研究から、往復翻訳と書き換え作業を 行えば、機械翻訳を介したコミュニケーションを行うことは可能であること が示された。誰もが機械翻訳に適した文の書き方をできるだけ短時間で効率 的に習得するためには、機械翻訳に適した文を作成するためのルールを学習 できるように整理する必要があると考える。 そこで、本研究の目的を以下のようにステップ化して、5つの小目的に分 ける。. ①山下らが示した「良い翻訳結果を得るためのルール集合」のそれぞれのル ールの習得難易度を調査し、効率良くルールを習得できるようにルールの整 理を行う。. ②自学自習で機械翻訳に適した書法ルールが習得できるように、機械翻訳に 適した書法ルール習得テキストの開発を行う。 ③テキストを用いて学習活動を行うことが可能であるか検証するため、中学 生・高校生・社会人を対象とし、テキストを用いた授業形式の実験を行う。 ④留学生に機械翻訳に適した文で手紙を書く実験:を行い、テキストが学習効 果をもたらすか検証する。. ⑤実験で行った往復翻訳後の文を、留学生の協力で評価してもらい、中間言 語の翻訳精度について検証する。. 1.4.2研究の方法 次に、本研究の方法について述べる。前項であげた小目的①に関して、山 下らの研究による「良い翻訳結果を得るためのルール集合」に示される70. のルールの中から、ICE 2002に頻出した19のルールを選び出す。この 19のルールを習得することができれば、誰でも機械翻訳に適した文を書く ことが可能であろうと思われる。しかし、ユーザに対してどのルールをどの タイミングで学習させれば最も効率的にルールが習得できるのかは明らか ではない。そこで、19のルールを効率良く習得できるように、ルールの習 得順序を整理する。その方法は、まず、19のルールそれぞれを習得するた 10.

(14) めの難易度を調査する予備実験を行うこととする。機械翻訳の使用が初めて の人にとっては、習得が容易なルールから学習することが最も効率的である と考えられる。そこで、この予備実験の結果を基に、最も効率良くルールが 習得できるようにルールの再編成を行う。 小目的②に関して、ルールの習得難易度を調査する実験の結果を基にして 自学自習で機械翻訳に適した書法ルールが学習できるようにテキストを開 発する。習得難易度を調査する実験の結果から、最も習得が容易であると思 われるルールから順に学習できるように、それぞれのルール獲得をねらいと する課題文を作成する。テキストの使用者は、これらの課題文を翻訳してい くことで、ルールを獲得できるように構成されている。 小目的③に関して、作成したテキストの効果を検証する実験を行う。誰で も機械翻訳に適した書法ルールを習得できることを検証するため、被験者は 社会人、中学生、高校生と、幅広い年齢層に対して行う。また、使用したシ ステムは、インターネットに接続されていれば誰でも使用可能であるYah oo!翻訳等の翻訳サイトを使用して実験を行う。実験は、テキストを用い. た自学自習形式で行うこととし、社会人は約1時間、中学生は90分間、高 校生は45分間の実験を行う。 小目的④に関して、テキストを用いた自学自習の後、留学生に対して手紙 を書く実験を行う。この手紙は、機械翻訳に適した文で書くこととする。被 験者が書いた手紙は、機械翻訳で韓国語に翻訳し、韓国人留学生の協力を得 て文の内容がどの程度伝わるか評価する。この手紙の内容が十分に留学生に 伝われば、テキストを使った自学自習によって書き換え作業をおこなうこと が可能であったと判断することができる。 小目的⑤に関して、本研究で行うルール習得難易度調査のための予備実験 及びテキストの効果検証実験の際に、被験者が翻訳した文を留学生の協力で 評価し、中間言語の評価を行う。この評価の結果、文の内容が留学生に伝わ れば、機械翻訳に適したルールを学習して書き換え作業を行うことによって、 機械翻訳を用いて意思疎通が可能であると判断することができる。. 11.

(15) 第2章書法ルール習得のためのテキストの作成 2.1書法ルールの精選 機械翻訳に適した文を作成するには、いくつかのルールが存在する。山下 らは「良い翻訳結果を得るためのルール集合」として、70程度のルールを あげている(山下ら2006)。ルールは「主語を明記する」といったように、 何をどうすべきかを明示したものや、「口語表現の回避」のように、どうし. てはいけないと警告しているものがある。もし、翻訳精度が限りなく10 0%に近い翻訳結果を得ようとするならば、山下らが示した70程度のルー ルの全てを習得する必要があるかもしれない。または、さらに多くのルール を習得する必要も生じるかもしれない。 松原は、5つの機械翻訳に適した文章作成法の教示及び往復翻訳・書き換 え作業の学習を行い、機械翻訳を介したコミュニケーションを行った。しか し、そこで高校生に呈示されたルールは5つのみであった。つまり、機械翻 訳に適した文を書くためには、山下らの示したルールの中で重要なものから 順に習得する必要があると思われる。山下らが行った実験においても、野村 らが実施した異文化コラボレーション実験(野村2003)に頻出した、特に. 機械翻訳に適した文に書き換える際に必要なルールとして19個のルール をあげている。. 本研究は、機械翻訳に適した書法ルールの習得をねらいとするテキストを 開発する。このテキストは、機械翻訳の利用経験がないユーザでも使用でき ることをねらいとする。機械翻訳の利用経験がないユーザに対して、70程 度のルールを全て呈示しても、すべてを習得することは容易ではない。機械 翻訳の利用経験がないユーザに対しては、特に重要なルールを精選し、その 中でも習得が容易なルールから学習することが最も効率的であると考える。 そこで、本研究では機械翻訳に適した書法ルールの中でも特に重要と思われ る、山下らが実験で用いた19個のルールを効率的に習得できるテキストを 開発する。. 次に、山下らの70のルールを表1から3にあげ、本研究でテキストを作 成するルールを下線で示す。山下らは70のルールをいくつかに分類してい る。分類は表1.単語に基づくルール、表2.文章に基づくルール、表3.表 現に基づくルールの3つである。まず、単語に基づくルール(表1−a)から2 つのルールが重要と考え、習得のためのテキストを作成する。. 12.

(16) 表1−a.良い翻訳結果を得るためのルール集合(単語に基づくルール). 日本語体系による分類 名詞に基づくルール. ルール集合 ・名詞の書き換え. ・複数の意味を持っため上手く翻訳されな い名詞を適切に書き換える 動詞に基づくルール. ・動詞の書き換え. ・正しい訳語が出ない動詞を適切に書き換 える ・動詞は名詞と解釈されないような形に書 き換える ・補助動詞を伴うと上手く翻訳されない 動詞を適切に書き換える 品. 形容詞に基づくルール. ・形容詞の書き換え. 詞. 助動詞に基づくルール 副詞に基づくルール. ・助動詞「で」の使用の回避. に. 基 づ. ・形容詞に書き換えられない副詞を削除. く. する. ノレ. i. ・副詞の削除. 接続詞に基づくルール. ノレ. ・文頭の接続詞は文末の述語句に係るように する. 間投詞に基づくルール 助詞に基づくルール. ・感動詞の使用は避ける ・助詞を明記する. ・格助詞を明記する. ・主格でない副助詞(係助詞)「は」の使用は 避ける ・助詞「で」の使用は避ける. ・話題提示の助詞「は」は、連用修飾句と同 じ扱いにする(ただし3つ以上の述語句 のある時は最後の述語句に係るものとす る). 単語に基づくルールは、品詞に基づくルールの他に、語の構成に基づくル ール・その他のルール(表.1−b)に分類されている。表。1−bその他のルー. ルからは2つのルールについてテキストを作成する。. 13.

(17) 表1−b.良い翻訳結果を得るためのルール集合(単語に基づくルール). 日本語体系による分類. ルール集合. 妻五 口口. の 構成. 熟語に基づくルール. ・熟語の使用を避ける. に. 基 づ く. 接頭語・接尾語に基づ くルール. ・接続表現の書き換え. ・システムにとっての未知語の使用を避ける ・正しい訳語が出ない外来語はアルファベット 表記する. ・無理な造語の使用を避ける ・一. そ の. 他 の ノレ. 1. ハ的な語句を用いる. ・日本文化特有の事物名の使用を避ける ・漢字を使用する ・同音異義語を持つ語句は漢字で書く ・漢宇表記可能な部分は漢字で書く ・多義語は一意に意味が特定できる表現に書き 換える. ノレ. ・冗長な表現をさける. ・不必要な語句は削除する ・削除してもその後の文の意味が変わらない 語句は削除する ・不必要な同一語句を削除する ・不必要な同義語は削除する ・綴りが正しいことを確認する. 単語に基づくルールにつづいて、文章に基づくルールがあり、文の構成に 基づくルール(表2−a)、その他のルール(表2−b)に分類されている。. 文の構成に基づくルール(表2−a)から5っのルールについてテキストを 作成する。その他のルール(表2−b)から4っのルールについてテキスト を作成する。. 14.

(18) 表2−a.良い翻訳結果を得るためのルール集合(文章に基づくルール). 日本語体系による分類 主語に基づくルール 述語に基づくルール. ルール集合 ・主語を明記する ・述語を明記する. ・不完全な文の文末に述語を補完する ・主述関係を明確にするため、文の途中に述語 を補完する. ・述語の書き換え. 文 の. ・動詞の書き換え. 構 成. ・形容詞・形容動詞の書き換え. に. 目的語に基づくルール. 基 づ. ・目的語を明記する. ・目的語を長くしない ・長い修飾語を付けない. く ノレ. 1 ノレ. 修飾語・被修飾語に基 づくルール. ・長い修飾語は適切な箇所で分割する ・連体修飾形を連用修飾形に変える ・修飾語は直近の述語、体言に係るようにする ・修飾関係は非交差の条件を満たすものとする ・修飾語の書き換え ・形容詞を副詞に変える ・感動詞の使用は避ける. 独立語に基づくルール. ・呼び掛けの使用は避ける. 15.

(19) 表2−b.良い翻訳結果を得るためのルール集合(文章に基づくルール). 日本語体系による分類. ルール集合 ・節と節との論理関係(原因、結果、目的、手段、. 条件など)を明確にする ・前節を、連体修飾語を含む副詞節に書き換える ・前節に形式名詞を挿入する ・句読点を適切な箇所に挿入する ・漢宇が連なり一つの語として解釈されてしまう ことを避けるため、語句の切れ目に読点を挿入する ・係り受けの関係が明確になるような箇所に読点 を挿入する そ の. 他 の. ・長い文を避け、短い文にする ・接続助詞を使用した長い文は、接続助詞の前後 で分割する. ノレ. 1 ノレ. ・連用中止を使用した文は、連用中止の前後で分 割する. ・文スタイルを変更する. ・箇条書きを避ける. ・名詞以外が並列した文章は避ける ・文法的でない構造は避ける ・単純な文法構造にする ・係りと受けを対応させる ・受動態は避ける. ・連用中止形を避け、適切な助詞を挿入する ・体言止めを使用しない. 文章に基づくルールにつづいて、表現に基づくルールがあげられている (表3)。表現に基づくルールから6っのルールについてテキストを作成す る。. 16.

(20) 表3.良い翻訳結果を得るためのルール集合(表現に基づくルール). 日本語体系による分類. ルール集合 ・曖昧な表現を避ける. ・具体的な表現に書き換える ・形式名詞「もの」「こと」「方」を具体的な表現に 書き換える. ・準体助詞を具体的な表現に書き換える ・語順を変えて係り受けを明確にする ・簡潔な文にする ・形式名詞「もの」「こと」「よう」「ところ」を削除 表 現 に. 基 づ く ノレ. 1 ノレ. する. ・副詞句表現の書き換え. ・複合的で、係り受け解析や適切な訳語の用意が困 難な副詞句は、簡潔な表現に書き換える ・文末表現の書き換え ・文末複合表現の書き換え ・使役+依頼の複合様相表現の書き換え ・口語表現の使用を避ける ・感情表現の使用を避ける ・慣用表現の使用を避ける ・スラング、方言の使用を避ける ・比喩の使用を避ける. ・独特の言い回しを避ける ・複雑な否定表現を避ける ・敬語表現は避ける. 以上の表から、本研究で考えるルールをまとめると表4が得られる。. 17.

(21) 表4本研究でテキスト作成する対象ルール ルール. 1)主語の明記. 11)腕曲表現の回避. 2)述語の明記. 12)曖昧表現の回避. 3)目的語の明記. 13)体言止めの回避. 4)漢字表記. 14)慣用表現の回避. 5)長文の分割. 15)受動態の回避. 6)格助詞の明記. 16)修飾関係は非交差条件を満たす. 7)不必要な同一語句の削除. 17)不完全分の回避. 8)節と節との論理関係の明確化. 18)副詞句表現の回避. 9)方言の回避. 19)動詞の書き換え. 10)目語表現の回避. 本研究では、この19のルールを最も効率的に学習できるように整理する ことにした。機械翻訳の使用経験が全くないユーザや、母国語の能力がやや 低いユーザでも機械翻訳に適した書法ルールを習得するためには、まず習得 が容易なルールから獲得し、徐々に習得が難しいルールを獲得することが望 ましいと考えられる。そこで本研究では、19のルールそれぞれの習得難易 度を調査する予備実験を行う。. 2.2課題文のねらいと作成方法 機械翻訳に適した書法ルールの習得方法として、ルールを文章にまとめて 呈示し、ルールの内容を説明するだけでは不十分であると考える。それは、 機械翻訳に適した日本語は、普段使用する自然な日本語とは異なるため、無 意識に訂正することが難しいからである。そこで、テキストにいくつかの課. 題文を呈示し、Web上の翻訳サイト(日韓翻訳)を利用して課題文を実際 に翻訳する実習形式でのルール習得を目指す。テキストのユーザは課題文を 翻訳し、往復翻訳を行って原文と折り返し文との比較を行う。その際、折り 返し文の意味が原文と違う場合には、原文の書き換えを行う。課題文と同時 に、機械翻訳に適した書法ルールを「書き換えのヒント」として呈示する。 テキストのユーザはこのヒントを参考にしながら書き換え作業を行うこと で、機械翻訳に適した文に書き換えることができる。このような実習形式の 学習を通して、ヒントに従って課題文の書き換えを行うことによって機械翻 18.

(22) 訳に適した文を作成できることを体験しながら、機械翻訳に適した書法ルー ルの習得を目指す。. テキストに呈示する課題文は、予備実験を行う時間の関係上、全部で21 間作成する。それぞれの課題文は、習得をねらいとするルールを1つもしく は2つ設定している。課題文1文に対して、習得をねらいとするルールが多 すぎると、書き換え作業の経験がないユーザにとっては書き換えが困難にな ると思われるため、課題文1文に対しては2つまでのルール習得をねらいと した。課題文は、あらかじめ機械翻訳を使って往復翻訳しても正しく往復翻 訳されないような文を意図的に作成する。テキストのユーザは課題文を正し く往復翻訳しようとした場合、一度往復翻訳を行い、往復翻訳と書き換え作 業を行うことによって、正しく往復翻訳される文に書き換える必要がある。 次に、実際に作成した課題文を例にあげ、課題分の作成方法と書き換え作 業について説明する。. 例1漢字表記ルール(4)を習得するための課題文 翻訳元言語が日本語の場合、正しく翻訳されるためには、漢字で書くこと が可能であれば、漢字表記することが望ましい。できる限り漢字で書ける表 現は漢字で書くことを意識させることをねらいとする。そのための課題文の 作成方法について次に述べる。 [課題文 例1]. 写真をどうふうしたので、ご確認ください。. 上の課題文は、機械翻訳を使って翻訳すると誤訳が発生する。課題文の作 成方法は、山下が行った書き換え実験に用いられた文や、Webページ・新 聞等を参考にして文を選び出した。選び出した文を、筆者が機械翻訳を使用 して往復翻訳を行い、意図的に往復翻訳文が原文と一致しないように一部の 単語や表現を書き換えて、課題文を作成した。例1の文では、「写真を同封 したので、ご確認ください。」という文を選び出し、往復翻訳を行った。す ると原文と折り返し文は一致する。しかし、「同封」をひらがなで入力して 往復翻訳を行うと、日韓日翻訳では誤った折り返し文が表示される。このこ とを利用し、ルール「(4)漢字表記」のルール獲得をねらいとする課題文 とした。. 次に、例1の課題文を韓国語に翻訳した文と、さらに往復翻訳を行った文 を示す。. 19.

(23) [韓国語文 例1] 入選1暑・判望洲剤銀立旦呈,重}剋司r三・醤入1皇.. [折り返し文 例1]. 写真をどんなに恥したので、確認してください。 上の韓国語文のように、どのような文でも、機械翻訳を使って翻訳すれば、 必ず翻訳結果が表示される。しかし、韓国語未習得の場合にはその韓国語が 正しいものかどうか判断することができない。そこで、折り返し文をみると、 下線部分が元の文と違う意味に誤訳されてしまっている。ここで、正しく書 き換える作業が必要となる。この課題文は、機械翻訳に適した書法ルールの 「(4)漢字表記」の習得をねらいとしている。この課題文では、「どうふう」. という単語が漢字で表記することができる。次に、「どうふう」を漢字表記 した場合の翻訳結果を示す。. [課題文 書き換え後 例1] 写真を同封したので、ご確認ください。 [韓国語文 例1] 入}萢含暑暑銀立旦呈,叫勉司手唱入1皇. [折り返し文 例1]. 写真を同封したので、確認してください。. 書き換え後の文を韓国語文に翻訳し、往復翻訳を行うと、原文をそのまま 翻訳した時と比べ、文の誤訳が解消されている。これは、ルール「(4)漢 字表記」を学習し、そのルールのもとで文を作成した結果である。また、課 題文の後半の「ご確認ください」が「確認してください」と往復翻訳されて いる。本研究においては、完全な翻訳精度に注目するのではなく、相手に文 章の内容を伝達することが可能であるかに注目するため、この程度の原文と 折り返し文の違いに関しては、正しく翻訳されたと判断することとする。次 に、他の課題文についてもいくつか説明を行う。 例2目的語の明記ルール(3)を習得するための課題文 [課題文 例2]. そのテレビが故障してしまったので、現在新しいのをつかっているんです。 [韓国語文 例2]. ユ 望司日レヨ・1 ヱを耳 司張立旦呈, 遇ス“ 川旦金 唄暑 朴甚司一エ 20.

(24) 銀告日叫.. [折り返し文 例2]. そのテレビが故障してしまったので、現在新しいことを使っています。. 課題文例2では、折り返し文を見ると、文章後半の「ことを」の部分の意 味が理解できないように翻訳されている。この課題文は、機械翻訳に適した 書法ルール「(3)目的語の明記」の習得をねらいとしている。普段の会話 などでは、それまでの会話の流れなどによって、目的語を省略する場合が多 い。実際に課題文例2は、日本語を習得していれば正しく意味を理解するこ とが可能である。しかし、機械翻訳で翻訳する場合、それまでの文章の流れ や、文章の背景などは考慮されないため、誤訳が発生する。次に、ルール「(3). 目的語の明記」を学習し、書き換えを行った例を示す。 [課題文 書き換え後 例2]. そのテレビが故障してしまったので、現在新しいテレビをつかっているんで す。. [韓国語文 例2]. ユ望司司週・1ヱを痔司i隷立旦呈,竜刈胡呈金望司日レヨ暑入ト暮苛エ 戴含月τ干.. [折り返し文 例2]. そのテレビが故障してしまったので、現在新しいテレビを使っています。 課題文に省略されていた、「テレビを」という目的語を明記するように書 き換えを行うと、正しく意味が理解できるように往復翻訳された。この課題 文においても、「つかっているんです」が「使っています」と往復翻訳され ているが、これも意味が理解できない程度の誤訳ではないため、正しく翻訳 されていると判断することとする。 例3方言の回避ルール(9)を習得するための課題文 [課題文 例3]. 忘れとった!今日英語のテストの日やん。 [韓国語文 例3] 喫(刈引餓叫!皇巻(コ明潮司ム三超せ01L}. [折り返し文 例3]. 忘れて酔った!今日英語のテストの日や。 21.

(25) 課題文例3では、方言が使用されている。そのため、課題文前半の「忘れ とった!」の部分が「忘れて酔った!」というように意味が大幅に変わって しまう誤訳が発生する。この課題文では機械翻訳に適した書法ルール「(9) 方言の回避」の学習をねらいとする。日常の会話では、それぞれの地域特有 の方言を使用する。しかし、正しい翻訳結果を得るためには、方言の使用は 避け、標準的な言葉で文章を書く必要がある。次に、「方言の回避」を学習 し、課題文の書き換えを行った場合を示す。 [課題文 書き換え後 例3]. 忘れていました!今日は英語のテストの日です。 [韓国語文 例3] 製エ銀飯宵月u}!下風{}(暮(日潮司ム豆9せ八目τ}.. [折り返し文 例3]. 忘れていました!今日は英語のテストの日です。. 課題文で使用されていた「とった」「やん」といった方言を「忘れていま した」「です」というように書き換えると、折り返し文は全く同じ文章の結 果が得られた。このように、方言は誤訳を招く原因の一つであるため、使用 を回避する必要がある。. 上記の3つの例文のように、山下が行った書き換え実験に用いられた文や Webページ・新聞等を参考にして文章を選び出し、意図的に原文と折り返 し文が異なる文章を筆者が作成した。作成した課題文は全21文である。表 5に、作成した21個の課題文を示す。作成した課題文は、予備実験を行う 都合上4つに分類した。これは、21文の課題文を一度に書き換えるには時 間がかかりすぎると思われたためであり、習得の難易度等とは関係がない。 また、表の右側に示されているのは、それぞれの課題文で学習するべきルー ルである。学習するべきルールは課題文1文あたり、1つか2つ設定されて いる。. 22.

(26) 表5.1ルール習得のための課題文と獲得ルール1. 課題文. 獲得ルール. ①写真をどうふうしたので、ご確認ください。. 4)漢字表記. ②そのテレビが故障してしまったので、現在新しいのをつか チているんです。. 3)目的語の明. L. ③私と私の弟は学生です。そして妹もです。. 2)述語の明記 T)長文の分割. ④今月は平年より気温が高めで、昨日は2度、今日は3度、 サして明日は4度最高気温が平年を上回る予報です。. 5)長文の分割. ⑤日本にはいないタイプのはいゆうだと思います。. 4)漢字表記. ⑥私が散歩をしているとき、前を歩いていた男の人が空き缶 投げ捨てるのを見て、暗い気持ちになりました。. 1)主語の明記 T)長文の分割. 表5.2ルール習得のための課題文と獲得ルール2 課題文. 獲得ルール. 6)格助詞の明. ①「お年寄りに、席譲りなさい!」. L. ②彼は締め切り日になるまで課題をしませんでした。結局締 ゚切りに間に合わず、その課題を提出できませんでした。. 8)節と節との. _理関係の明 m化. ③事務機器には、コピー、ワードプロセッサ、ファイルキャ rネットなどの機器も含まれる。. 7)不必要な同 鼬鼡蛯フ削除 8)節と節との. ④タイヤがスリップし、事故が起きた。. _理関係の明 m化. 23.

(27) 表5.3ルール習得のための課題文と獲得ルール3 獲得ルール. 課題文. ①忘れとった!今日英語のテストの日やん。 ②今日渋滞につかまっちゃって、学校に遅刻しちゃったよ。 ③このまま沈黙を通すべきか、それとも口を開くべきか。. ④熊本市生まれ。そのまま修復の道へ。東京芸大の保存学科. 9)方言の回避 10)口語表現の 14)慣用表現の 13)体言止めの. Rースを聴講。24歳のとき、夫と渡米。 12)曖昧表現の. ⑤以前買った本は読んじゃったので、今新しいのを読んでる です。. 避. P0)口語表現の. ⑥もし私が君なら、彼らにはアルファベットは27文宇であ. 11)娩曲表現の. 驍ニ教えるでしょうに。. 表5.4ルール習得のための課題文と獲得ルール4 獲得ルール. 課題文. 19)動詞の書き. ①幸福なことに、私は多くのすばらしい友人と巡りあうこと. キえ. ェできた。. P8)副詞句表現 フ回避i. ②学校の前で、僕は若い先生に、大きな声で元気に挨拶をし ス。. 16)修飾関係は. 交差条件を 桙スす. ③あなたは授業に出る必要はなし。代わりに、課題を来週ま ナに出すように。この連休は、しっかりと勉強しなさい。 ④今日は朝からしとしとと雨が降っていました。でも帰る頃 ノはすっかりやんでいたので、彼はうっかりかさを忘れてし ワいました。 ⑤体育の時間のマラソンで、彼はわざとゆっくり走っていま オた。何人かの友達も同じようにしていた。彼らはそれを先 カに見つかって、後でこっぴどく叱られました。 24. 17)不完全文の. 18)副詞句表現. フ回避 17)不完全文の 避. P8)副詞句表現. フ回避.

(28) 2.3書法ルール習得難易度調査のための予備実験. 2.3.1予備実験の概要 ルール習得の難易度を調査するための予備実験を行う。この実験の被験者. は、兵庫教育大学長瀬研究室の院生1名と学部生2名の合計3名である。被 験者の内、院生の1名は少しだけ機械翻訳を使った経験があり、学部生の2 名は機械翻訳の使用は初めてである。. 実験の方法は、被験者3名が機械翻訳を用いて表5の各課落文を韓国語に 翻訳する。この際、翻訳結果の韓国語が正しい文になっているかを確認する ために、往復翻訳を用いる。被験者は、往復翻訳によって得られた折り返し 文と入力した文を比較し、折り返し文に間違いが見られる場合には、入力文 の書き換えを行う。書き換えの後、再度往復翻訳を行い、入力文と折り返し 文の比較を行う。この作業を繰り返し、最終的に入力文、と折り返し文がほぼ 同じになったと被験者が判断すれヒば、翻訳作業が終了となる。課題文は全部. で21問呈示し、そのすべてについて翻訳作業を行う。しかし、全てを一度 に翻訳するには時間がかかりすぎると思われたため、実験は4回に分けて行 う。. 実験は2007年6月から8月の期間に行った。被験者の3名は、全4回 の実験を行う。1回の実験では前節で4っに分けた課題文の内の1つを翻訳 する。それぞれの被験者は別の時間に実験を行い、書き換えについて相談等 はできない状況で実験を行う。. 本実験では日韓翻訳ソフト高麗2007を用いるため、被験者は入力文を 入力するたけで翻訳結果の韓国語文と往復翻訳文を得ることができる。. 2.3.2予備実験の結果と分析 予備実験の結果について述べる。被験者は誰も1回の実験を30分から1 時間以内で終了することができた。被験者3名の書き換えた文については資 料に添付する。. まずは、書き換えによって得られた韓国語の文が正しい文になっているか 評価した。韓国語文の評価は、被験者が機械翻訳に適した書法ルールを習得 できたかどうかとは直接関係はない。本実験では、課題文の翻訳を行い、原 文と折り返し文の意味が一致すれば、正しく翻訳することができ、なおかつ ルールの習得ができたと判断することとする。しかし、被験者が原文と折り 返し文を比較し、正しく翻訳できたと判断した場合でも、韓国語(中間言語) 25.

(29) は正しい韓国語に翻訳されているとは限らない。そこで、留学生の協力で韓 国語(中間言語)の評価を行い、被験者行った翻訳によって作成した韓国語 はどの程度意味が通じるのか評価する。韓国人留学生の協力で、1文ずつ読 んでもらい、○(文が正しく意味が解る)、△(意味は解るが文に誤りがあ る)、×(意味が理解できない)の3段階で韓国語文を評価した。この結果 は以下の表6のようであった。. 表6韓国人留学生による韓国語文の評価 文の数. 評価. ○ 文章が正しく意味が解る. 31. △ 意味は解るが文に誤りがある. 30. × 意味が理解できない. 2. 評価の結果は、機械翻訳を用いて作成した韓国語文63文の内、96%に あたる61文が、「文章が正しく意味がわかる」あるいは「意味は解るが文 に誤りがある」との評価を得た。この結果により、山下らが作成した良い翻 訳結果を得るためのルール集合を用いて翻訳を行うことで、正しい翻訳結果 が得られることが解った。しかし、2文は「意味が理解できない」という評 価であったことから、機械翻訳の使用者が往復翻訳を用いて、入力文と折り 返し文がほぼ同意であると判断した場合でも、正しい韓国語に翻訳されてい ない場合も見られた。. 次に、被験者が行った書き換え回数に注目する。被験者3名が各課題文に 対して行った平均書き換え回数を表7に示す。. 26.

(30) 表7被験者3名の平均書き換え回数 問題. ヤ号. 問題. 平均書き換え回数. ヤ号. ①. 1.33. ②. 2. 第1回. 平均書き換え回数. ①. 2. ②. 3. 第3回. ③. 2.33. ③. 3.33. ④. 1.67. ④. 3.67. ⑤. 3. ⑤. 1.33. ⑥. 3.33. ⑥. 2. ①. 3. ①. 3. ②. 3.67. ②. 3.67. ③. 3. ③. 2. ④. 1.33. ④. 3.33. ⑤. 3. 第2回 第4回. 上の結果から、実験前の予想のとおり、それぞれの課題文ごとに書き換え 回数にばらつきがあった。つまり、それぞれの課題文には、書き換えやすい 文と書き換えにくい文章があることがわかった。. 2.4書法ルール習得のためのテキストの作成 ルール習得の難易度調査に関する実験の結果を基に、機械翻訳に適した書 法ルール習得のためのテキスト作成を行う。実験では、各課題文に書き換え 回数にばらつきが見られた。これは課題文に書き換えやすい文章と書き換え にくい文書があるということである。機械翻訳に適した書法ルールの習得を 効率良く行うには、書き換え回数が少ない順にルールの習得を行えばよいと 思われる。そこで、表7の被験者3名の平均書き換え回数を元に、書き換え 回数が少なかった順に、ルールの習得順編成を行う(表8)。. 27.

(31) 表8ルール習得順序 難易度. レベル1. 平均書き換え回数. 習得ルール. 1.33. ①漢字表記. 1.33. ②節と節との論理関係の明確化. 1.33. ③口語表現の回避. 1.33. ④曖昧表現の回避. L67 ⑤長文の分割. レベル2. 2. ⑥目的語の明記. 2. ⑦方言の回避. 2. ⑧二曲表現の回避. 2. ⑨不完全文の回避 ⑩述語の明記. 2.33. レベル3. レベル4. 3. ⑪格助詞の明記. 3. ⑫不必要な同一語句の削除. 3. ⑬副詞句表現の回避. 3. ⑭動詞の書き換え. 3.33. ⑮主語の明記. 3.33. ⑯慣用表現の回避. 3.33. ⑰受動態の回避. 3.67. ⑱体言止めの回避. 3.67. ⑲修飾関係は非交差条件を満たす. 実験の結果を元にルール習得順を整理すると上のようになった。この習得 順で効率良くルールを習得できるように、課題文を再編成し、テキストにま とめる。なお、テキストの構成上、ルールを習得が容易であると思われるも のから順にレベル1からレベル4に区切ることとする。テキストの内容は、 レベルごとに課題文が用意されており、テキストの使用者はこの課題文を機 械翻訳をつかって翻訳していくように構成されている。課題文の数は、レベ 28.

(32) ル1が5問、レベル2が5問、レベル3が5問、レベル4が4問とする。ま た、レベルごとに書き換えに関するヒントを用意しており、書き換えにつま ずいてしまった場合にはこれを参考にする。レベル1からレベル4までの課 題文をすべて書き換えることができれば、19個の機械翻訳に適した書法ル ールが習得できたと考えることができる。 次に、社会人対象・中学生対象・高校生対象実験で用いたテキストを示す。. 2.4.1社会人対象実験用テキスト 社会人対象用テキストは、問題用紙1から問題用紙4の4ステップに分けら れている。問題用紙1は5文、問題用紙2は5文、問題用紙3は4文、問題用 紙4は4文の問題文をそれぞれ、呈示する。課題文の他に、書き換えのヒント を呈示し、書き換えに行き詰まった場合には、ヒントを参考に書き換えること とする。次に社会人対象のテキストを示す。. 29.

(33) 問題用紙1. 0問題文1 次の問題文を機械翻訳を使って韓国語の文章にして下さい。その際、正しく 翻訳ができたと判断した日本語文を問題文の下に記入して下さい。また、正し い日本語文になるまで何回書き換え作業を行ったのかも記入して下さい。書き 換え作業が上手くいかない場合には、下の「書き換えのヒント」を参考にして 下さい。. ①写真をどうふうしたので、ご確認ください。. 回 ②タイヤがスリップし、事故が起きた。. 回 ③今日渋滞につかまっちゃって、学校に遅刻しちゃったよ。. 回 ④以前買った本は読んじゃったので、今新しいのを読んでるんです。. 回 ⑤私が散歩をしているとき、前を歩いていた男の人が空き缶を投げ捨てるのを 見て、暗い気持ちになりました。. 回 書き換えのヒント1. 以下の項目は、機械翻訳に適した文章に書き換える時のヒントです。書き換 え作業が上手くいかなかった場合には、このヒントを参考にして下さい。 ★漢字で書く。. 漢字で書ける部分は、漢字を使うようにします。. ★節と節との論理関係の明確化 2つ以上の節で構成される文では、節と節との論理関係(原因・結果・目 的・手段・条件など)を明確にします。. ★口語表現の回避 日常会話などに用いられる言葉の使用は避け、書き言葉を使います。. ★曖昧表現の回避 曖昧な表現ではなく、できるだけ具体的に表現します。. ★長文の分割 出来る限り長い文章は避け、短い文章にします。削除しても文章の意味が 変わらない語句は削除します。.

(34) 問題用紙2 0問題文2 次の問題文を機械翻訳を使って韓国語の文章にしてください。その際、正し く翻訳ができたと判断した日本語文を問題文の下に記入して下さい。また、正 しい日本語文になるまで何回書き換え作業を行ったのかも記入して下さい。書 き換え作業が上手くいかない場合には、下の「書き換えのヒント」を参考にし て下さい。. ①そのテレビが故障してしまったので、現在新しいのをつかっているんです。. 回 ②忘れとった!今日英語のテストの日やん。 回. ③もし私が君なら、彼らにはアルファベットは27文字であると教えるでしょ うに。. 回 ④あなたは授業に出る必要はなし。代わりに、課題を来週までに出すように。 この連休は、しっかりと勉強しなさい。. 回 ⑤私と私の弟は学生です。そして妹もです。 回. 0書き換えのヒント2. 以下の項目は、機械翻訳に適した文章に書き換える時のヒント(その2)で す。書き換え作業が上手くいかなかった場合には、このヒントを参考にして下 さい。. ★目的語の明記 目的語を省略しないようにします。また目的語を長くしないようにします。 ★方言の回避 方言の使用は避けます。 ★腕曲表現の回避. 比喩を使用したり、遠回しに言う表現は避けます。複雑な否定表現は避iけ ます。. ★不完全文の回避. 箇条書きは避けます。文法的でない構造は避けます。文法構造は単純な方 が良い。. ★述語の明記. 不完全な文の文末に述語を補完します。主述関係を明確にします。 31.

(35) 問題用紙3 O問題文3 上の書き換えのヒントを参考に、次の問題文を機械翻訳を使って韓国語の文 章にしてください。その際、正しく翻訳ができたと判断した日本語文を問題文 の下に記入して下さい。また、正しい日本語文になるまで何回書き換え作業を 行ったのかも記入して下さい。 ①「お年寄りに、席譲りなさい!」. 回 ②事務機器には、コピー、ワードプロセッサ、ファイルキャビネットなどの機 器も含まれる。 回. ③幸福なことに、私は多くのすばらしい友人と巡りあうことができた。 回. ④体育の時間のマラソンで、彼はわざとゆっくり走っていました。何人かの友 達も同じようにしていた。彼らはそれを先生に見つかって、後でこっぴどく叱 られました。. 回 書き換えのヒント3. 以下の項目は、機械翻訳に適した文章に書き換える時のヒント(その3)で す。書き換え作業が上手くいかなかった場合には、このヒントを参考にして下 さい。. ★格助詞の明記 助詞を明記します。. ★不必要な同一語句の削除 文中で同一語句や同義語が重複しないようにします。 ★副詞句表現の回避. 副詞の削除。形容詞に書き換えられない副詞を削除します。 ★動詞の書き換え. 正しい訳語が出ない動詞を適切に書き換えます。動詞は名詞と解釈されな いような形に書き換えます。 ★主語の明記 主語を省略しないようにします。. 32.

(36) 問題用紙4 0問題文4 次の問題文を機械翻訳を使って韓国語の文章にしてください。その際、正し く翻訳ができたと判断した日本語文を問題文の下に記入して下さい。また、正 しい日本語文になるまで何回書き換え作業を行ったのかも記入して下さい。書 き換え作業が上手くいかない場合には、下の「書き換えのヒント」を参考にし て下さい。. ①このまま沈黙を通すべきか、それとも口を開くべきか。 回. ②熊本市生まれ。そのまま修復の道へ。東京芸大の保存学科コースを聴講。2 4歳のとき、夫と渡米。. 回 ③学校の前で、僕は若い先生に、大きな声で元気に挨拶をした。 回. ④今日は朝からしとしとと雨が降っていました。でも帰る頃にはすっかりやん でいたので、彼はうっかりかさを忘れてしまいました。. 回 えのヒント4 以下の項目は、機械翻訳に適した文章に書き換える時のヒント(その4)で す。書き換え作業が上手くいかなかった場合には、このヒントを参考にして下 さい。. ★慣用表現の回避 慣用表現の使用は避けます。 ★受動態の回避 受動態の使用は避けます。. ★体言止めの回避 体言止めは使用しない。. ★修飾関係は非交差条件を満たす 修飾語は直近の述語句、体言に係るようにする。長い修飾語は使用しない。. 33.

(37) 2.4.2中学生対象実験用テキスト 中学生対象用テキストは、実験の時間の関係上、「韓国語に翻訳しよう1」. と「韓国語に翻訳しよう2」の2段階に分ける。それぞれ課題文を8文ずっ と書き換えのヒントを呈示する。「韓国語に翻訳しよう1」はレベル1とレ ベル2の課題文から選び出し、「韓国語に翻訳しよう2」はレベル3とレベ ル4の中から課題文を選び出す。次に、中学生対象用テキストを示す。. 韓国語に翻訳しよう1 下に書いてあるのは、機械翻訳で韓国語に翻訳する時のヒントです。このヒ ントを使えば、韓国語を知らない人でも、韓国語の文章を作ることができます。 それでは、ヒントを見てみましょう。 ☆☆☆☆☆ヒント☆☆☆☆☆ 7.漢字石書画う。. 漢字で書けるものは、漢字で書きましょう。ひらがなばかりの文章だと、正 しく翻訳されないことがあります。 2.話し言葉13=使わない。. 友達と話している時に使うような言葉は、正しく翻訳するのが難しいのです。 本に書いてある文章のような書き方をしましよう。 3.曖昧な表現信=使わない。. できるだけ具体的に、はっきりとわかるような書き方をしましよう。 4.難しい表現1さ使わない。. 比喩などの難しい表現は、翻訳するのがとても難しいのです。簡単な文章を 書くことが大切です。 5.長すぎる文章iさだのでiす。. 1つの文章が長すぎると、翻訳する時に混乱してしまいます。「。(句点)」を 使って、短くてわかりやすい文章にしましよう。 6.方言πδ=使わない。. 関西弁や、その他の方言は、正しく翻訳されません。NHKのアナウンサー の人が話しているような言葉で書いてみましょう。 7.目的語を信ぶかない。. 目的語ははぶかないようにしましよう。 8.述語を1さぶかない。. 述語ははぶかないようにしましよう。 34.

(38) 翻訳にチャレンジ川 氏名 それでは、いよいよ翻訳にチャレンジです。下の文章を翻訳してみましょう。 うまく翻訳できるでしょうか?. 1. 写真をどうふうしたので、ご確認ください。. 回 2。タイヤがスリップし、事故が起きた。 回. 3.今日渋滞につかまっちゃって、学校に遅刻しちゃったよ。 回. 4.前買った本は読んじゃったので、今新しいのを読んでるんです。 回. 5.そのテレビが故障してしまったので、現在新しいのを使ってるんです。 回. 6.忘れとった!今日英語のテストの日やん。 回. 7.私と私の弟は学生です。そして、妹もです。 回. 8.私が散歩をしているとき、前を歩いていた男の人が空き缶を投げ捨てるの を見て、暗い気持ちになりました。 回. 35.

参照

関連したドキュメント

現実感のもてる問題場面からスタートし,問題 場面を自らの考えや表現を用いて表し,教師の

長尾氏は『通俗三国志』の訳文について、俗語をどのように訳しているか

長尾氏は『通俗三国志』の訳文について、俗語をどのように訳しているか

チューリング機械の原論文 [14]

問題集については P28 をご参照ください。 (P28 以外は発行されておりませんので、ご了承く ださい。)

難病対策は、特定疾患の問題、小児慢性 特定疾患の問題、介護の問題、就労の問題