• 検索結果がありません。

A Study on Machine Translation System from Japanese to Sinhalese on MT Engine Jaw

N/A
N/A
Protected

Academic year: 2021

シェア "A Study on Machine Translation System from Japanese to Sinhalese on MT Engine Jaw"

Copied!
5
0
0

読み込み中.... (全文を見る)

全文

(1)

Title

A Study on Machine Translation System from Japanese to

Sinhalese on MT Engine Jaw( 内容の要旨(Summary) )

Author(s)

Samantha, Thelijjagoda

Report No.(Doctoral

Degree)

博士(工学) 甲第303号

Issue Date

2006-09-13

Type

博士論文

Version

URL

http://hdl.handle.net/20.500.12099/21443

※この資料の著作権は、各資料の著者・学協会・出版社等に帰属します。

(2)

氏名(本籍)

学 位

の 種 類

学位授与番号

学位授与日付

学位論文題目

学位論文審査委員

SamanthaThelijjagoda(スリランカ)

士(工学)

甲第 303 号

平成18

年 9 月13 日

電子情報システム工学専攻

AStudyonMachineTranslationSystemfromJapanesetoSinhaleseon MTEnglne。ねⅣ

(機械翻訳エンジンゐⅣによる日本語からシンハラ語への機械翻訳シス

テムに関する研究)

(主査)教

(副査)教

速 水

論文内容の要旨

This dissertation describes a machine translation systemfromJapanese to

Sinhalese(ThenationallanguageofSriLanka).ThesystemnamedJaw/Sinhalesehas

beendevelopedontheMTenglneJawasapilotmachinetranslationsystem.Thisisthe

fitstJapanese-Sinhalese MT attempt.W6prppose a method ofanalysisfor Sinhalese

moq)hologicalstructure(btLt2Se由ustructure),WhichsharesfeatureSWithJ叩aneSe,and

make aninvestigationintocontrastivenessbetweenSinl1aleseandJapanese.Then,We PrOPOSetranSlationsolutionsforJapanesefunctionwordsa氏erpredicate$andnouns.200 0fJapaneseshortsamplesentencesweretranslatedintoSinhalesebyJaw/Sinhaleseand itse飴ctivenessisconfirmed.

JapaneseandSinhalesearetypologicalレclassifiedasSOVlanguagesandbothare

agglutinativelanguages.Japanesehas

bzmse由uOapanesebasiclmguisticuniti)that

COnSists of a content word with one or more function words.Sinhalese also has

bunseisLTlikeunits,andfortheeaseofcomparison,theywillbereferredtoasSinl1alese ムαββe由は

SinhalesebtLnSetSuStruCturehasnotyetbeen叫investigatedespeciauyforthe

VleWPOintofmachineprocesslng.WeproposeamethodtoanabTZetheSinhalesebLZnSetSu

(3)

structureformachinetranSlations.Morethan20kindsofverbiI通ectionwords(baseparts

of the verb

bLLt7Se由Li)are

defined and a set offunction words thatfonowsthemis

reorgamized.Likewise,forthe caseinflection word ofa noun,a neW Organization of

functionwordsisproposed.Thecaseinflectionisformedbyacombinationofanounbase andafunctionwordforcasemarking.27functionwordsareisolatedforcasemarking.

Since Sinl1alese and Japanese are so similar,inma叩CaSeS there are

One-tO-OneCOrreSpOndencesbetweenJapaneselbunse由uandSinhalesebumwtgu.Butat thesametime,thesecorrespondencesarenotperfect.ThetranslationofJapanesecase

markers into Sinhaleseis ambiguous;thatis,OneJapanese case marker often

COrreSPOndstoseveralSinhalesecasemarkers.Forexample,theJapanesecasemarker

"を,,(椚丸whichisusuanyusedtoindicatethedbjectcase,COrreSpOndsto18casemarkers

in

Sinl1alese(b(td,鑑∂(haid,蝉(IⅥ血td,8(Ti),感)(AI遍,守成)(nII房,dd(eLi),盛d(丘iTカ,

モ鳩d(適,q感(適い減(e凰包(∂,e庖(適,m(亜,0,(耶乙娩申(血∠或年ぬ(郡励8).we

PrOpOSeamethodtodisambiguatethecorrespondencebyusingbase・tyPerules,Whichare

dependentonthe払ctthatthecaseframepatternofaverbbasicauydetermines case markers.

OneJapanese function word after a predicate often a飴cts morethan one

expressionelementinaSinhalesesentence.Forexample,theJapanesefurutionword

"【食ノ勺たい([tabdtab",Whichexpresses"hope/eagerness"onthepartofthesutject,i$

translatedinto"8(td","kDd25)bd],,,and`辱知批感(awashyayai)"(afterasu切ect,an

inflectedverb,and after a

verb)in

a Sinhalese semience.We soke this problem by

describingthetranslationrulesinatableformat. The first stage ofthe

eh耶伽ahM SyStem prOCeSSeS the translations of

PrOPOSitionalcontent.Theclarificationofcasemarkercorrespondenceishandledinthis Stage.Thesecondstagecoversthetranslationoftenseandmodality,Whichareexpressed

byfunctionwordsa氏erthepredicateinJapanese.Toverifytheavanabilityofoursystem,

200JapaneSe SamPle sentences were evaluated.The results show our approachis

acceptablewithinmachinetranslations.

(4)

-5-論文審査結果の要旨

本論文は、日本語からシンハラ語(スリランカの国語)への機械翻訳システムに関する研究

について述べたものである。機械翻訳の研究の多くは英語やフランス語、ドイツ語あるいは日

本語など、先進諸国語間の翻訳に関する研究がほとんどで、アジアの開発途上国の言語が対象

とされることはほとんどなかった。アジア諸国の今後の発展、これらの国を含む今後の地球規

模でのITの普及を踏まえると、英語がすべてという発想は短絡的であり、小さな言語を対象

とする研究も重要となってくることは明らかである。本研究はそのような分野への挑戦として

評価できる。

論文は8章からなり、1章は序論、8章は結論であり、2章では機械翻訳琵術の歴史につい

て述べ、3章ではシンハラ語と日本語の言語構造上の特徴について論じている。4章では本研

究で用いている機械翻訳エンジンJ加町について述べている。ぬⅣは申請者の所属する研究室

で開発されている機械翻訳エンジンであり、これを用いて日本語から任意の言語への機械翻訳

システムを構成することが出来る。

5章から7章が本研究の成果について述べている部分である。5章は申請者が機械翻訳エン

ジンehwの上に開発した日本語-シンハラ語機械翻訳システムehwISinl1aleseについて述べ

ている。亡ゐⅣはオブジェクト指向言語のパラダイムを利用した設計になっており、

ehwISinhaleseを開発するためにはシンハラ語を表現するためのクラスとそのメンバーを設計

し、またオブジェクトのメンバーを線状化してシンハラ語を生成するための線状化関数を設計

しなければならない。申請者はシンハラ語の言語構造を分析してそれらを設計し、

亡hfdSinhaleseのパイロットシステムを構築している。シンハラ語の言語構造については十分

な研究資料もなく、手探りしながら作り上げた貴重なパイロットシステムである。

6章では亡ゐ扉S血aleseで用いているシンハラ語の文節構造に関する処理について述べてい

る。シンハラ語は日本語と同じく膠着語に属し日本語と同様の文節構造を持つが、シンハラ語

で文節という概念は乏しく十分な分析はなされてきていなかった。6章では、シンハラ語の格

助詞を機械処理を念頭において整理しなおし、名詞と格助詞が接続する際の連音変化をリンキ

ングルールとして規則化している。また、名詞に後接する機能語、動詞に後接する機能語につ

いて機械処理のための体系的な分析・整理を行っている。

7章では日本語の機能語(名詞に後接する格助詞その他の機能語、動詞に後接して態や時制、

肯否、話者の判断、接続関係などを表現する機能語)で表現される事柄をシンハラ語に翻訳す

るための対応規則について分析し、機能語の翻訳規則としてまとめ上げ。ね扉Si血deseに実装

している。日本語の格助詞とシンハラ語の格助詞は1対多の関係にあるが、その多義性につい

て分析し、ehwISinhaleseの命題翻訳規則のうちのBasic籾e・Ruleでその多義性を解決でき

ること、しかしシンハラ語の現象である性や数、定/不定によって生じる変化にはいまのところ

対応できないこと、などを述べている。動詞後接の機能語については、ゐⅣの機能語翻訳規則

の仕組みでおおむね対応を規則化できることを述べている。またこの章では翻訳実験について

も述べており、用言後按機能語を含む200文についての翻訳実験で72%の精度であったことを

述べている。ただし、パイロットシステムの段階であり翻訳辞書の規模は小さいので、そのよ

(5)

うな段階での精度評価にあまり大きな意味をもたせることは出来ない。

シンハラ語は言語的にも分析が進んでいない面も多く、機械翻訳の対象としては全く未開拓

の領域であった。本研究はそのような領域に挑戦したものであり、アジアの言語の機械処理研

究に目を向けさせる研究としても評価できる。本研究の結果は、スリランカの学会誌に査読付

き論文として発表されており、シンハラ語を母語とするコミュニティでも評価されている。・

よって、本論文は博士(工学)の論文として十分価値あるものと判断した。

最終試験結果の要旨

この論文の主要な部分は査読付き論文2編に採録されており、この論文が学位論文として完

成された内容を有することを確認した。また公聴会を開き審査を行った結果、審査委員会にお

いて最終試験に合格と判定した。

参照

関連したドキュメント

なお︑この論文では︑市民権︵Ω欝窪昌眞Ω8器暮o叡︶との用語が国籍を意味する場合には︑便宜的に﹁国籍﹂

友人同士による会話での CN と JP との「ダロウ」の使用状況を比較した結果、20 名の JP 全員が全部で 202 例の「ダロウ」文を使用しており、20 名の CN

C−1)以上,文法では文・句・語の形態(形  態論)構成要素とその配列並びに相互関係

始めに山崎庸一郎訳(2005)では中学校で学ぶ常用漢字が149字あり、そのうちの2%しかル

この 文書 はコンピューターによって 英語 から 自動的 に 翻訳 されているため、 言語 が 不明瞭 になる 可能性 があります。.. このドキュメントは、 元 のドキュメントに 比 べて

単発持続型直列飛石型 ︒今 対缶不l視知覚

単発持続型直列飛石型 ︒今 対缶不l視知覚

長尾氏は『通俗三国志』の訳文について、俗語をどのように訳しているか