• 検索結果がありません。

JAIST Repository: 琉日機械翻訳のための対訳コーパスの自動拡張について

N/A
N/A
Protected

Academic year: 2021

シェア "JAIST Repository: 琉日機械翻訳のための対訳コーパスの自動拡張について"

Copied!
49
0
0

読み込み中.... (全文を見る)

全文

Loading

図 1.1: 琉球方言の分類 の手法を琉日統計的機械翻訳に応用した研究例も存在する.しかし,その先行研 究では,自動生成した対訳文候補の文の品質については考慮していないため,不 自然な対訳文が対訳コーパスに含まれる可能性が高いという問題があった.論文 で報告されている実験でも,琉日機械翻訳の精度は決して高いとは言えなかった. 1.2 目的 本研究は,低言語資源の言語である琉球方言(沖縄方言)を機械翻訳の対象と し,琉球方言から日本語への統計的機械翻訳の精度を向上させる手法を提案する. 具体的には,少量の琉日
図 2.2: アラインメントの例 表 2.1: フレーズテーブルの例 ぐすーよー みな 1 0.5 1 0.6 はじみてぃ はじめまして 1 0.3 0.4 0.5 うぅがなびら 様 0.35 0.2 0.4 0.3 フレーズベースの SMT では,原言語の文 f が I 個のフレーズ (f 1 , · · · , f I ) に分割 される.各フレーズ f i が目標言語のフレーズ e i に翻訳されるとき,翻訳モデル確 率 P (f | e) は,式 (2.5) に示すように,フレーズ翻訳確率 ϕ(f
図 3.5: 対訳文候補の生成例(対訳辞書の単語が 1 文中に複数回出現する場合) • 1 行目は,初期の対訳コーパス I の i 番目の対訳文 (s i , t i ) と対訳辞書 D が入 力として与えられることを表す. • C i は i 番目の対訳文から生成される対訳文候補の集合を表す. 2 行目は,こ の初期値を空集合としている. • 3 行目は,対訳辞書 D に含まれる単語対 (w s j , w j t , p j ) それぞれに対して, 4 行 目からの処理を行うことを表す. • 4 行目は
図 3.6: 琉日 SMT フローチャート 表 3.1: 琉日 SMT で使用するツール 名称 役割 Moses 統計的機械翻訳器(デコーダ) KyTea (京都テキスト解析ツールキット) 形態素解析ツール GIZA++ アラインメントツール KenLM 言語モデル作成ツール 図 3.7: 単語分割の例
+7

参照

関連したドキュメント

長尾氏は『通俗三国志』の訳文について、俗語をどのように訳しているか

We construct a Lax pair for the E 6 (1) q-Painlev´ e system from first principles by employing the general theory of semi-classical orthogonal polynomial systems characterised

If f (x, y) satisfies the Euler-Lagrange equation (5.3) in a domain D, then the local potential functions directed by any number of additional critical isosystolic classes

The definition of quiver varieties was motivated by author’s joint work with Kronheimer [8], where we identify moduli spaces of anti-self-dual connection on ALE spaces

[11] Karsai J., On the asymptotic behaviour of solution of second order linear differential equations with small damping, Acta Math. 61

The idea of applying (implicit) Runge-Kutta methods to a reformulated form instead of DAEs of standard form was first proposed in [11, 12], and it is shown that the

Key words and phrases: Quasianalytic ultradistributions; Convolution of ultradistributions; Translation-invariant Banach space of ultradistribu- tions; Tempered

Left: time to solution for an increasing load for NL-BDDC and NK-BDDC for an inhomogeneous Neo-Hooke hyperelasticity problem in three dimensions and 4 096 subdomains; Right: