• 検索結果がありません。

マルチエージェントシステムグループの研究計画

N/A
N/A
Protected

Academic year: 2021

シェア "マルチエージェントシステムグループの研究計画"

Copied!
10
0
0

読み込み中.... (全文を見る)

全文

(1)

言語グリッド

言語グリッドは、機械翻訳サービスと、ユーザが作成した辞書サービスや用例対 訳サービスを連携させることができるため、利用現場に応じた、精度の高い翻訳結 果が得られます。 言語グリッドを実現しているソフトウェアは、独立行政法人情報通信研究機構 (NICT)言語グリッドプロジェクトによって2006年4月から研究開発され、オープン ソースソフトウェアとして公開されています。大学、研究機関、企業、非営利団体は このソフトウェアを用いて言語グリッドを運営し、多言語環境を構築することができま す。 実際、公開されたソフトウェアを用いて、京都大学情報学研究科社会情報学専 攻が、2007年12月より非営利利用及び研究利用を対象に言語グリッドの運営を 行っています。 言語グリッドには、3種のステークホルダー (利害関係者)が存在します。 言語グリッド運営組織 (http://www.langrid.org/operation/) 言語グリッドユーザを管理し、言語資源や計算資源を運用する組織です。 言語資源提供者 機械翻訳や形態素解析、専門分野の辞書、 用例対訳などの言語資源を言語 グリッドに提供する組織です。

(2)

言語グリッドの機能

京都大学が実際に運営している言語グリッドを例にとって説明していきましょう。 言語グリッドに参加している研究機関や大学は、言語資源(辞書、用例対訳、機械翻 訳など)を無料で提供しています。言語資源の提供に際しては、言語資源のプロファイ ルに、著作権情報やライセンス情報を指定できます。また、言語資源へのユーザのアク セス制限を設定できます。 現在、中国科学院、イタリア国立研究所、ドイツ人工知能研究所、シュツットガルト大学、 国立情報学研究所、NTTコミュニケーション科学基礎研究所、アジア防災センターなど が言語資源を提供しています。 利用できる言語資源には、機械翻訳(日本語、中国語、韓国語、英語、ドイツ語、スペ イン語、フランス語、イタリア語、ポルトガル語)や辞書(生命科学、防災、学術、概念辞 書)、用例対訳(医療、教育)などがあります。 提供された計算資源を用いて、国内外の教育機関やNPOが中心となり、防災、教育、 医療など、様々な分野で言語の壁を越える活動が始まっています。 つまり、言語グリッドは、世界中の言語資源、 計算資源を共有し、国際交流や多文化 共生活動を支援する仕組みです。

(3)

言語資源から言語サービスへ

これまで辞書や機械翻訳などの言語資源は、CD/DVDなどの媒体にデータとして格納 されていました。このため、利用者は言語資源のセットアップやメンテナンスが必要であり、 提供者は知財保護の対策が必要でした。 言語グリッドは言語資源のユーザビリティやアクセシビリティを向上させるために、言語 サービスの共有を可能にしています。そのために、言語資源を標準のWebサービスの形 に整えます。これをラッピングと呼びます。Webサービスにすることで、Webを閲覧できる 環境であれば、世界中のどこでも言語サービスが利用できるようになります。 言語資源をサービス化することで、利用者は他の言語サービスと連携させることができ るようになります。提供者は言語資源の著作権を保持したままサービスの提供が可能と なります。利用者の言語サービスへのアクセスに制限を設けることもできます。 例えば、辞書のデータをラッピングし辞書サービスとすることで、利用者は入力した単 語の訳語を得ることができます。 機械翻訳ソフトウェアをラッピングし機械翻訳サービスとすることで、利用者は入力文を 翻訳することができます。 さらに、翻訳者をラッピングし翻訳者サービスとすることで、機械翻訳サービスよりもより 高品質の翻訳結果を得ることができます。

(4)

機械翻訳を使う

言語グリッドでの機械翻訳とインターネットの翻訳サイトとの大きな違いは、ユーザによ る翻訳品質の改善ができることです。 まず、登録された用例対訳を用いて翻訳を行えます。例えば、川崎市教育委員会の 用例対訳が登録されているとします。ユーザが原文を入力すると、その入力文に近い登 録された用例がいくつか表示されます。ユーザの意図した文がその中にあれば、用例対 訳を用いた正確な翻訳結果を得ることができます。 適当な用例がない場合には、機械翻訳が行われます。その場合にも、ユーザの登録 した辞書を用いて翻訳の改善が行われます。例えば、学校用語の辞書があれば、その 辞書を用いて機械翻訳の結果が改善されます。 また、機械翻訳は英語がハブとなることが多いです。例えば日本語からポルトガル語 への翻訳は、まず日本語から英語へ翻訳し、さらにポルトガル語に翻訳されます。こうし たマルチホップ翻訳や、折り返し翻訳など、複数の機械翻訳を用いた言語サービスが実 現できます。 これらの特長は、言語グリッドが様々な言語サービスを自由に組み合わせて提供でき ることによるものです。

(5)

言語グリッドのサービス階層

言語グリッドのサービスは、4つの階層から成ります。 P2Pグリッド基盤 インターネット上の複数のサーバを連携させ、 利用者のサービス要求に応える サービス基盤です。利用者は、 サーバをP2Pグリッド基盤に追加することがで きます。また利用者は、提供したサーバや言語資源の利用状態を言語グリッド サービスマネージャで確認することができます。 言語資源 多くの言語資源が、標準インタフェースを持つWebサービスとして提供されま す。利用者が言語資源を追加することもできます。 言語サービス 言語資源をラッピングしたWebサービス群を、ワークフローを用いて連携させま す。 折り返し翻訳, 専門翻訳などの言語サービスが用意されています。利用者 が言語サービスを追加することもできます。 異文化コラボレーションツール 多言語環境でコミュニケーションを支援するツール群で、 各種の言語サービス を利用して開発されます。 NICTや 大学で開発されたツールや、既存のツー

(6)

P2Pグリッド基盤

P2Pグリッド基盤は、世界各地のサーバをつなぎ、インターネット上の言語資源 を連携させることを目標としています。言語グリッドは2種のサーバ(コアノードと サービスノード)から構成されます。 言語グリッドコアノード 全ての言語サービスを管理し、言語サービスの検索機能と連携機能を提供 するサーバです。言語サービスに対応するワークフローに従って,、構成要素と なる他の言語サービスを呼び出します。 言語サービスの登録情報を全てのコアノードで共有し、 アクセスするコア ノードに関わらず同等のサービスを提供します。また、 各言語資源に対するア クセス制御を行います。 言語グリッドサービスノード 言語資源をWebサービスとして配備し、単機能のサービス(原子サービス)を 提供するサーバです。

(7)

言語資源

言語グリッドを構築するためには、インターネット上の様々な言語資源, 言語処 理機能をWebサービス化(ラッピング)する必要があります。 そのためには機械翻訳や辞書などのインタフェースを標準化する言語サー ビスオントロジーが必要です。言語グリッドプロジェクトは、ドイツDFKI、 イタリア CNRと共同でその開発を進めています。 言語グリッドアソシエーション(http://www.langrid.org/association/)では、 言語サービスオントロジーに基づくラッピングマニュアルを用意しています。 現在、利用できる言語資源は下記の通りです. 機械翻訳:(日本語, 中国語)(日本語, 韓国語)(日本語, 英語)(英語, ドイ ツ語)(英語, スペイン語), (英語, フランス語)(英語, イタリア語)(英語, ポルト ガル語) 形態素解析:日本語, 中国語, 韓国語, 英語, ドイツ語, スペイン語, フランス 語, イタリア語, オランダ語, ロシア語, ブルガリア語 対訳辞書:生命科学(日本語, 英語), 防災(日本語, 中国語, 韓国語, 英語, フランス語, スペイン語), 学術全般(日本語, 英語)

(8)

言語サービス

言語グリッドで利用できる言語サービスは以下の通りです。 原子サービスは言語資源に対応するWebサービスです。 対訳辞書、用例対訳、機械翻訳、形態素解析など。 複合サービスは高度な機能を提供するためのもので、原子サービスを連携 させるワークフローで記述されます。 専門翻訳、折り返し翻訳など。 言語グリッドは、異文化コラボレーションツールのための多言語サービスを提供 します。 例えば、専門用語を含む文章の翻訳は、複合サービスとして実現できます。 実際には、機械翻訳、形態素解析、専門用語辞書などの複数の原子サービス を組み合わせて実現します。 言語グリッドでは、ワークフローの記述にBPEL4WSを用います。ワークフ ローはBPELエンジンによって解釈実行され、ワークフローを構成するWeb サービスを順次呼び出します。

(9)

異文化コラボレーションツール

異文化コラボレーションツールとして、NICTでは言語グリッドToolboxを開発して います。言語グリッドToolboxは、Webブラウザからご利用いただけます(お試しサイ ト: http://langrid.org/tools/toolbox/)。また、サービスグリッドオープンソースプロジ ェクトで開発が進められており、コミュニティサイト(http://servicegrid.net/oss-project/)では、誰でも要望を挙げたりソースコードを入手して開発に参加することが できます。 言語グリッドToolboxでは、言語グリッドを用いた多言語コミュニティを支援するた めの各種のツールを提供しています。代表的な機能に、以下があります。 テキスト翻訳 入力されたテキストを翻訳します。折り返し翻訳機能により、翻訳結果を再度入力 言語に翻訳し直すことで、翻訳の品質を推定できます。また、対応する文章はハ イライトされます。 多言語掲示板 投稿した文章が多言語に翻訳されます。ユーザは自分の母言語で投稿を読むこ とができます。また、機械翻訳の結果をコミュニティのユーザで相互に修正し、よ りよい翻訳結果を蓄積していくことができます。 多言語対訳辞書 コミュニティ専用の多言語対訳辞書を作成し、機械翻訳と連携することで翻訳品

(10)

言語グリッドのアジア展開

2011年1月より、タイ国立研究所(NECTEC)がバンコクオペレーションセンターを開設 し、東南アジアでの運営を開始しました。また、これに伴い、京都オペレーションセンター はバンコクと言語グリッドの連邦制運営を開始しました。 連邦制運営により、京都に登録されている51言語106サービスと、バンコクに登録され ている13言語20サービスが共有され、相互に利用可能となりました。 バンコクオペレーションセンターには、多様なアジア言語のサービス(概念辞書(インド ネシア語、韓国語、スーダン語、シンハラ語、タイ語、ネパール語、日本語、ヒンディ語、 ベトナム語、ベンガル語、ミャンマー語、モンゴル語、ラオス語)、機械翻訳(英語-タイ語、 タイ語-ラオス語)、形態素解析(タイ語)、音声合成(タイ語))が登録されています。 言語グリッドの基盤ソフトウェアはオープンソースソフトウェアとして公開されており、ま た覚書も言語グリッドが運営される国の法令に準拠するため、連邦制運営の国際展開が 容易です。 今後は、多様なアジア言語のサービスを登録していくとともに、EUや米国のNSF (National Science Foundation)の言語資源プロジェクトと連携し、言語グリッドの世界 展開を計っていきます。

参照

関連したドキュメント

The complexity of dynamic languages and dynamic optimization problems. Lipschitz continuous ordinary differential equations are

しかし,物質報酬群と言語報酬群に分けてみると,言語報酬群については,言語報酬を与

Guasti, Maria Teresa, and Luigi Rizzi (1996) "Null aux and the acquisition of residual V2," In Proceedings of the 20th annual Boston University Conference on Language

関西学院大学手話言語研究センターの研究員をしております松岡と申します。よろ

②上記以外の言語からの翻訳 ⇒ 各言語 200 語当たり 3,500 円上限 (1 字当たり 17.5

今回の調査に限って言うと、日本手話、手話言語学基礎・専門、手話言語条例、手話 通訳士 養成プ ログ ラム 、合理 的配慮 とし ての 手話通 訳、こ れら

手話言語研究センター講話会.

本センターは、日本財団のご支援で設置され、手話言語学の研究と、手話の普及・啓