• 検索結果がありません。

アマルナ文書の電子化―文字研究・言語研究を目指して―

N/A
N/A
Protected

Academic year: 2021

シェア "アマルナ文書の電子化―文字研究・言語研究を目指して―"

Copied!
7
0
0

読み込み中.... (全文を見る)

全文

(1)Vol.2013-CH-99 No.6 2013/8/3. 情報処理学会研究報告 IPSJ SIG Technical Report. アマルナ文書の電子化 —文字研究・言語研究を目指して— 高橋 洋成1,a). 概要:本報告は,紀元前 14 世紀のエジプトとパレスチナとの間でやり取りされた書簡(アマルナ文書)の 電子化について,これまでの経緯,現状および将来の展望について報告する.具体的には,TEI/XML を 利用して画像・文字・翻字・言語解釈の各データを有機的に関連付ける方法と,作成されたデータを開か れた言語研究のネットワーク(LLOD)に参加させていく必要性について述べる.. Digitalization of Amarna Letters —Towards the Studies of Characters and Languages— Yona Takahashi1,a). Abstract: This paper describes the background and current approach to the digitalization of Amarna letters, most of which were diplomatic documents between Egypt and Palestina in 14 BCE. Using TEI/XML, images, cuneiforms, transliteration and linguistic analysis are systematically combined, which in turn are intended to contribute to the open network of linguistic studies, called LLOD.. 1. はじめに すでに使用者がおらず,古代文献にしか残されていない 言語の研究には常に解釈の問題がつきまとう.ある文字を 何と読むのか,どこまでが一つの語であるのかといった基 本的なことですら,しばしば学者の意見が分かれる.. 子化の方法を模索する.まだ開発の途上ではあるが,現在 までの成果を報告し,将来像および今後の方向性について 述べる.. 2. アマルナ文書の電子化の経緯 2.1 アマルナ文書とは. 古代文献の電子化を目指すときもこの問題を避けて通る. 19 世紀末,エジプトのエル・アマルナにある王宮書庫. ことはできない.ある文献を単純に別の媒体に移し替える. 跡から,大量の楔形文字粘土板が発見された.その大多数. 作業であっても,ある点や線が文字の一部であるのか,あ. は,紀元前 14 世紀のメソポタミア(現イラク)やカナン. るいは汚れにすぎないのかは,移植者による文字解釈・言. (現シリア・パレスティナ)から,エジプトのファラオに宛. 語解釈が必要になるからである.さらに,電子化された古. てられた約 300 ほどの外交書簡であった.現在,この粘土. 代文献データを言語研究に応用していくには,言語現象の. 板群はアマルナ文書と総称される.. 解釈までも機械に委ねることができない以上,あらかじめ データそのものに言語解釈を施しておく必要がある. 本報告は,古代オリエント資料の 1 つであるアマルナ文. 前 14 世紀のカナン一帯はエジプトの支配下にあり,各 都市はエジプトの代官の監視の下,地方領主によって統治 されていた.アマルナ文書に含まれる外交書簡の多くは,. 書を題材とし,元の文献をなるべく忠実に電子化すること. 敵対勢力に悩むカナンの地方領主からエジプトへの援助要. と,文献に対する多様な解釈を同時に織り込めるような電. 請であり,当時の国際情勢を示す貴重な資料となっている.. 1. a). 筑波大学人文社会系 Humanities and Social Sciences, University of Tuskuba takahashi.yona.gp@u.tsukuba.ac.jp. ⓒ 2013 Information Processing Society of Japan. 同時に,アマルナ文書は当時のカナンにおける言語状況 を知る上で大きな意味を持っている.アマルナ文書のほと 1.

(2) Vol.2013-CH-99 No.6 2013/8/3. 情報処理学会研究報告 IPSJ SIG Technical Report. んどは,当時の国際語であるアッカド語で書かれている. ところが,カナンから発信された書簡は,語彙と語形は アッカド語のものでありながら,文法要素はカナン語的と いう混淆言語の様相を呈している.本報告では,この独特 の言語をアマルナ語と呼ぶことにする. また時折,アッカド語の語彙に対してカナン語的な注釈 が挿入されることすらある.したがって,アマルナ語に特 徴的な文法要素や語彙を拾い上げることで,当時のカナン で使用されていた言語の特徴を復元することができる.こ のことは,後にカナンに侵入して王国を築き上げるイスラ エル民族の使用していたヘブライ語の特徴を解明するのに も役立つ [7].. 2.2 電子化の目的と方向性 アマルナ文書の電子化は,平成 18∼21 年度科学研究費 図 1. 基盤研究 (C) 「前 2-1 千年紀における北西セム語の等語. 2006 年に作成したデータと簡易検索システム. 線の再画定:GIS による言語地理学的研究」代表:池田潤 (筑波大学)の一環として開始された.. 2.3 電子化のこれまでの過程 ローマ字によるアマルナ文書の翻字データは,テル・ア. アマルナ語には方言差が見られる.例えば,母音の i と. e の交替の仕方は書簡の発信地によって異なっているが,. ビブ大学のウェブサイトで作成・公開されている*1 .2006. このことは発信地ごとに異なる音韻法を持っていたことを. 年,この翻字データに文法情報を示すタグを付け,語彙や. 示している [8].こうした変種は言語的特徴だけでなく,楔. 語形で検索可能にする試みが開始された.既存のテキスト. 形文字の使い方にも見られる.概して,カナンの南方から. データにタグ付けを行うという方針の下,タグセットの定. 発信された書簡は現地のカナン語的要素の混ざり具合が大. 義と構文には XML を採用した.ただし,言語学的な分析. きく,楔形文字の使い方も洗練されたものとは言いがたい.. という目的,とりわけアマルナ語の分析という特殊な用途. しかし,エルサレムから発信された書簡は,北方の「教育. に耐えうる XML 応用が見当たらなかったため,独自の. された」書き方と類似点が大きい.このことは,カナンに. タグセットを定義しそのスキーマを作成した.XML ベー. いくつかの書記伝統ないしは書記学校が存在していたこと. スのデータであれば,将来的に大幅な修正が生じた場合も. を示している.. XSLT などを用いて追随可能であろうという楽観的な見通. したがって,アマルナ文書に見られる文字的特徴や言語. しもあった.. 的特徴に何らかのタグ付けを施すことで,方言の範囲(等. この段階で検索システムの仕様までは考慮できなかった. 語線など)や文化の範囲(書記伝統など)を GIS にマッピ. ため,サーバ側の環境構築に着手することは避けた.ただ,. ングすることが可能になる.それだけでなく,より基礎的. 作成されたデータの検証を兼ねて,当時の主要なウェブブ. な研究,例えば母音の長さの書き表し方,語彙による文字. ラウザで動作する JavaScript と XSLT 1.0 を用いて簡易. の使い分け,いわゆる「送り仮名」の使い方,改行の仕方. 検索システムを構築した(図 1).扱うデータ件数がわず. など,楔形文字と言語との関わり合いを調べる上でも大き. かであったため,このようにクライアント側で完結する規. な助けとなろう.. 模でも十分であった.. 一方で,本電子化では粘土板の物理的特徴を再現するこ. その後,XML データに 2 つの拡張が必要となった.1 つ. とは目指さない.粘土板の材料や質感,文字の傾きや刻み. は,GIS と連携するためのメタデータの導入である.GIS. の深さ,書記の書き癖といったものは,将来的にデータ化. 側で必要となる座標 XML データと,粘土板 XML デー. する可能性はあるものの,現段階では扱わないことにする.. タにおける発信地情報(アムッル,アシュケロン,ビブロ. ただし,翻字データの作成にあたり,粘土板の破損箇所と. ス,……)とを検索時に結びつけ,検索結果に反映させるよ. 破損の程度(必要に応じて復元案)については何らかの形. うにした.もう 1 つの拡張は,ローマ字による翻字データ. で情報化する必要がある.この点については,3.2 節で説. に,楔形文字の情報を埋め込んだことである.この時点で. 明するように画像データを併用することが非常に効果的と. は,後述する Unicode(3.3 節,4.1 節)を考慮に入れてお. 思われる.. らず,楔形文字のコードポイントとして伝統的な文字番号 を割り振ることにした.しかし,代表的な楔形文字字典で *1. ⓒ 2013 Information Processing Society of Japan. http://www.tau.ac.il/humanities/semitic/amarna.html. 2.

(3) Vol.2013-CH-99 No.6 2013/8/3. 情報処理学会研究報告 IPSJ SIG Technical Report. 3. アマルナ文書の電子化の現在 3.1 TEI/XML への準拠 2012 年,これまで作成された独自タグセットによる XML データを,Text Encoding Initiative (TEI) 準拠の形に修 正する試みが行われた.. TEI は 2007 年に P5 版となり,次のような機能が追加 されている.. • 画像データと翻字データの「重ね合わせ」を行う sourceDoc 要素型. • 文字・外字の定義を行う charDecl 要素型. 一般に,文字資料を電子化するには,写真画像として保 存する方法と,何らかの文字コードに基づいてコードポイ ントを記述する方法とがある.P5 版における上記の追加 機能は,それら 2 つの方法を連携・協調させるのに重要な 道具立てであり,本電子化でもこれらの活用を考えていく.. 3.2 画像データと翻字データの重ね合わせ sourceDoc 要素は,元資料の「面」を表す surface 要素を 含みうる.graphic 要素は「面」の画像データを表す.ま た,「面」の特定領域を指定し,そこに含まれているテキ ストを翻字データとして格納するのが zone 要素である. 例えば図 3 は,幅 900 ピクセル,幅 250 ピクセルの画像 データに対し,上 20 ピクセル,左 100 ピクセル,幅 800 ピクセル,高さ 150 ピクセルの矩形範囲を指定し,そこに 含まれるテキストを翻字データとして写し取っている.. 図 2. 2009 年に作成したデータと簡易検索システム <sourceDoc>. ある Borger[1],Syllabar[11],MesZL[2] の文字番号がそれ ぞれ異なっているため,別途対応表を作成し,どの文字番 号方式からでも検索できるよう配慮した.図 2 の簡易検索. <surface> <graphic url="EA292TEO.png" width="900px" height="250px"/> <zone ulx="20" uly="100" lrx="800" lry="150"> <line n="001">. システムは 2009 年に構築したものであり,この時点でも. <c corresp="579" xml:id="c1" type="syl">a</c>. 検索処理はクライアント側で完結するものになっている.. <c corresp="070" xml:id="c2" type="syl">na</c>. 粘土板データ・文字番号対応表・地理情報のように,互. <c corresp="480" xml:id="c3" type="det">m</c> <c corresp="151" type="logo">LUGAL</c>. いにリンクすべきデータの種類が増えたことにより,デー. .... タ作成の困難が予想された.データ作成者の負担を軽減す. </line>. べく,Wiki 文法のような簡易言語の作成や,XML ソフ トウェアのフォーム作成の活用などを試みたが,根本的な 解決には至っていない.データ作成のためにある程度の. XML の予備知識が必要となるのに加え,本作業には楔形 文字の識別やアマルナ語の文法という専門知識が要求され る.システム管理者とデータ作成者,両者の負担を減らし, 互いの作業に集中させるための工夫が求められている. ⓒ 2013 Information Processing Society of Japan. <line n="002"> <c corresp="013" xml:id="c10" type="logo">DINGIR</c> <c corresp="381" xml:id="c11" type="logo">UTU</c> ... </line> </zone> </surface> </sourceDoc>. 図 3. 画像データの特定範囲における翻字データ. 3.

(4) Vol.2013-CH-99 No.6 2013/8/3. 情報処理学会研究報告 IPSJ SIG Technical Report. handcopy. source. traditional. Unicode. <charDecl> <glyph xml:id="SIGN-LUGAL"> <glyphName>CUNEIFORM SIGN LUGAL</glyphName> <charProp> <localName>Borger</localName> <value>151</value>. <line n="001"> <zone points="40,115 25,160 65,175 75,130 50,110> <c corresp="579" xml:id="c1" type="syl">a</c>. </charProp> <charProp> <localName>Syllabar</localName>. </zone>. <value>112</value>. .... </charProp>. </line>. <charProp>. 図 4. 多角形の範囲指定による文字の切り取り. <localName>MesZL</localName> <value>266</value>. また,翻字データの記述の中に zone 要素を置くことも. </charProp> <mapping type="standard">&#x12217;</mapping>. 可能であるため,文字ごとに範囲指定しても良い.zone 要. <mapping type="transliterated">LUGAL</mapping>. 素が切り取れる範囲は矩形にとどまらず,図 4 のように多. <figure> <graphic url="lugal-source.png"/>. 角形も使用できる.. <graphic url="lugal-handcopy.png"/> <graphic url="lugal-traditional.png"/>. 3.3 楔形文字情報の記述 XML データで使用されている文字コードで表現できな い異体字は,外字を示す glyph 要素で「違い」を表しつつ,. Unicode の「正規化」されたコードポイントにマッピング できる.図 5 は,字典 Borger[1] で 151,Syllabar[11] で. <graphic url="lugal-unicode.png"/> </figure> </glyph> ... </charDecl>. 図 5. LUGAL のコードポイント対応と異体字画像の列挙. 112,MesZL[2] で 266 が割り振られている文字 LUGAL ‘king’ が,Unicode の U+12217 であることを表している. この際,実際の異体字画像を列挙することも可能である. 異体字ではなく,そもそも Unicode に収録されていない 文字については char 要素で定義する.例えば,複数を表. ˇ は,字源的解釈を基礎とす す限定符として頻出する MES ˇ る現行の Unicode に収録されておらず,代わりに ME.ES ˇを1文 と書かねばならない.そこで,図 6 のように MES. ˇ= MES. ˇ ME.ES. <charDecl> <char xml:id="SIGN-MESH"> <charName>CUNEIFORM SIGN MESH</charName> <charProp> <localName>Borger</localName> <value>533</value>. 字として扱えるように定義しておく.. </charProp> <charProp>. 3.4 言語解釈の記述. <localName>Syllabar</localName>. 言語解釈には,いわゆる Stand-off マークアップによっ て翻字データとは独立に置き,複数の解釈の可能性を列挙. <value>288</value> </charProp> <charProp>. できるようにする.翻字データにおける各文字には ID が. <localName>MesZL</localName>. 割り振られているため(図 3) ,まず span 要素によって語 の範囲を示す.また,この span 要素を包含している w 要 素の lemma 属性で語の辞書形を,type 属性で品詞を,そ の中身である reg 要素で語形の音訳を,m 要素で形態素を 列挙する.例えば図 7 は,1 番目と 2 番目の文字が前置 詞 ana (意味は ‘to’) ,3 番目と 4 番目の文字が名詞 ˇsarri (ˇsarru ‘king’ の属格)であり,全体として ana ˇsarri ‘To. <value>754</value> </charProp> <mapping type="composed">&#x12228;&#x1230D;</mapping> <mapping type="transliterated">ME&#160;</mapping> </char> ... </charDecl>. 図 6. ˇ を複合文字として定義 MES. the king’ と言語解釈されうることを表す. ⓒ 2013 Information Processing Society of Japan. 4.

(5) Vol.2013-CH-99 No.6 2013/8/3. 情報処理学会研究報告 IPSJ SIG Technical Report. c1. c2. c3. c4. m LUGAL. a - na ana. 図 9. LUGAL の字形の変遷(Labat[9] による). šarri. <s> <w lemma="ana" type="prep">. の融合は,データ作成とシステム管理を両立させるととも. <span from="#c1" to="#c2">a-na</span>. に,人文学研究の新たな地平を切り開く原動力となること. <reg>ana</reg>. が期待される.. <m type="base">ana</m>. 4. 他技術との関わりと将来像. </w> <w lemma="&#161;arru" type="noun"> <span from="#c3" to="#c4">m.!LUGAL</span>. 4.1 楔形文字と Unicode. <reg>&#161;arri</reg> <m type="base" ana="#gc.SUB #gc.ATT #gc.SG #gc.M">&#161;arru</m>. 楔形文字は紀元前三千年期から前一千年期の西アジアで 広範に用いられたため,時代や地域による字体差が大きい.. </w>. 例として図 9 を参照されたい.これは図 5 に挙げたもの. .... と同じ LUGAL ‘king’ を表す文字であるが,最左列がシュ. </s>. メル体,第 2-4 列の上段はアッシリア体の字形の変遷を, 図 7. 言語解釈のマークアップモデル. 下段はバビロニア体の字形の変遷をそれぞれ表している. 図 5 において traditional として挙げられている LUGAL. <interpGrp> <interp xml:id="gc.ATT">attributive</interp> <interp xml:id="gc.CMP">completive</interp> <interp xml:id="gc.F">feminine</interp>. の字形は新アッシリア体であり,しばしばこれが代表字形 として扱われる.一方,アマルナ文書は基本的に中バビロ. <interp xml:id="gc.M">masculine</interp>. ニア体で書かれているが,書記があたかも教養をひけらか. <interp xml:id="gc.NPRD">non-predicative</interp>. すように敢えて古い字体を用いることもある.. <interp xml:id="gc.PL">plural</interp>. さて,シュメル・アッカド系の楔形文字は*2 ,2000 年. <interp xml:id="gc.PRD">predicative</interp> <interp xml:id="gc.SG">singular</interp>. に発足した Initiative for Cuneiform Encoding (ICE)*3 に. <interp xml:id="gc.SUB">substantive</interp>. よって Unicode 化が進められ,2004 年に第 1 段階が完了. .... した.その成果は Unicode 5.0 に収録された U+12000 区. </interpGrp>. 図 8 形態法解釈の一覧・説明. 画(879 字)および U+12400 区画の数字・句読点(103 字) である.Unicode の例示字形はシュメル体であるが,これ. なお,形態法解釈に使われている ana 属性の値は図 8. は ICE がウル第 3 王朝(紀元前 22-21 世紀)のものを第. のように interGrp 要素にまとめておけば,必要に応じて. 1 段階とし,将来的に字源をさかのぼって古アッカド体や. 意味を確認することができる.. 古代字形を収録していく方針だからである [5].楔形文字の. Unicode 化に伴う異体字の問題については,特殊な分野で 3.5 検索システムについて 粘土板データを TEI/XML 準拠の形に修正するにあた. しか深刻化しないとは言え,今後の ICE および Unicode の動向に注意する必要があるだろう.. り,従来の簡易検索システムの修正も迫られることになる. しかし,検索システムについては平成 25∼28 年度科学研. 4.2 言語情報の共有化 現在のアマルナ文書の XML データでは,語の形態情報. 究費基盤研究 (C) 「アノテーション付与型画像データベー スシステムのための汎用プラットフォーム構築」代表:和. を表すのに独自の語彙を用いている(3.4 節) .語のカタチ. 氣愛仁(筑波大学)の成果を活用する予定である.この場. を作る形態法は言語によって多種多様を極めており,ある. 合,完成形のイメージは,古代エジプト神官文字データ. 言語の術語法が別の言語の記述に応用できるケースはさほ. ベース [10] と同じものになる.現在,同プロジェクトと協. ど多くない.例えば,アマルナ語には「接頭辞活用,接尾. 力し,本節で述べた TEI/XML 形式のデータをインポート. 辞活用」という術語があるが,これは他の言語研究にはあ. できるよう仕様の調整を進めている.人文学資料を電子化. *2. する枠組みとしての TEI と,画像データにアノテーショ ンを付与する汎用システムという 2 つのプラットフォーム ⓒ 2013 Information Processing Society of Japan. *3. 音素型ゆえに文字数の少ないウガリト系の楔形文字については, Unicode 4.0 (2003 年)において U+10380 からの区画に収録 されている. http://www.jhu.edu/ice/. 5.

(6) Vol.2013-CH-99 No.6 2013/8/3. 情報処理学会研究報告 IPSJ SIG Technical Report. まり見られないものであり,あったとしてもその意味は異. た画像も OWLG のウェブサイトに掲載されているため参. なっている蓋然性が高い.. 照されたい*10 .. 他方,言語情報を電子的に共有するという観点からは,. LLOD は大きく 3 つのデータ群から構成されている.. 術語法ないし言語記述の方法に何らかの共通の枠組みが. • ナレッジベース.言語に関するメタデータや,言語分析. あった方が望ましい.そのために参考となりうるプロジェ. の枠組み・術語法・アノテーションモデルといった「言. クトの 1 つとして,British National Corpus (BNC) が挙. 語データの作り方」に関する情報.具体的には,コー. げられよう.このコーパスは,TEI に文法記述のための簡. パスを RDF/OWL で表現するための枠組みである. で記述されている*4 .BNC. POWLA*11 ,語彙の意味を SKOS で表現するための. XML の語彙自体は英語文法に特化したものであるためア. 枠組み Lemon*12 ,言語系統や方言などを languoid を. マルナ語の記述に用いるのは難しいが,TEI を基盤とし,. 用いて表現するための枠組み Glottolog/Langdoc*13 ,. 文法という領域において語彙を拡張するという方法には学. および 4.2 節で述べた言語記述のための枠組み GOLD,. ぶべきものがある.. ISOcat,OLiA などがここに属する.. 単な拡張を施した BNC XML. 別の方向性として,ウェブオントロジーの立場からいく. • アノテーション付きコーパス.ナレッジベースに基づ. つかのプロジェクトが進められている.まず,危機言語記. き,アノテーションを付与された言語コーパス.具体. 述プロジェクト. EMELD*5. *6. から派生した GOLD[6]. は,. 的には BNC,Project Gutenberg,The Open Library. 音韻法・形態法・統語法・言語変種など,言語コーパスの 電子化に必要とされうる術語を RDF/OWL で定義してい. など.. • 辞書・シソーラス.語彙の意味を分類し,機械的に. る.同じく,自然言語処理や機械可読辞書等の分野で使用. 意味推論させるための枠組み.具体的には DBpedia,. されている電子的アノテーションも様々であり,ISO には. YAGO,WordNet など.. 言語処理に関する技術をまとめる技術委員会 TC37 が設置. 作成した言語データを,このようなネットワークの一部. されている.2004 年,ISO/TC37 の下で,言語学的術語法. として提供し,機能させていくことを念頭に置きながら,. を網羅的に収集する分科会 SC4 が発足した.TC37/SC4. データの「カタチ」を整えていく必要がある.. は数々の先行プロジェクトから収集された電子的術語法 を ISOcat*7 というレポジトリに公開している.GOLD も. ISOcat に取り入れられている. *8. 5. 終わりに 本報告は,楔形文字で書かれた古代文献であるアマルナ. プロジェクトも,GOLD および ISO-. 文書を,TEI/XML を利用しつつ言語研究という観点から. cat との連携を密にしながら,記述言語学や自然言語処理に. 電子化する方法について述べてきた.まず,sourceDoc 要. おける術語法を RDF/OWL を用いて独自にまとめている.. 素および関連要素型を使えば,元資料に近い画像データと,. ウェブオントロジーを言語記述・言語研究に応用してい. 機械処理の容易な翻字データとを融合・両立させることが. くことは若干高いハードルではあるものの,次に述べる. できる.また,楔形文字の Unicode 化が進められてはいる. 「開かれた言語学」 ,LLOD へつながるものとして念頭に置. ものの,異体字や外字の問題を避けることのできない現状. さらに,OLiA[3]. く必要があるだろう.. では,charDecl 要素および関連要素型によってコードポイ ントを調整することが必要になる.さらに,多様な言語解. 4.3 LLOD への参加 学術情報や公共情報等をオープンに提供し,電子データ を共有することを支援する Open Knowledge Foundation. 釈を織り込めるよう,Stand-off マークアップによって解 釈の階層を別に設けた.そうすれば,1 つの粘土板データ に複数の言語解釈マークアップを施すことができる.. (OKFN) という非営利団体がある.2010 年,その部会. 同時に,このようにして作成されたデータをどのように. の 1 つとして OKFN’s Working Group on Open Data in. 共有していくかという問題も考えていかねばならない.本. Linguistics(2011 年に Open Linguistics Working Group. 報告では 1 つの試みとして,「開かれた言語学」を目指す. に改称)が発足した*9 .その目的は,電子化され. LLOD を紹介した.その理念は,言語記述(またはアノ. た言語学的データが有機的なネットワークとして機能する. テーション)の枠組み・アノテーション付きコーパス・シ. ことにあり,Linguistic Linked Open Data (LLOD) Cloud. ソーラスなどのデータ群が World Wide Web を通じて互. を理念として提唱している [4].LLOD cloud を視覚化し. いに協調し,言語研究のための巨大なネットワークを構成. (OWLG). するということである.例えシンプルかつ小さなデータで *4 *5 *6 *7 *8 *9. http://www.natcorp.ox.ac.uk/docs/URG/posguide.html http://emeld.org/ http://www.linguistics-ontology.org/ http://www.isocat.org/ http://nachhalt.sfb632.uni-potsdam.de/owl/ http://linguistics.okfn.org/. ⓒ 2013 Information Processing Society of Japan. *10 *11 *12 *13. http://linguistics.okfn.org/resources/llod/ http://nachhalt.sfb632.uni-potsdam.de/powla/ http://lemon-model.net/ http://www.glottolog.org/. 6.

(7) 情報処理学会研究報告 IPSJ SIG Technical Report. Vol.2013-CH-99 No.6 2013/8/3. あっても,このようなネットワークにとっては 1 つのノー ドを構成する大きな貢献となりうる.過去に蓄積された データを再利用し,新たなデータと「つないで」いくこと は,今後の言語研究における新たな展開のために必要なこ とである. なお現在,筑波大学において「西アジア文明研究センター の構築」プロジェクトが進められていることを付記してお く*14 .これは歴史学・考古学・人類学・言語学・化学・地 質学・生態学など,学際的アプローチによる新たな西アジ ア研究の拠点形成を目指すものである.本報告のアマルナ 文書の電子化も,小さな試みではあるものの,「開かれた データ,つながるデータ」として研究拠点形成の一助にな ることを期待している. 謝辞 本報告で用いた写真画像は,テル・アビブ大学の. A. F. Rainey 名誉教授から提供して頂いたものである.教 授をはじめとする多くの研究者の方々のお力添えを頂いた ことを記して感謝したい. 参考文献 Borger R.: Assyrisch-babylonische Zeichenliste, Neukirchen-Vluyn (1978). [2] Borger R.: Mesopotamisches Zeichenlexikon, UgaritVerlag (2003). [3] Chiarcos C.: An ontology of linguistic annotations, LDV Forum, Vol. 23, No. 1 (2008), pp. 1-16. [4] Chiarcos C., Nordhoff S. and Hellmann S.: Linked Data in Linguistics: Representing and Connecting Language Data and Language Metadata, Springer (2012). [5] Everson M., Feuerherm, K. and Tinney S.: Final proposal to encode the Cuneiform script in the SMP of the UCS, ISO/IEC JTC1/SC2/WG2 N2786 (2004), 入手先 ⟨http://www.dkuug.dk/jtc1/sc2/wg2/docs/n2786.pdf⟩ (2013 年 7 月 7 日閲覧) [6] Farrar S. and Langendoen T.: A linguistic ontology for the Semantic Web, GLOT International, Vol 7, No. 3, pp. 97-100. [7] 池田潤:アマルナ語から見た聖書ヘブライ語の接尾活用 形, 言語研究, Vol. 126 (2004), pp. 69-92. [8] Izre’el Sh.: Canaano-Akkadian, Lincom Europa (1998). [9] Labat R.: Manuel d’´epigraphie akkadienne, Librairie orientalisle P. Geuthner (1995). [10] 永井正勝・和氣愛仁:古代エジプト神官文字写本を対象と した言語情報表示システムの試作, 人文科学とコンピュー タシンポジウム論文集, Vol. 2012 (2012), pp. 225-230. [11] von Soden W. and R¨ollig W.: Das akkadische Syllabar, Pontificio Istituto Biblico (1991). [1]. *14. http://rcwasia.hass.tsukuba.ac.jp/. ⓒ 2013 Information Processing Society of Japan. 7.

(8)

図 2 2009 年に作成したデータと簡易検索システム

参照

関連したドキュメント

Because of the knowledge, experience, and background of each expert are different and vague, different types of 2-tuple linguistic variable are suitable used to express experts’

The approach based on the strangeness index includes un- determined solution components but requires a number of constant rank conditions, whereas the approach based on

This paper presents an investigation into the mechanics of this specific problem and develops an analytical approach that accounts for the effects of geometrical and material data on

While conducting an experiment regarding fetal move- ments as a result of Pulsed Wave Doppler (PWD) ultrasound, [8] we encountered the severe artifacts in the acquired image2.

A real matrix with nonnegative entries and having a largest eigenvalue of multiplicity just one has a strictly positive left eigenvector (see the Appendix) if and only if there

関西学院大学手話言語研究センターの研究員をしております松岡と申します。よろ

手話言語研究センター講話会.

本センターは、日本財団のご支援で設置され、手話言語学の研究と、手話の普及・啓