• 検索結果がありません。

歴史系資料情報を中心としたデータ記述とその活用 に関する研究

N/A
N/A
Protected

Academic year: 2021

シェア "歴史系資料情報を中心としたデータ記述とその活用 に関する研究"

Copied!
16
0
0

読み込み中.... (全文を見る)

全文

(1)

歴史系資料情報を中心としたデータ記述とその活用 に関する研究

著者 八重樫 純樹, 小笠原 和慶

雑誌名 静岡大学情報学研究

巻 11

ページ 43‑57

発行年 2006‑03‑10

出版者 静岡大学情報学部

URL http://doi.org/10.14945/00002674

(2)

歴史系資料情報を中心とし 夕記述と その活用に関す

A Research of Data Descrlption and Apphca■ on Focus onヨEstorical Related lnforlnadon

小 笠原   和慶   八 重樫   純樹 静 岡大学大学 院情報学研 究科 Kazuyoshi Ogasahara Jyunki Yacgashi Graduate school of]hb■ ..latics,Shizuoka University

概 要 :本論文 で は、東北地方 の縄文遺跡 デー タ と土偶 関連情報 に関す るデー タ とい う2種類 のデー タを

xML記

述 し、両者 のスキーマ差異 をxSLTによるス キーマ変換機能 を用 いて吸収 しなが らデー タ統合 を行 う。さらに統合済みデー タを地図表示 ソフ ト「 カシ ミール

3D」

上 にマ ッピング表示す る。

これ らの試行 を通 じ、CDOC―

CRMな

らび に緯度経度座標値 を用 いた問題解決案や歴史系資料記述 の ための3+1層モ デルを示す。

キ ー ワ ー ド

:XML,XSLT,ス

キーマ変換

,考

古学資料情報

,デ

ー タ統合

,緯

度経度座標値

Abstract3 1hS thesis win show descnp饉 oIIs abouttwo types ofdate which are histoncal sites date oftt Johmoll era in Tohoku reglon and date of clay flgurine,and also show date uniflcations with absorbing differences of each schelllas using XSLT technology.勁 en,point each sits position on map Of Kashimir 3D"by these date。

Through these experiIIlents,this thesis will show solutions by CDOC― CRM or Coordinates of Latitude and Longitude,and also show the"3+1 layer model"for historical related infomation。

Keywords:XML,XSLT,Transfomation of Schelna9 Archaeologlcal Date Womation,Date Uniflcation,Coor―

dinates of Latitude and Longltude

1.は

じめに

一概に「歴史系資料情報」 と述べてみたとこ ろで、その種類や数、フォーマットは様々であ る.テ キス ト文書、写真、図面、はては音声 。映 像資料等、こういった非常に多岐にわたる資料 やデータをどのように扱えば、それの有効性を 損なわず、また、そのポテンシャルを十分に引

き出すことができるのだろうか。

近年の急速な

の進展は、考古学研究を取 り 巻 く状況をも急速に変化 させるものとなった。

デジタル とい う世界 に事象 を記述 し、 ネ ッ ト ワークとい う搬送路 を得、これまでには思い も よらなかった手法で、新 しい知見が次々と生 ま れている。新規情報だけでな く、これまでに蓄 積 されて きた既存のデータに対 しても、

Fと

う新たなツールを用いることで、今 までは気づ かなかつた事実 を浮かび上が らせることが可能

となった。

その反面、増え続ける多種多様なデータをどう 体系的に扱 えば良いのか という問題点にも直面 するようになった。また、古い既存のデータをど う有効活用するのかについて も、その手法は発展

(3)

歴史系資料情報 を中心 としたデータ記述 とその活用 に関する研究

段階にある。アナログ情報 として依然 として残っ ているデータはどうすれば良いのか。現在のテク ノロジを使 ったデータ活用のためには、古いデー タであっても現在の土俵に持って来なければ、な かなか有効な成果を導 き出すことはできない。さ らに、国際的なデータ流通への対応 をどうつけて い くのか とい う問題 もある。これ らの問題 は、

F

という便利な道具を得た我々に、新たな代償 とし て降 りかかつてきている。

本研究においては、これ らの現状 を鑑み、デー タを体系的に扱い活用するための方策を明 らか にすることとした。具体的には東北地方におけ る遺跡 のデー タと縄文土偶 のデー タの

XML

(eXtensible Markup Language)記 述 を行い、これ らデータの統合や活用 に関する試行 を通 じて、

歴史系資料情報のデータ記述に関する問題点や 考察点 を明 らかに し、それをもとに歴史系資料 情報記述の際の方策や指針 を導 く。

本論文においてデータの記述方式に

XMLを

用する理由は次の とお りである。

XSLT (eXtensible Stylesheet Language

Transfomations)に よるスキーマ変換力滞U用 きる

。主要な情報流通インフラであるインターネッ トとの親和性が良い

。スキーマの併記が可能

。資料記述に関する国際的な標準、

RDFに

も対 応可能

XMLに

よるデータ記述を考古学の世界 に持ち 込み応用する研究は、後藤 らによる正倉院文書 データ [11や 石川 らによる木簡データ

[2]等

まだまだ主流 とは言えないまで も、最近では多 くの事例が報告 されるようになって きている。

しか し、異なる主題のデータに対 して、そのス キーマ差異 を吸収 し結合 した事例 はほとんど見 受 け られ ない。歴史系資料情報の持つポテ ン シャルを存分 に発揮するためには、同一分野・同 一主題のデータだけではな く、 これまでは連携 の図 られなかった異分野のデータに対 して も、

その興味 を向けるべ きである。こういった類の データを連結・統合 し、お互いを比較・分析す ることで、今 までに見 えてこなかった未知の知 見 にたどり着 く可能性は大 きい もの と言える.

2口

歴史 系資料

I情

報 の XML記 述 と デー タ統 合

2.1.デ

ータの

XML言

述とスキーマ

本章では、東北地方の縄文遺跡データと全国 の土偶 に関するデータをxML記述 し、

XSLTの

持つ文書変換機能を用いて両データ間のスキー マ差異 を吸収 し、データの統合 を図る。そ して、

統合データ活用の一例 として高詳細地図表示 ソ フ ト「カシミール

3D」

[15]上 にマ ッピングを行 う。これ らの作業 を行 うに伴 って明 らかになっ た事実を元 に、歴史系資料のデータ統合 につい ての現状や問題点、モデル分析 を行 う。

統合用サ ンプルとして用いたデータは、岩手 大学工学部情報システムエ学科横山研究室が保 有する青森・秋田・岩手県の縄文時代の遺跡に 関するデータである (以下、東北遺跡データ)。

主なデータ項 目としては、遺跡番号、遺跡名、市 町村名、所在地、時代、種別、遺構 。遺物 など があ り、デー タの総件数 はそれぞれ、青森県 2,845件、秋 田県1,746件、岩手県5,821件、計 10,412件である。緯度経度座標値 (以下、座標

)に

ついては旧測地系 (注

1)で

あ り、その表

記方式は

dd.IIInlsssssの

形式である。当該データ

の元データの記述方式は

CSV形

(コ

ンマ区切

)の

データであった。

次に土偶 に関するデータである

.こ

れは、八 重樫が中心 となって収集・整理 を進めた、全国 の土偶 とその関連データである(以下、土偶デー

)[3].土

偶データは、推定年代、出土状況、

遺存部位、寸法、実測図等の土偶の実体情報、出 土遺跡名、緯度経度等の地理情報、参考文献や 著作情報等、全 項 目か ら構成 され、総件数は 10,641件である.これ らの情報は「土偶調査 カー ド」

(図

1)とい う紙媒体のカー ドに記入 され、」

(4)

小笠原和慶・八重樫純樹

意 の土偶IDによつて識別 。管理 されている。土 IDは 自治体

ID(5桁

)+遺

ID(4桁 )十

偶 コー ド (3桁

)の

12桁の数字 か ら構成 され る。静 岡大学情報学部八重樫研究室 においては このデー タをパ ソコンに入力 し、

Microsoi(R)

Access形式 にて保管 してい る。

なお、 この際 に土偶調査 カー ド作成時 にはほ とん ど記入 されていなかった出土遺跡 の座標値 を取得 していることを付記す る。取得 について は、デー タ提供者 に対 して

5万

分 の1の地形 図 を送付 し、そ こに該 当す る遺跡箇所 を記入 して もらうことで、当該箇所 の座標 を算 出す る とい う方法 で行 った。取得 した座標値 は、新測地系 (注

2)で

あ り、表記 は ddd tt mm tt ss秒 の形 式 であ る。本事例 においては、 これ らの Access デー タをvBA(Visual Basic for Applications)コ

ドを用 いてXML化 し、統合 を行 うこととした。

統合 に当たっては まず、東北遺跡 デー タと土 偶 デー タの両者 のスキーマ を比較す るこ とか ら 始 めた。各 デー タのスキーマの詳細 と比較結果 は次 の通 りである。

■東北遺跡 データ

遺跡番号 5桁

(市

町村 コー ド(2桁

)+ハ

イフ ン

+遺

跡番号(3桁

))

遺跡名 市 町村名 所在地 時代(文

)

時代

(コ

ー ド

)4桁

.@+3桁 の数字

.※

3

種別

遺物 ・遺構 緯度 ※注 4 経度 ※注 4

■土偶 データ

土偶

ID 12桁 (市

区町村 コー ド(5桁

)+遺

ID (4桁

)十

出土番号(3桁))※

5

遺跡ID 7桁

(遺

跡ID(4桁)十出土番号(3桁

))

遺跡

土偶調査カー ド

遺跡名 遺跡名読 み 都道府県名 所在 地

位置

緯度 ※注6 経度 ※注6

地図名 ※注7 土偶

時期 土器形式 出土遺構 通称名 遺存部位 現存最大長 つ くり 特記事項 備考 図表

由 露 鍛 章 力 哺 ド

︐ I

::ξ i言 嘗 會 :]ぢ J誉 量 三 II菫 薔 壼 1111lJ

轟 ξ

・・ 卿

:菱 弥 轟孵

:穏 キ

e :1轟 機

・   繭一一 螂一一一一一一

i:1:::::1:]:::T

則 一一 一一 中摯

暮■「て鳳ご1「ltl m・¨

輛″櫛‖=1″r慕│`

  

‐―‐■

11Ⅲ

=

(5)

歴史系資料情報を中心としたデータ記述とその活用に関する研究

実測図 0写 真 地図、実測図、写真 所蔵者、機関

実測者、撮影者 文献

報告者、著者 発行年月 報告書、論文名 掲載誌

ページ 刊行所 記入 日 記入者

この結果、デー タの統合 に対 して明 らか と なった問題点は次の通 りであつた。

。同一データと異なるデータの混在

Dの取 り扱い

。座標値のスキーマおよび記述方式

これ らの問題点に関 しては以下の方策により 解決を図つた。

(1)同

一データ (重複データ)の取 り扱い 東北遺跡データと土偶データ内に記載 された 遺跡データにおいて、両者の間で同一の もの と 思われる遺跡のデータがそれぞれ含 まれるとい うのは想像 に難 くない。そのまま機械的に単純 に統合 したのでは、同一遺跡 に対するデータが、

東北遺跡データに由来するデータと土偶 データ に由来するデータの

2つ

存在する事態 となって しまう。そのため、同一 と思われる遺跡 に関 し ては、重複が発生 しないように調整することが 必要 となる。この処理 は、データ統合 を行 う際 に、データ比較に関する条件分岐処理 を行 うこ とで解決 した

.具

体的な判断基準 については次 のD(Identiflre:識 別番号:以Dとする

)の

取 り扱いで述べる。

(2):Dの

取 り扱い

次 に、Dの取 り扱いについてである。統合 に 際 して大 きな問題 となったのが両者のデータに おけるDの差異 をどうするのか ということであ る。両者のデータに振 られたD形式が異なるた め、どちらかの形式のDも しくは新 しい形式の

Dに統一する必要があつた.

本事例 においては、統合後の遺跡のDに関 し ては「 自治体 コー ド(5桁)+遺跡番号 (4桁)」

の形 に統一することとした。自治体 コー ドは、国 土地理院が発行 している全国市区町村 コー ド表

S X 02

)に

基づ くもの とす る。 これは、現 状で定 まっている統一的な標準があるものに関 してはで きるだけそれを採用するという考 え方 に即 したものである。なお、この自治体 コー ド を用いたD付与方式は土偶 データに採用 されて いたものである。

ただ、自治体 というものは統廃合 によつて常 に変化するため、恒常的なデータ管理 を行 う上 では不向 きなものであることは否定で きない。

座標値 に基づ くDの付与 (後

)が

で きれば理 想的であったが、座標値が揃 っていないデータ が多数あったため、本事例 においては採用 を見 送 らざるを得 なかった。

D算出に対する具体的な手法 に関 しては以下 の通 りである。

4桁

の遺跡番号 については、遺跡 データと土偶 データを、遺跡名・座標値の

2項

目について比較 し、

(1)遺

跡名称が同等の もの は同一遺跡 とみなす (2)遺 跡名称が異なつてい て も座標値が同一の もの もしくは非常 に近接 し ている場合は同一遺跡 とみなす という判断基準 を設けた。さらに東北データの遺跡データは

3

桁 なのに対 し、土偶データの遺跡データは

4桁

であったため、同一 とみな した遺跡のDは桁数 の多い土偶データのものを採用することとした。

それ以外の、両者の比較の結果異なると判断 し た遺跡については、土偶データの遺跡Dの空 き

No。

に対 して、順次機械的に

4桁

の数値 を割 り 振 った。

(6)

小笠原和慶

(3)座

標値の取 り扱い

歴史系資料 において座標値 を扱 う場合、考慮 してお きたいことが

3点

ある。

まず 1点 目は測地系 についてである。今回使 用 したデータにおいては、東北遺跡データは旧 測地系、土偶データは新測地系であったため、ど ちらかのデータの測地系はもう一方の測地系に 変換する必要があった。将来的な対応性の観点 から、今回は座標値は新測地系の ものに統一す ることとした.

旧測地系のデータを新淑1地系のデータに変換 するには、旧測地点 と新測地点における基準点 のズ レに該当する分量の緯度経度 をそれぞれ加 減することで可能であるが、このズ レは全国で 見れば一様ではない(注8)[16]。 そのため、変 換 に際 しては

3次

メ ッシュ毎の変換パ ラメータ に基づいた変換 を行わな くてはならず、作業コ ス トが高 くなることが予想 される。そこで、今 回の事例 においては作業の省力化のため、国土 地理院が作成 。公開 している■Ⅳ2JGDと いう測 地系変換 ツール

[18]を

使用 し、旧測地系で作 成 された東北遺跡データを新測地系の ものに一 括変換 した。

2点

目は表記方法 に関するスキーマである。

現状、座標値 に関 しては大別 して10進法による 表記 と60進法による表記の

2種

類の表記法が存 在する。そ して、その表記法 も座標値 を扱 うア プリケーションソフ トウェアによって、様々で ある。例 えば、「度」「分」「秒」などの文字 を交 えて表現 した り、各度分秒の区切 りに「.」

(コ

ンマ

)や

/」

(ス

ラッシュ

)を

挿入 した りとい う具合である。本事例 においては統合済みデー タをカシミール

3D上

にマ ッピングするため、60 進法に統一、度 と分の区切 りに「.」 を挿入する

ことにした。なお、東北遺跡に関するデータの 座標値は10進法により作成 されていたため、座 標系変換前に60進 法に変換 した。進数の変換は 表計算 ソフ ト上 にマ クロプログラム を記述 し 行 った。

3点

日は座標値の精度についてである。緯度

・八重樫純樹

経度の座標値 について、 どれだけの精度 を持 っ ていれば実用 に耐えるのかを考えてみる

.緯

経度において座標値が

1秒

ずれれば、約

30mの

誤差 となって現れる(注9)。 それゆえ、1/1oo秒 単位 までの緯度経度 を算出 しておけば、その誤 差は

30cm程

度にな り、高詳細 な分析 を行わない 限 りは十分使用 に耐え得 るだけの精度が確保で きるものと思われる。

以上、

3つ

の観点か ら、統合済みデータの座標 値 に関 しては、60進 法、精度は小数点以下

2桁

(1/100秒)、ddd.IIImssssの表記形式 とすることと した。

以上 を踏 まえ、データ統合後のスキーマを決 定 した。当該スキーマは独 自の ものであるが、統 合元の両データのスキーマを参考 に、遺跡デー タを上位階層 に、そこから出土する遺物、遺構 を下位階層の ものとして策定 した。準拠 させる べ き適当なスキーマが存在 しなかったために、

本スキーマはあ くまで本事例研究用 に策定 され たサ ンプル用

'と

してのスキーマであることを明 記 してお く。

次 に、各データを統合するためのスキーマ変 換用の

XSLTフ

アイルを作成 した。

xsLTフ

アイ ルの実態は、xsl:ifによる条件分岐 と文字列操 作関数substring()を 組み合わせた ものであ り、

元データの記述スキーマや階層構造 を統合先の ものになるように変換するものである。

具体的なデータ統合の手法は、次の通 りであ る。まず、データ元のXMLフ アイルに対 して 各々のスキーマ修正用

XSLフ

アイルを適用 し

XSLT変

換 を行い、得 られた変換結果 を新たな

XMLフ

アイルに書 き出す.さ らに、別のデータ 統合用

XSLフ

アイルを作成 し、

xsLTの

document

()関

数 を用いて変換済み両 ファイルを読み込 み、メモ リ上で統合 を行 う

.こ

の際に重複デー タの削除お よび遺跡Dの再付与を行 う.こ の統 合済みのデータをファイルとして書 き出すこと で、両データの統合済みXMLを得た。変換のシ

ステムモデル

(図 2)と

出力結果は

(図 3)を

(7)

歴史系資料情報 を中心 としたデータ記述 とその活用 に関する研究

下 に示す。なお、 これ ら一連 の作業 は

Jsc五

ptを 用 いた

ASPプ

ログラム上で行 った。

2.2.カ シミール 3Dへ のマッピング

本事例 では、

XMLを

ベ ース とした情報活用の 事例 と して、統合 デー タをさらに高詳細地 図表 示 ソフ ト「 カシ ミール

3D」

上 にマ ッピング表示

し、新 たな知見へ繋 げるための一例 とす る。

カシ ミール

3Dは

DAN杉本が 開発 した フ リー の地図閲覧 ソフ トである[15].使用 す る地図 に よつては一部 シェアウエ ア となるが、基本 は無 料 にて使用 す るこ とがで きる。緯度経度 を参照 す るこ とに よって、詳細 な地 図上 に当該 デー タ をプ ロ ッ トして表示 させ る こ とが可能であ る。

この ソフ トは元来、登 山愛好家用 に作成 された GPS(Global Positioning System,以 下

GPSと

す る

)

情 報 の地 図 マ ッピ ング ソ フ トで あ るが 、 コス ト 面 と汎用性・視認性の高 さか ら多 くのユーザー を持 っている。本事例で もこれ らの点に着 目し て連携 を行 うこととした。

カシ ミール3Dは緯度経度 のマ ッピングに

NDBフ アイル とい う独 自形式のファイルをプ ロットファイルとして使用 している。

NDBフ

イルの実体はタブ区切 りの

CSV形

式 ファイルで あ り、項 目としては、プロット地点名、緯度経 度、測地系、標高、 レイヤ情報などか ら構成 さ れる

[4][17].逆

に言えば、この

NDBフ

アイ ルさえ得 られるならば、当該アプリケーシ ョン との連携が可能 ということになる。そこで、本 事例 で は

XSLTの

機 能 を使 い、XMLからカシ ミール

3D用

NDBフ

アイル を出力す ることと した。

本事例 においては

NDB出

力用 の

XSLフ

アイル を作成 し、遺跡の名称 や緯度経度 に関す るデー タをxMLフ アイルの中か ら抽 出 し、

NDBフ

イルの形式 にあわせ て整形 したの ち に出力 し、

NDBフ

アイル を得 た。カシ ミール

3Dで

は、マ ッ ピングをかける座標値指示地点 をレイヤ ごとに 色分 け して表示 させ ることが可能である。本事

回 塚 鰤 □

?xml version=・1,0・encodin9=・ Shift=」IS・

?>

―く遺8カ

D3>

― く遺 :籠 D ID=・

032■ 3000■

>

く遺跡名>適 の 下く

/遺

跡名, く都道府県名>岩 手県イ 都道府県名>

く市町村名>二 戸市くノ 市 町村名>

く所在地>未 記入く

/所

在地>

8寺

期>■ 文く

/時

期>

く緯度 >40.335553ぐ 緯度

>

く経度

>141.265606く/騒

>

く座

1票

>]GD2000く/座

標系>

―く関連遺物>

―く迫物 ID=・ 032■ 3000■

00■

・>

く違物種別>■ 文土暑く

/遺

物種別>

1寺

期>■ 文く

/E寺

期>

く地籍>菫 布地く

/地

箱>

/遺

物>

/関

連遺物>

/遺

跡lD>

―く遺

81lD ID=・

032■ 30002・ ) く遺跡名>雨 滝く舌崎

A)く /遺

跡名>

く都道府県名>岩 手県く

/都

道府県名>

く市町村名>二 戸市く

/市

町村名>

く所在地>釜 沢字壊山く

/所

在地>

8寺

期>■ 文く

/時

期>

く緯度

>40.335539く/緯

度>

く経度>14■ .273752く

/経

度>

く座

1鶯

>]GD2000く/座1票

系,

―く関連遺物>

―く迫物 ID=・ 032■

30002001・

>

く遺物種31>籠 文土器く

/遺

物種別>

1寺

期>縄 文晩期く

/時

期>

く地籍>歌 布地く

/地

籍>

出力結果

例 においては、東北遺跡 デー タを赤丸、土偶 デー タ由来 の遺跡 を青 三角形 として プロ ッ トした。

この ことによ り、東北地方の遺跡 の中で土偶 の 出土 した遺跡 とそ うで ない遺跡 について視 覚的 に捉 えることが可能 となった

(図 4).

一              動

ム 跛

阜 囮

タ け

﹃ 一

2 ア

(8)

49

3.考

小笠原和慶・八重樫純樹

前章の事例 をもとに、本章では歴史系資料の データ記述 とデータ統合についての問題点をい

くつか指摘 し、所感 を述べ る。

3.1.ス

キーマ

実世界 をどうデジタルの世界 に表現す るの

?そ

の指標 となるのがスキーマである。何 を データとして取得 し、それをどのような形式で 表現するのか。 この出来栄えが将来のデータの 価値 を決定づけることになる

.そ

のため、情報 記述 を行 う際には、スキーマについて深 く議論 。 検討が なされな くてはな らない。 むろん、IT

(Inforlnation Technology)の 活用が進んで きてい る考古学の世界 においても、この例は例外な く 適用で き、スキーマについても多 くの議論がな されるようになった。特 にインターネ ットとい う世界規模での情報流通路が確保 されたことに

よ り、デー タの国際流通 を視野 に入れた情報記 述 の規格統一の必要性が高 まってお り、それ に 関す る議論 が なされてい る。

これ らの議論 は、国際博物館会議

(ICOM:

International Council of Museums)の 国際 ドキュ メ ンテー シ ョン委員会 (CIDOC:International Committee for DOCumentation)や 国際文書館評議 会 (ICA:Intemational Council on Archives)等 で 行 われてお り、その結果 としてい くつかの記述 標準や ガイ ドラインが策定 され、 これ に合 わせ た資料記述 。デー タ作成が世界的な主流 とな り つつある。

その一方、 日本 国内の歴史系資料 に関す る データ記述は、統一化 という視点では非常に遅 れているのが現状である。面積 に対する発掘件 数 とい う発掘密度 に注 目すれば、 日本 は世界 トップクラスの件数を誇る

[5]が

、現状では、

それらの膨大な発掘データは日本国内はおろか、

その各データ保有機関内のみで しか利用で きな

■ ヽ ′ 趣 曇 奉 題 腱   甘 硼

IⅢlコ

統合結果のカシミール

3D上

へのマ ッピング結果

(9)

歴史系資料情報 を中心 としたデータ記述 とその活用に関する研究

い という状況がほとんどである (注

10).結

局、

そのほとんどが十分 に活用で きない状態で山積 み状態 となって しまっている。膨大な量の貴重 な国内データが十分 に活かされないまま、世界 のデータとも接続する手段 を失ったまま漂流 し ているのは非常 に遺憾 なことである。

この状況 を打破するためには、何か しらの国 際規格 に即 したデータ記述・データ再整備 を行 う必要があろう。現状、対応が図 られるべ き候 補 としては表1に挙げた国際規格が挙げられる。

しか し、一概 に歴史系資料情報 に関する記述標 準 と言つたところで、準拠 させる候補 となる規 格は表 に挙げた通 り、数多 く存在する。そ して、

どの規格 も単体のみでは全ての歴史系データの 記述要求 を満 たす こ とはで きない。例 えば、

DublinCoreはデータをネッ トワーク上で参照す るためのメタデータの役割 しか持たず、これを 考古学研究のための資料記述や博物館 における データ整理のための規格 として用いるには不十 分である。 また、考古学遺跡お よび歴史的建造 物のための国際コアデータ標準 (以下、ICOM―

CDOC案)も、対象記述分野は遺跡であって、そ こか ら出土する遺物や遺構の記述 には不十分で ある。

こういった議論が発生 してしまう原因は、歴 史資料 という実体が非常 に多岐に渡 り、また、 数分野にまたがるものであるからに他ならない。

例 えば、及川は、考古学データベースにおいて は、属性が遺物の種類 ごとに激 しく異な り細か く分類するときりがない、扱 う対象 を厳格 に共 通的に定義で きないため共有化が可能なデータ ベースの作成はなかなか実現 しない、 と指摘 し ている [13].歴 史系資料 という大 きな枠組みで 見た場合、その対象範囲は発掘 した物理的資料 か ら、古文書、ひいては衣服や生活道具等の民 俗資料 まで、実に多岐にわたる。さらに、例 え ば、古墳の壁画や資料 に装飾 として施 された絵 画は、歴史資料であると同時に美術資料 として の側面 を持つ。結果、全ての分野 を網羅的に過 不足 な く対応するというようなスキーマを策定

するのは不可能に近い。

では、 どれに準拠 させるべ きなのか。和久田 らは、ダブリン・コアはあ くまで も情報資源の 効率的な発見のために定められた標準であって、

それぞれの専門分野の情報 を記述するには不十 分であ り、最低限MICMOへの対応が必要 とし ている

[6].筆

者 は基本的にはこれに賛成であ

歴史系資料記述に関連する国際規格

※資料記述に関する標準

「国際標準記録史料記述一般原則」

ISAD(G)/1ntemational Standard Archival Descnp■ on (General)

→ 文書館分野の資料記述規格.記録資料用。26要 素.

※データ構造上の標準

「ダブリン・ コア」

DCMES/Dublin Core Metadeta Element Set

→ 博物館 に限 らず、全 ての情報資源におけるメタ データの基本。ネットワーク情報資源用。15要素。

「博物館資料の最小限情報分類」

MICMO/Minimum WOmation Catego五

es for Museum OtteCtS

→ 1994年 8月 ワシン トンの国際会議にて提唱.博 館資料用。17要 素。

「博物館資料情報の国際ガイ ドライン」

(CDOC情

カテゴリ)

IGMO1/htemational Guidelines for Muscum Ottect h‐

fomation

→ 博物館資料用.74要素。

CDOC概

念参照モデル」

CIDOC‐

CRM/CIDOC‐

Concepmal Reference Model

ISO/TC46/SC4/WGと して 2000年 9月 より策定中

(ド

ラフ ト段階 :ISO/CD 21127).84概 念+139プ パテイ。

※考古学の核 となるデータ標準

「考古学遺跡お よび歴史建造物のための国際コアデー タ標準」

(考

古遺跡共通データ規格国際版

(案 )

CIDOC draftintemational Core Data Standard for archaco―

logical sites and monulnents

※水嶋英治「資料認識 とナレッジマネジメン ト」

(参

文献

[9])P83「

博物館情報 に関する「標準」の種類」を

参考 に作成.規格名の後ろのカッコ内は通称名。

(10)

小笠原和慶・八重樫純樹

るが、歴史系資料 を体系 的 に扱 うとい う広 い視 点で見 た場合 、 これだけで は不 十分 であ り、 も

う少 し付 け加 えを した提案 を したい。

筆者 の考 えは次 の通 りである。デー タ流通 。 用 の た め の 必 須 メ タ デ ー タ項 目 と し て の DublinCoreを必須 と し、 これ をベ ース に して、

ISAD(G)、 MICMO、

CDOC案等 、各 デー タの 分野特性 に適 した記述規格 を採用 す る。具体 的 な記述 に関 してはRDF(Resource Description Franlework)と互換性 を持 つXML記述 を用 い、

デー タ流通 の際の各標準 間の概念差異 について

CDOC―

CRMを用 いて解決 を図るべ きだ と考 える。 これ ら国際標準 は、デー タ活用 。流通 の ための最低 限の基準 としての規格群 とい う位置 づけであ り、各データヘのアクセスポイン トを 相互に確保 してお くための一種の制約的な性格 を持つ ものであると考えて良い。また、こういつ た各標準では直接的には触れ られていないが、

より円滑で安全なデータ流通のためには、デー タの取 り扱いや管理ルールに対 して も明確 にさ れてお く必要がある。

3.2.lD(ldentifire)

次は遺物や資料 に関するD付与に関する問題 である。現状では歴史系資料のD付与 について の標準 というものが存在 しない。本事例 におけ る縄文遺跡データベースのデータにせ よ、土偶 データベースのデータにせ よ、あ くまで便宜上 に割 り振 られたDに他 ならない。今回のデータ 統合 を通 じて、遺跡、遺物、ひいては歴史系資 料 の

ID付

与 について何 らかのガイ ドライ ン 策定の必要性 を感 じた。Dの取 り扱いについて は各国際規格 において も、必須項 目ではあるが、

その具体的な付与方法 については述べ られてい ない。国内で統一的な付与指針 を設け、 さらに これを国際的な流れ となるように情報発信 して い く必要 もあると考える

.こ

れに関連 して筆者 の考えた座標値 を盛 り込んだDについては後述 する。

3.3.不

完全データ・歯抜け状態となつたデー タの取 り扱い

今回の事例 において も、例 えば、座標値が記 入されていない もの、項 目に未記入 。不明 と記 された もの、空欄 となつているもの等が散見 さ れた。また、たとえ記入がなされていて も、あ るデータに至 っては、遺跡名:長野市

 

所在地: 長野市 とだけしか記入 されていないものがあ り、

そのデータの実効性 に疑間を抱かざるを得 ない もの も存在 した.

データ項 目が未記入 となっている場合、再調 査 によリデータを取得 しなおすか、推定により データを算出 し補 うかの手法が考えられる。 し か しなが ら、多 くの遺跡や遺構 は発掘調査 に よって破壊 された り、事後の開発 によつてサイ ト自体が失われていた りする場合が多 く、再調 査が困難であることがほとんどである。報告書 に記録 されたデータが唯一それ らを知る手がか りとなることも少な くない。肝心のデータが報 告書 に記載 されないまま発掘が終了 して しまっ た箇所 については、データの再取得 は事実上不 可能であろう。また、報告書か らのデータ作成 時 に漏れたデータは、報告書か らの再入力 をす れば済むことであるが、この作業 には多 くの労 力がかかることが予想 される。データ取得 。作 成のガイ ドラインをしっか りと策定 し、データ 作成時にきちんとしたデータ作成 を行 うべ きこ とはもちろんだが、現状で残 つている不完全な データに対 して も、何 らかの方策を講 じて再利 用可能なところにまで持 ってい くことが必要で ある。

結果、現実的な手法 としては、周辺データよ り推定が可能な ものに関 しては、プログラム的 に算出 し、推定する手法が挙げられる

.も

ちろ ん推定データには「推定による参考値」 という 具合に、正規データと区別するための何 らかの 標準的仕組みが必要である.

3.4.緯

度経度座標値

座標値の記載に関 しては、ICOM―CDOC案

(11)

歴史系資料情報 を中心 としたデータ記述 とその活用 に関する研究

も必須記載項 目となっている。現状では、 日本 では座標値の取得 されていないデータは多数存 在 [9]し 、こういったデータに対する座標値の 付与 を何 らかの手法で早急に行い、座標値デー タの整備 を行 うことが不可欠である

.国

際的な 歴史系資料記述の流れか らして も、最低限 どの データにおいても、座標値の付与は確保 されて おかなければならない事項である。また、住所 による所在地指定は文字で表現 された間接的な 位置参照情報 [8]で しかな く、あ くまで絶対的 な位置情報 としての緯度経度情報 をデータ内に 加 えることの意義は大 きい。

現状で未記入・未取得の座標値データに対 し て座標値 を取得する方法 については、以下の3 通 りの手法が考えられる.

まず、

GPS機

器 を用いた再取得である。現在 も遺跡や遺構が発掘後 も失われずに残ってお り、

出土地点が明確 にわかるのであれば、再調査が 可能であ り、再び当該箇所 に赴 き、

GPS機

器 を 使 って緯度経度 を取得することがで きる.GPS

測量機器の精度は年々上がってお り、かな り高 い精度で座標値 を取得することが可能である。

しか し、直接現地へ赴 くことへの人的 。作業的 コス トは莫大なものとなるのと、実際には再調 査の可能な箇所 は事後の開発や発掘 に伴 う遺跡 層の物理的破壊 によって、ごく一部 に限 られて

しまうという問題点がある。

次 に、デジタイザ という機器 を用いて、遺跡 地図等 より再入力する手法が挙げられる。デジ タイザによる座標点のプロットは、既存の遺跡 地図等が残 っておれ1銀座 に座標値の再取得が 可能である。現地での

GPS測

量 によるデータ再 取得が難 しい場合 には、大 きな効果が上がるも の と期待 される。 しか し、手作業 による座標点 のプロットは作業者の負担が大 きく、誤差 も発 生する。例 えば、10万 分の 1の 地形図に記載 さ れた遺跡地図か らマ ッピングを行 った場合、

1

11mlのズ レが実際には

100mの

ズ レとなって現れ る。これ ら人海戦術 により座標値 を再取得する 手法は、結果 として莫大なコス トを要する作業

となって しまうため、作業 にかかる人的 。経済 的な支援 を行 う法的・制度的な整備が必要 とな るで。そのため、データ再整備 には長い時間が かかることが予想 される。

現状で一番現実的な手法 としては、ア ドレス マ ッチ ングにより、所在地住所か ら緯度経度 を 算出する方法である。

国土交通省国土計画局は「

JNS住

所認識 シス テム」 という所在地住所か ら緯度経度 を算出す るソフ トウェアを公開 し、無償提供 を行 ってい

[19]。

これは、同局が整備 。公開 している、

全国街区レベル位置参照情報 を取 り込み、ロー カル環境内に住所 と座標値の対応データベース を構築することで、入力 された住所 をマ ッチ ン グにより座標値 に変換する機能を実現 している。

街区情報は全国の ものが作成 。公開されてお り、

同局の

Webサ

イ トより自由にダウンロー ドする ことが可能である。この手法 を用いれば比較的 低 コス トで座標値 を取得可能であるが、変換元 の座標値データが街 区の代表地点の ものである ため、その変換精度 に最大で数

100mの

ズ レが生 じる可能性がある。現状では、変換率・変換精 度の面で詳細 な研究に耐えられるだけの レベル

には至っていない。

民間では街区の代表地点だけでな く、住所の 枝葉番号 にまで対応 したデータベースを作成 し 精度の高い変換 を行 っている企業 もある [20]

が、これ らのサービスはすべて有償 となるため、

万単位の数で変換が必要な歴史系データを変換 すれば、結局かな りの金銭的コス トがかかるこ とが予想 される。また、一つの住所内に複数の 遺跡が存在 した り、複数の住所 にまたがって遺 跡が存在する場合があった りと、考古学データ 特有 の問題 によ り、 た とえこれ らの高詳細 な データベースを利用 しマ ッチングを行 った とこ ろで、 どこまでの変換精度 を確保で きるのかは 未知数である。現状では、変換率・変換精度の 面で詳細 な研究に耐えられるだけの レベルには 至 ってお らず、この分野での更なる研究の進展 があることを期待する。

(12)

小笠原和慶・八重樫純樹

結果、現状では、それぞれの現状 に応 じた座 標値の再取得および活用 を行 うしかない。点 と

して座標値 を取得 した場合は、それはあ くまで 対象の抽象化情報であ り、小縮尺の地図におけ る利用 に限 られるということを念頭 に置かなけ ればならない。さらに複数点を取得 し、遺跡 を 範囲 として認識 し比較検討 を行 いたい場合 は、

その記述方法や誤差、中心点について深 く議論 されなければならない。

以上の ような国際規格への対応 を意識 した座 標値の整備の他 に、国際規格 においては触れら れていないが、 より活発でシームレスなデータ 流通のためには、座標値 自体の座標系や表記形 式、精度 に関 して も、ある程度の体系的統一を 目指すべ きである。

1章

において行 ったデータ 統合事例 では、緯度経度 の記述 フオーマ ッ ト の違いが大 きな作業 コス トとなつて現れた。将 来的な活用の可能性 を考慮すれば、現状で保有 している旧測地系データはプログラム的に演算 をし、新測地系の ものに変換 してお くべ きであ る。 また、60進

10進

表 記 を含 め、各GIS

(GeographicJ Lttmation Systm:地 理情報 シス テム

)ツ

ールやアプリケーシヨンにおいて も進 数や表記 に関するする何 らかの統一が図 られる ことを期待する。

3.5.デ

…タアクセスポイン トとしての座標値 緯度経度 による地点の指定は、各分野共通の 重要なデータアクセスポイン トであ り、異種情 報 を結びつけるための貴重な糊代的役割 を果た す もの となる。世の中には歴史系資料情報だけ でな く、座標値の記載 されたデータは多種多様 なものが存在する。例 えば、商業施設の立地デー タ、防災地図、地域データベース、カーナビゲー ションシステムのデータベース等が挙げられる。

こういった ものと、歴史系情報 を座標値 をもと に関連付 けることで、 これ まで思い もよらな かった新たな知見が発見 される可能性がある。

また、各種発掘調査や研究には、公共財か ら

の人的・金銭的投資がなされてお り、基本的に その成果は広 く一般 にも還元 されるべ きもので ある。研究結果は研究機関 。研究者個々の もの だけではな く、広 く大衆 に帰属するべ き性格の ものであるという意識 を持 ち、考古学研究にお けるアカウンタビリテイを満たすために、歴史 系資料情報の公開 も積極的になされな くてはな らない。これ らデータの社会情報資源 としての 価値 を決定付 けるのは、そのデータの利用性 に 依存するが、多種情報に対するデータ連結点 と しての座標値の有無がその大半 を決するという ことは想像 に難 くない。

さらに、座標値十出土番号 という表記形式 を 用いることで、遺物 を一意 に特定で きる可能性 があ り、資料のD的役割 を果たす ようになる可 能性 もある。将来的にはD内に座標値 を取 り込

むことも検討 して も良い もの と思われる(図

5).

このD法の導入に関 して想定 される問題点 とし ては、データをDの昇順・降順 に並べて一元管 理することが難 しくなる、

IDの

桁数が大 き く なって しまう等が挙げられる。 しか し、この手 法は非常 にシンプルな方法で歴史系データを一 意 に扱 うことが可能であ り、今後の議論の価値 がある。さらに、

保管場所 。所有機関の座標値 を順次別項 目に 入力 しておけば、資料の移動 に関する追跡 も可 能 となる。

遺跡だけではな く、遺物 に対 して もで きる限 り正確 な座標値 を記載するべ きである。この理 由は以下の とお りである。

座標値 を元にした資料D

ある遺跡のある地点か ら出土 した資料 に対するD

付与例

出土地点 :東 経 135度 解 分 11秒

21

北緯 39度 41分 23秒

55

出土番号 :026

番作成 D:E135241121.21‑N3%123.55‑026

座標値を元にした

ID付

与例

(13)

歴史系資料情報 を中心 としたデータ記述 とその活用 に関する研究

考古学 に関連するデータは遺跡 ∈遺構 ∈遺物 とい う階層関係 を持 ち

[11](注

H)、 その階層 関係の論理構造 を考 えた場合、遺物は遺跡 とい うサイ ト上 に内包 される。そ して、基本的に遺 物は遺跡 より複数発掘 される。

そ もそ も遺跡 は2次元的な広が りを持 った

「サイ ト」として存在する。しか し、データ表現 の問題(各標準 における要素数の制限)か ら、遺 跡の場所 を表現する座標値 は

1箇

所 しか記載 さ れないことも多い (注12)。 そのため、その遺跡 の代表地点 もしくは中心地点、重心地点の座標 地が、遺跡の「位置」 として取得 される場合が 多い。しか し、遺跡の実態は「面」であるため、

遺跡 とい う実態 を正確 に電子化 して表現 してい るとはいえない。

ここで、各遺物 における出土地点の緯度経度 が精密 に取得・記載 されていれば、複数の遺物 の出土場所 を地図上 にプロッ トし、その集合 を

「面」として表現することが可能 となる

.精

度や どこまでの出土範囲を遺跡 とするのかの議論は もちろんなされなければならないが、少な くと も、遺跡 をただの地図上の一地点 として捉 える よりは遺物の出土範囲の集合 を面 として捉 え、

それを遺跡の広が りとして表現する方が、 より 実世界 を的確 に描写 した表現方法 と言える。こ れは、「遺跡は出土地点の集合である」という考 えに基づ くものである。

さらに、この考え方は、遺跡の地形分析 にも 応用で きる。出土資料の標高データを取得 して おけば、座標値 と組み合わせることで、遺物の 位置 を

3次

元的に特定することが可能である。

そのため、複数の資料の分布 を分析することで、

当該地域が平面地であったのか、斜面地であっ たのか という大 まかな地形 を推定することもあ る程度可能 となる。さらに精密な標高データを 取得 しておけば、各遺物の層的な管理 も可能 と なることが予想 される。CDOC案で も標高デー タに関 しては任意記述項 目であるが、その記載 が規格 として定め られていることを付記 してお

く。

3.6.歴

史系資料情報のためのデータ記述に関 するモデル

本章の最後 に、歴史系資料情報のためのデー タ記述に関するモデル考察 を行い、問題解決 を 図る上での手がか りとしたい。ここで筆者は、歴 史系資料情報のためのデータ記述に関 して、「歴 史系データ記述のための

3+1層

レイヤモデル」

とい うものを提案する

(図 6).

歴史系資料のデータ記述 を円滑に進めるため には、基本的にどのような項 目のデータを取得・

記載すべ きか とい うレベルの話 と、データ活用 のためにどのような表現形式 を用いてデータ記 述 を行 うか という話は、分けて考えた方が良い。

その結果、データ記述のための基本的な階層 は、

下か らスキーマ層、フォーマ ット層、プレゼ ン テーシ ョン層の

3層

構造 となると考えるもので ある。

スキーマ層 は、実世界 の情報 について何 を データ化するか、その取捨選択 を決定する層で ある.次 に、フォーマ ット層は、選択 されたデー タに対 して、そのデー タを媒介す るためのメ ディアを決定する。その上で、プレゼンテーショ ン層 において、データをどのような形式で表現 するのかを決定する。

さらに、それ らを情報資源体系的に扱い、有 効 な利用 に供するために記述系 レイヤの上位 レ イヤ としてマネージメン ト層が必要 となる。マ ネージメン ト層は、各データをオブジェク トと して体系的に扱 うための情報 を設定する層であ る。下位

3層

が主 にデータの記述方法 を扱 う層 であるのに対 し、この層ではそれらを有効 に活 用するための管理情報 を扱 う層である。これ ら 3+1層構造 により、歴史系資料情報のデー タ記述について一般化で きると考える。

そ して下位 レイヤが定 まらない限 り上位 レイ ヤの活動余地はな くなる。現状ではその根本 と なるスキーマ層の不備が目立つ。インターネッ トでの

OSI基

本参照モデル同様、障害解決のた めには、下層か らの確実な解決 を図って行かな ければならない。歴史系資料情報の円滑な流通

(14)

のためには、まずは、その大元であるスキーマ 層の問題解決を図り、それが終了 した時点で、 初 めて上位 レイヤの問題解消に取 り掛かかれるの であると肝に銘 じなければならない。まずは早 急なるスキーマ問題の解決を行 うべ きである。

4.結

歴史系資料情報 をデータとして蓄積 し公開す ることは世界的流れ として進め られてお り、各 デー タ標準規格 はその中心 をなす ものである. 多種多様 な歴史系データを全て網羅 し過不足 な

く画一的に記述で きるデータ標準は現実的では な く、データの特性 を見なが ら複数の規格 をう まく取 り入れ、それ らを連携 させなが らデータ 記述 をしてい く必要がある。データ流通のため の規格準拠のレベルを保 ちつつ、それぞれの研 究要求 に応 じたデータ粒度 を確保することが、

歴史系資料情報記述の今後の方向性であると信 ずる。

多分野 にわたるデータをうま く住み分 け、ま

‑1婿己述

小笠原和慶・八重樫純樹

た共存 させ るには、共通 の思想 を持 った枠組み の中でそれ らを体系 的 に扱 う必要がある。本論 文 においては、それ らをス キーマの相互参照 の ための

CDOC―

CRMと、それ を実現す るための 枠組みを提供するXML及

RDFと

い う形で提 案 した。そ して、データを有機的に結びつけ、新 たな知見 を発見するための各分野共通のデータ アクセスポイン トとして緯度経度座標値 を位置 づけ、これの整備の必要性 を強 く訴えた。

デー タはそれ 自体 の持つ価値以外 に、他 の デー タとの連携 を取 ることで初 めて浮かび上 がって くる価値 というものが存在する。自己の 持つデータのみで知見を生み出す という研究は、

長い歴史 を持つ考古学研究の中でそろそろ限界 の位置に差 し掛か りつつある。他分野、異種デー タとの関係比較 。関連 という新 たな視点 を持 ち、

マクロ的な視点から事実 を俯跛すれば、今まで 想像 もつかなかった未知なる知見 に到達する可 能性が高い。

本論文 においては、そのためのデータとデー タをつな ぐための糊代的役割 としての緯度経度

データを体系的 に扱うための情報を設定

1:著

作権情報、f果存期限、

資料の移管・追跡に関する情報

データをどのように表 現するのか?具体的な記述・表記方法

1:何 bi切

ラーか

(画

)サ

ング剛 衷数

(音

)

Codec倣樋昴 少数点以下何桁

(数

値データ

)

どのようなフォーマッ巨輌己述するのかを決定 :テキスト形ゴファイル

CS暉

式ファイル

XML形式ファイル

何をデータ

1ヒ

するのか?データの取捨選択を決定

1:M!C MO DubilnC口 re 10MOI ISAD(0)

体系的な歴史系デ

管 理 レ イ ヤ

 

→ 古

{: マネージメント層

記述 レイヤ

プレゼンテーション層

フオーマット層

歴史系資料記述のための

3+1層

モデル

参照

関連したドキュメント

このように資本主義経済における競争の作用を二つに分けたうえで, 『資本

「系統情報の公開」に関する留意事項

本文書の目的は、 Allbirds の製品におけるカーボンフットプリントの計算方法、前提条件、デー タソース、および今後の改善点の概要を提供し、より詳細な情報を共有することです。

生活のしづらさを抱えている方に対し、 それ らを解決するために活用する各種の 制度・施 設・機関・設備・資金・物質・

Google マップ上で誰もがその情報を閲覧することが可能となる。Google マイマップは、Google マップの情報を基に作成されるため、Google

経済学研究科は、経済学の高等教育機関として研究者を

※ 本欄を入力して報告すること により、 「項番 14 」のマスター B/L番号の積荷情報との関

SFP冷却停止の可能性との情報があるな か、この情報が最も重要な情報と考えて