GIS−理論と応用
Theory and Applications of GIS, 2012, Vol. 20, No.2, pp.71-81
【原著論文】
地球観測データ相互流通のためのデータモデルレジストリの開発
長井正彦*・小野雅史 **・ 柴崎亮介 **・ 坂路和也 ***・ 岡田泰征 ***
Development of the Data Model Registry for Earth Observation Data Interoperability
Masahiko Nagai*, Masafumi Ono**, Ryosuke Shibasaki**, Kazuya Sakaji***, Yasuyuki Okada***
Abstract: The data model registry is a comprehensive, authoritative reference for information about
data modeling, data specification, data definition, and their relation to other datasets. It supports the creation and implementation of data models that are designed to encourage the efficient sharing of observation data. The data model registry serves as a catalogue of data elements in application sys-tems. The registry does not contain observation data, but it may show data availability. It provides descriptive information to make the data model. The registry links with ontologies and it shows definitions of the term. In order to describe the data element, it is necessary to understand technical terms. The ontological information is considered part of the registry system. This is very important because if a user creates a new data model without referring to an existing model, the result is a mishmash of model type. Also, if the registry system archives data models with their relations and definitions, it is very helpful for integrating actual data.
Keywords: レジストリ(Registry),相互利用 (Interoperability), データモデル (Data Model),
オントロジー (Ontology) 1.はじめに 地震や津波などによる大規模災害や気候変動な どのグローバルな問題に対応するには,包括的に 地球システムを理解し,気象,農業,生物,水文, 環境,土木,災害,地質,資源,社会学など多く の専門分野にまたがり,データを統合利用した取 り組みが必要である.実際にGEO(Group on Earth Observations)等の活動により地球観測データや地 理情報を集めた様々なポータルサイトが立ち上がっ てきており,データや情報の共有は大きく進んでい る.GISやリモートセンシングなどの地理空間情報 分野では,地理情報標準,ISO/TC211,OGC(Open Geospatial Consortium)など,データを異なるシス テム間で相互利用する際の互換性の確保を目的に, データの設計,品質,記述方法,仕様の書き方など のルールを定めている(Kresse, 2008).こうした標 準に準拠することにより,異なる整備主体で構築さ れたデータの共有やシステム依存性の軽減といった 利点があり,データの相互運用性(Interoperability) が高まると考えられる.しかしながら,現実問題と して,標準の作成以前に構築された旧システムの ファイルフォーマット等で蓄積されてきた使い勝手 の悪いレガシー・データや農業や生物などの異種分 野で蓄積されているデータの相互利用に関しては, 非構造のレガシー・データへ構造を追加したり,デー タやデータモデルの変換ツールを開発したりするた めに膨大な労力が必要となり,すべてのデータを統 一された標準に沿って記述することは不可能である * 正会員 アジア工科大学 Geoinformatics Center(Asian Institute of Technology)
km 42, Paholyothin Highway, P.O. Box 4, Klong Luang, Pathumthani 12120, THAILAND E-mail:[email protected]
** 正会員 東京大学地球観測データ統融合連携研究機構(EDITORIA)(The University of Tokyo)
〒 153-8508 目黒区駒場 4-6-1 駒場リサーチキャンパス 東京大学・生産技術研究所 C 棟 5 階 Cw-503 号室 Tel:03-5452-6417
*** 国際航業株式会社(Kokusai Kogyo Co., Ltd.) 〒 102-0085 東京都千代田区六番町 2 番地
(柴崎,2005).
今までに,様々なデータ仕様や定義,メタデータ 構 造,UML(Unified Modeling Language)ク ラ ス 図 やスキーマ等を含めたデータモデルが作成されてき たが,その数が増えるにつれ,今までにどの様なデー タモデルが作成されてきて,どの様なデータモデル が存在するのかを把握することが困難になりつつあ る.そのため,類似したデータモデルがデータセッ トごとに重複して作成され複数存在しているといっ た問題も起きている.データセットごとに,様々な 規格や独自仕様をもち,同じ用語でも異なる概念を 表し,データの相互利用の障害になっている.今後, 地理情報標準のさらなる普及とともに様々なデータ モデルが出現することが予想され,現在個別に管理 しているデータモデルを統一した方法で管理し,そ の内容及び構造を検索し,目的に合ったデータモデ ルを再利用できる仕組みを構築する必要がある.ま た,データモデル作成者にとっても,作成したデー タモデルが限られた分野やコミュニティで利用され ているにとどまることが多く,分野を超えて普及・ 流通させ,広く社会から評価を得ることは難しいの が現状である. 本研究では,地球観測データや地理空間情報の相 互利用を支援することを目的とし,関連する分野の 様々なデータモデルやデータ仕様,標準規格等を共 有する仕組みとして,データモデルを統一的に管理 し,目的に合ったデータモデルを検索・参照するこ とを可能とするデータモデルレジストリを開発し た.国内においてデータモデルを対象に,構成要素 レベルで管理したレジストリの開発例はなく,さら に海外における関連するレジストリ運用実績を見て も,地球観測に関するデータモデルを様々な分野を またいで対象にしたデータモデルレジストリの開発 例もなく,データの作成・構築・管理・運用にあたっ て,どのような構造,定義,概念,用語が利用され ているのかを体系的に整理できる環境を作ることは 非常に重要であると考える.本研究では,データモ デルレジストリの開発およびデータモデルの登録を 行い,一般公開することを前提としたレジストリの 開発を目的とした.また,オントロジー情報との連 携を図り,地球観測に係わる様々分野をまたいで, 意味,定義レベルでのデータの相互流通を支援する ことも検討した. 2.先行事例とユーザ要求による要件整理 海外において,データ流通基盤を整備するための レジストリの運用実績がいくつかあるので,調査お よび整理を行った.また,開発するレジストリの利 用対象者にユーザ要求をまとめた. 2.1.先行事例 GBIF(地球規模生物多様性情報機構)は,GBIF データポータルを構築している.生物多様性情報の 世界規模ポータルであり,OECD(Organization for Economic Co-operation and Development)の勧告によ り開始され,日本を含む世界の50カ国と38の国際 機関が参加している,分散蓄積されている生物多様 性に関する情報を,統一仕様で記述されたインデッ クス(ポータル)を経由して検索(クリアリングハ ウス)できる.適用分野や目的の異なる複数のデー タ仕様を併記するコンセプトは無いが,ローカル仕 様で記述されている実データを,標準形式に変換す るツール(アダプタ)等の開発が進んでいる(Global Biodiversity Information Fa-cility, 2010).DoD MDR (国防総省メタデータレジストリ: The Department of
Defense's Metadata Registry)は,全員参加型の運用 で,標準検索以外の多様なサービスを提供し,関 連や類似の登録・検索,さらにアクセス統計情報 提供によりユーザ評価公開を行っている.既存の データベースの構成要素を参照・ダウンロードする こ と が で き る(Defense Information System Agency, 2009).EPA SoR(環境保護庁レジストリシステム: Environmental Protection Agency System of Registries) は,分散レジストリの統合管理方式により,環境 に関する情報利用を,異なる組織間で効率的に 行うことを支援している(Bargmeyer,2005 ; U.S. Environment Pro-tection Agency, 2010).このレジス トリでは,レガシー・データを包含しており,学術 情報や観測データ中心に扱っている.METeOR(医 療分野のオンラインレジストリ:Australian Institute
of Health and Welfare Metadata Online Registry) は, レガシーの知識ベースを元に展開しているレジスト リであるが,レガシー情報の検索には,別の専用ツー ルが必要である.レジストリには,ISO11179準拠 体 型 で 登 録 し て い る(Australian Institute of Health and Welfare, 2010).UK ITSレジストリ(英国政府 高 速 道 路 局 パ イ ロ ッ ト:UK Highway Agency ITS Data Registry Opera-tional Trial)は,ISO14871に準拠 した典型的なレジストリである.異なるシステム間 の類似するデータ仕様を調整し,データの相互利用 を支援している(Highways Agency,2010).これら の海外の事例におけるレジストリの主な登録内容の 一覧を表1に示す. 表 1 海外のレジストリの登録内容
レジストリ名 GBIF MDRDoD EPA SoR METeOR UK ITS
モデル ○ ○ ○ ○ データ要素 ○ ○ ○ ○ ○ XMLスキーマ ○ ○ ○ ○ ネームスペース ○ ○ 参照コード ○ ○ ○ ○ 用語集 ○ ○ ○ ○ レガシー情報 ○ ○ ○ ○ また,調査対象レジストリは全てキーワード検索 ができるが,レジストリが大規模になるほど検索効 率が悪く,様々な絞り込み検索機能が不可欠であ る.GBIFでは,一般名称からインデックス上の学 名を表示して検索する.DoD MDRでは,情報リソー スを選択することができる.METeORは,ユニーク なURLを持つ個々のメタデータ項目を,ダイレク トに検索できる仕組みになっている.DoD MDRや METeORでは,調査した全ての項目を登録しており, 大変参考となる事例であるが,地球観測データや地 理空間情報に係わる情報は登録していない.GBIF についても,地図画面を表示する程度である.また, DoD MDRでは,データ要素等の関係を登録しでき る機能はあるものの,本研究の目的としているオン トロジー情報との連携によるデータ要素の連携につ いては,既存のレジストリで採用しているものは無 かった. 2.2.ユーザ要求 様々なデータモデルやデータ仕様,標準規格等を 共有するためのデータモデルレジストリの開発・運 用に向けて,開発するレジストリの利用対象者(デー タ仕様作成者,データ作成者・データ利用者,アプ リケーションシステム設計者)に対し,利用の場面 を想定するためのヒヤリング調査を行い,利用者の 要求をまとめた.ヒヤリング調査は,開発メーカ等 の若干名の実務者を対象に行った.実務者を対象に ヒヤリング調査を行っており調査の妥当性がある. これらの利用者の機能要件を整理することにより, レジストリの管理対象, 登録・検索機能の開発項目 を整理した. 2.2.1.データ仕様作成者 データ仕様作成者は,既存のデータモデルを参考 に,効率良く必要とするデータモデルを作成したい と考えている.その際に,内容の類似する複数のデー タモデルの関係を把握し,類似したデータモデルが データセットごとに重複して作成されるのを避ける 必要がある.また,作成したデータモデルを共有, 普及,流通させるために公開し,作成したデータモ デルが評価されるような仕組みを検討する必要があ る.さらに,既存のデータモデルを評価し,より良 いデータモデルに更新したいといった要望もある. 2.2.2.データ作成者・データ利用者 データ作成者や利用者は,作成/利用するデータ の構造,データ項目,定義を詳しく知りたいといっ た要望がある.作成/利用したデータの分野には, 他にどのようなデータモデルがあるのか把握・参照 し,作成/利用したデータが対象とするデータモデ ルを,より使いやすいものとするため,データモデ ル作成者と意見を共有したいと考えている. 2.2.3.アプリケーションシステム設計者 アプリケーションシステム設計者は,システムが 対象とするデータモデルと,全体または一部が類似 する構造を持つ他のデータモデルを扱う既存の仕組 み(プログラムなど)があれば再利用したいと考えて
いる.また,他のアプリケーションシステムと連携 したいとき,自身のシステムが対象とするデータモ デルと他のシステムが対象とするデータモデルの構 造や項目を比較するのに利用したいと考えている. 2.3.データモデルレジストリの機能要件 データモデルレジストリに関する海外の先行事 例とユーザ要求をもとに,本レジストリシステムの 機能要件を以下に整理した.先行事例にある様に, ISO/IEC11179に準拠し,ダブリン・コア(メタデータ を記述するための共通の語彙)に準拠した管理情報 を持つデータ仕様やデータモデルの登録・更新・検 索ができる機能に加え,検索利便性向上,再利用支 援機能を実現させるために,データ構成要素レベル の登録・更新・検索機能及び支援ツールの提供,デー タ要素間関連情報やオントロジー情報につながるア プローチを含んだデータモデルレジストリである. 2.3.1.データモデル登録・管理機能要件 ①地理空間情報に係るデータ仕様の管理情報を登録 できること. ②製品仕様書などのデータ仕様説明書及び地理情報 に係るデータモデル(応用スキーマのモデル構造) の管理ができること. ③データモデル構成要素の管理が可能であること. データモデル構成要素とは,クラス,属性及び関 連等を指す. ④データモデル構成要素は,UMLで作成された モデルをツール間で交換するための XMI(XML Metadata Interchange)ファイルを使用して登録及 び管理を行う.さらに,多種多様な形式で作成 されたデータモデル,例えばXML Schema等の UML以外で作成されたモデルについても登録及 び管理を可能とすること. ⑤データ仕様に関係する各種文書ファイルを関連 ファイルとして管理できること. 2.3.2.データモデル検索機能要件 ①検索は,以下を対象として行い必要に応じて全文 検索を行うものとする. • データ仕様の管理情報 • データ仕様説明書 • データモデル • データ仕様に関係する各種文書ファイル ②フリーワードによる検索及びクラス,属性,関連 などの条件を指定した検索が可能であること. ③データモデルを分解して個々の要素の単位まで柔 軟に検索し利用できること. ④検索結果の表示には,データ仕様説明書,データ モデル,データモデル構成要素について,目的と するデータ仕様が分かりやすいように表示するこ と. ⑤問い合わせに適合するデータを利用者が効率的に 検索できるように検索結果の表示には,検索キー ワードに対して,タイトルがヒットしたのか,あ るいは,定義文がヒットしたのかなど検索項目・ ないようの優先順位を設けること. ⑥オントロジー情報との連携により,分野をまたい だ専門用語の違いやゆらぎを吸収した検索サポー トができること. ⑦データモデルを視覚化して,ブラウザの汎用的な 機能で参照できること. ⑧問い合わせ結果として,データ仕様に関する以下 のファイルを取得できること. • 製品仕様書などのデータ仕様説明書 • モデリングツールで作成したモデルデータ ファイル • データ仕様に関係する各種文書ファイル 3.データモデルレジストリの概要 開発したデータモデルレジストリは,データ構造 やデータ項目の名称,データの型などのデータ仕様 の一元管理を行い,登録・管理・検索機能を持った システムである.主に地理情報に係わる多種多様な 形式で作成されるデータ仕様やデータモデルを対象 とし,これらを一定のルールに従い統一的に管理し, 検索できる様にしている.多種多様な形式とは,ファ イルの書式やモデルの記法をさす.ファイルの書式 にはPDF形式,テキスト形式,ウェブで公開され るHTML形式,モデリングツール独自の形式を対
象としており,モデルの記法にはモデリング言語と して一般的なUMLだけではなく,XMLスキーマま たは表形式を対象としている.図1に開発したデー タモデルレジストリの概要を示す.データモデルレ ジストリに登録されたデータモデルやデータ仕様 は,構造を解釈して構成する要素毎に分解し,管理・ 検索されて利用される.本レジストリの機能は大き く三つに分けられ,地理空間情報に係わるデータモ デル,データ仕様及びデータモデルを構成する個々 の要素を登録する機能,それらを管理する機能,さ らに登録されたデータモデルをキーワードにより検 索する機能である.検索の機能には,検索されたモ デルを図として可視化表示する機能を含んでいる. また,ダウンロードによりデータ仕様やモデルを取 得する機能も含んでいる.さらに,本レジストリで は,外部のデータ提供システムとの連携を図り,デー タモデルレジストリから,実データにアクセスでき るようにした. さらに,システムを設計する上では,将来的な幅 広い利用を想定し,以下のISO国際規格及び関連仕 様を参考に設計及び構築した. • ISO11179-3:情報技術 – メタデータレジストリ - Part 3: メタモデルと基本属性 • ISO19109:地理情報―応用スキーマのための 規則 • ISO19110:地理情報―地物カタログ化法 • ISO19131:地理情報―データ製品仕様 • ISO19135:地理情報―項目の登録手順 • ISO19763-2:情報技術―メタモデル相互運用枠 組み標準化 - Part-2: コアモデル
• XMI (XML Metadata Interchange)に関するISO 国際規格及びOMG(Object Management Group) 仕様
• UML(Unified Modeling Language)に関するISO 国際規格及びOMG仕様 本レジストリでは,モデルやデータ仕様の検索を より柔軟に,そしてより目的に合う検索を行うため, モデルを構成する個々の要素を解釈して検索を行っ ている.また,複数の検索条件に合うモデルやデー タ仕様に対して重み付けを行い,結果を返してい る.重み付けとは,例えば検索条件として指定した キーワードに対して,データ仕様のタイトルがヒッ 図 1 データモデルレジストリの概要
トしたのか,データ仕様を説明する定義文書がヒッ トしたのか,モデルを構成する要素がヒットしたの かなどにより検索結果の優先順位を決める指標とな るものである.これにより,利用者は,より目的に 合うモデルやデータ仕様を迅速に確認することがで き,また,検索条件に必ずしも合致していなくても 目的に対して何らかの関係のあるモデルやデータ仕 様も確認することができる.さらに,本レジストリ では,個々のデータモデルやデータ仕様を管理する だけでなく,登録したデータモデル,データ仕様ま たはデータモデルを構成する個々の要素どうしの関 係性も管理している.例えば,あるデータモデルを 作成する際に他のデータモデルを利用して作成した 場合,それらのデータモデルどうしの関係性を管理 している.ある分野で作成されたデータモデルは他 の分野で作成されたデータモデルと類似している場 合があるが,データモデルを作成する際の要件が異 なるため,その利用方法は異なる.この様な情報を モデルどうしの関係性として管理している.これに より個々の分野のモデルのどこが類似しどこが異な るのかについて管理できるようになり,利用者はよ り明確にモデルの内容を理解することができる. 4.データモデルレジストリの機能 4.1.データモデルの登録 4.1.1.登録形式 登録するファイルは,メタデータとなる管理情報 を記述したXML文書,自由に記述されたPDF等の データの仕様書に加え,厳密にモデリング言語に より表現されたデータモデルを登録対象としてい る.既存のデータモデルは,様々な形式で作成され ているが,それらをシステムで読み込む際のフォー マットとして,XMI2.1/UML2.1を採用した.XMIは, モデルを各種ツール,リポジトリ(データや情報, プログラミングなどが保管されている場所),ミド ルウェア間でXML文書によって交換するための標 準規格である.つまり,モデリングツールに依存し ないフォーマットであり,モデルの再利用性が高い. また,モデリングツールより出力可能である.XMI のバージョンは, 2.1を採用する.XMI2.1は,MOF
(Meta Object Facility)2.0に対応しており,様々なメ タモデルに従うデータモデルを取り扱う際に利用で きると考える.MOFとは,モデル駆動工学のため の標準規格である.メタモデルとは,ある問題領域 でのモデリングに適用可能で有益なフレーム/規則 /制限/モデル/理論を意味する.MOFにより定義さ れたメタモデルに基づくモデルであればXMIによ りXML文書化が可能である. 問題点としては,モ デリングツールにより対応するXMIのバージョン が異なり,現時点では異なるツールどうしのモデル 交換の際には,その都度XMI2.1に変換するための ツールを作成しているが,対応しているXMIのバー ジョンは製品によって異なり,また独自の拡張が施 されているものも多く,互換性が保たれていないと いった問題や制約があるため今後検討していく.さ らに,検索を支援するために,主題分類やキーワー ドを登録するようにしている. 4.1.2.参照関係の登録 データモデルレジストリでは,登録したデータ仕 様同士,データモデル同士,または,データモデル 構成要素同士の参照関係もあわせて管理する.参考 にした論理モデルの規格では,関係性(類似度)の 種別をISO19135,ISO19736に従い定義している. しかし,これらの種別を厳密に定義するのが難しい ため,本レジストリでは,「完全に同一」または「何 らかの関係がある」の2種類の種別を設定し,その 内容を補足するために,「備考」入力欄を設けること で対応した.今後,様々なデータモデルを登録する 中で,関係性(類似度)として設定すべき内容の精 査を行うものとする. 4.2.データモデルの管理 データモデルレジストリの管理対象は,データ モデルおよびデータモデルに関連するデータ仕様 書,データモデル構成要素とした.また,これらを 説明する情報をメタデータとして合わせて管理して いる.図2にデータモデルレジストリの管理対象を 示す.既存のデータモデルは,様々な形式で作成 されているが,まずは地理情報に係る標準規格で
あるISO19000シリーズで規定するUMLクラス図を 対象としている.さらに,国内外の既存の多くの モデルで採用しているXMLスキーマについても対 象としている.また,XSD(XMLスキーマドキュ メント)の作成に使用するW3C(World Wide Web Consortium)の標準言語)やXMI等のモデリングツー ル固有のフォーマットにも対応している.その他の 形式のモデル,例えば,ER(Entity-Relationship)図 やテキスト形式の仕様等については,基本的には データ仕様書を登録することで対応した.ER図と は,データを実体,関連,属性の3つの構成要素で モデル化するERモデルを図で表した物である.デー タ仕様書はPDF形式で文字認識可能なファイルで あれば,システムで全文検索対象となる.または, これらのモデルを何らかの方法でUMLクラス図に 帰着させれば,システムで取り扱うことができる. 本研究で行うデータモデル登録では,実験的に, テキスト形式のモデルをUMLクラス図に帰着させ てデータモデルレジストリに登録した.その方法は, モデリングツールを利用して,テキスト形式の仕様 をUMLクラス図におこした. 4.3.データモデルの検索 4.3.1.検索手法 データモデルレジストリの検索対象は,データ仕 様,データモデル,及びデータモデル構成要素のメ タデータである.なお,データモデル構成要素に関 しては,クラス,関連,属性,コードリストのよう にデータモデルの構造を解釈した検索も行ってい る.また,データ仕様説明書に関して,フォーマッ トがPDFで文字認識可能なものについては,全文 検索を行っている.本レジストリでは,フリーワー ド検索と条件を指定した検索を行えるようにし,検 索結果の重み付けを行い,2つの方法(完全一致/部 分一致,名称/定義文)を実装した. 検索における完全一致/部分一致は,フリーワー ド検索,条件検索に適用している.キーワードに対 して,完全一致の場合は重みを大きく,部分一致の 場合は重みを小さくしている.ここで,完全一致・ 部分一致とは,例えば,「道路」を検索した場合,「道 路」という名称を持つクラスがあれば完全一致,「高 速道路」という名称を持つクラスがあれば部分一致 となる. 検索における名称/定義文は,条件検索に適用す る.例えば,クラスを検索したい場合,キーワード に対してクラスの名称が一致した場合は重みを大き く,定義文にキーワードが含まれる場合は重みを小 さくする.また,定義文がヒットした場合と同様の 扱いをする例として,属性を検索したい場合,属性 が一致した場合は重みを大きく,同じくプロパティ として定義される関連役割が一致した場合は重みを 小さくする. 4.3.2. オントロジー情報との連携 本システムに登録されている様々なデータモデル は,一般に専門用語を用いて定義されている.この 図 2 データモデルレジスリの管理対象
ため,異分野で従事している利用者が専門用語を十 分に理解していない場合,求めるデータモデルがシ ステムに登録されていたとしても見つけられない ケースが考えられる.例えば,「ガードレール」は土 木分野における専門用語では「防護柵」と記述され ているため,「ガードレール」から「防護柵」を連想 できない利用者は,「防護柵」のモデルを検索するこ とができないことになる.そこで,専門用語に詳し くない利用者であっても求めるモデルを容易に検索 することが可能となるような仕組みについて検討 し,本レジストリでは,オントロジー情報との連携 を行った. キーワード検索に関する前述の問題の解決策とし て,データモデルの検索をおこなった際に,検索結 果と併せて検索キーワードに関するオントロジー情 報を関連語として利用者に掲示する仕組みを構築し た.これにより,「ガードレール」での検索結果は従 来と同様に0件かもしれないが,「ガードレール」に 関連する専門用語である「防護柵」が図3の様に利 用者に掲示される.そして,利用者は掲示された専 門用語について吟味し,次回の検索キーワードとし て活用するなどの効果が期待できる. オントロジー情報については,データ統合・解 析システム(DIAS)プロジェクト(地球観測デー タ統融合連携研究機構, 2010)においてSemantic MediaWiki を用いた各分野の専門用語作成支援シス テムが開発・公開されており,このシステムから取 得することができる.また,複数の専門用語作成支 援システムから専門用語を串刺し的に逆引き検索可 能な逆引き辞書システムも別途公開されているた め,専門用語作成支援システムへのアクセスは逆引 き辞書システムを介して行っている.逆引き辞書シ ステムの利用は,公開されているWebAPIを用いる (長井・小野ら,2009). オントロジーは,次世代のウェブであるセマン ティック・ウェブ(Semantic Web)の中核的な技術 の一つである.ここでの,オントロジーの具体的な 内容は,専門用語や構造化された分類体系,あるい はシソーラス等である.オントロジーとは,非常に 厳格に概念の整理方法を規定して,きちんと作成す るものから,自然言語処理に使うための用語集,語 法集レベルのものまで幅広く定義されているが,こ こでは,専門用語レベルものを指している.ただし, 用語としては既存の辞典を対象としており,収録内 容や定義や関連情報などは十分高いレベルの標準性 を有している. 4.3.3.検索結果の表示 本レジストリの検索結果の表示の画面を図4に示 す.「防護柵」という検索キーワードに対して,ヒッ トした箇所をハイライト表示し,複数の検索結果が ある場合には,重みの合計が大きい順に表示してい る.また,「防護柵」というクラスは,「3次元GISデー タガイドライン」というデータ仕様で使われており, このデータ仕様は,「歩行者ITS空間データ製品仕様 書」と何らかの関係があることを示している. データモデルの構造はツリー表示と図表示の2つ の方法で視覚化する.クラスにどのような属性や関 連役割が定義されているかについて,ツリー形式で 表示している.図表示を図5に示す.クラスにどの 図 4 検索結果表示画面 図 3 オントロジー情報との連携
ような属性や関連役割が定義されているかについ て,UMLクラス図で表示している.このとき,当 該クラスの上位クラスに定義されている属性や関連 役割も合わせて表示している. 5.評価 データモデルレジストリは,データモデル検索 シ ス テ ム プ ロ ト タ イ プ と し て,(http://model.csis. u-tokyo.ac.jp/)にて公開している.システムの要件 および機能が満たされているか,また,想定される 利用が可能であるかどうかについて,評価内容を整 理し,実験シナリオに従って,システムの検証を 行った.環境,防災,地図,土木施設,河川,生物, 水文・気象,地質,オントロジー等に係る,既存 の70種類の様々なデータモデルを登録試験した(表 2).必要に応じて,データ仕様書に基づきデータ モデルを作成し登録した.欧州の空間情報基盤推進 を定めた指令(INSPIRE)のデータモデル(European Commission, 2010)やCEOP (Coordinated Energy and Water Cycle Observations Project, 2010)の衛星観測 データのメタデータ仕様についても投入した.ま た,OWL形式で記述された地球科学についてのオ ントロジーをUMLに変換し, データモデルとして 投入した.オントロジーは複数のパッケージをモデ ルとして解釈し,構成している.オントロジーの記 述仕様としては,RDFを語彙拡張したOWLバージョ ン1.0 がW3Cによって標準勧告されており,NASA のSWEET(Semantic Web for Earth and Environmental Terminology)でもOWLを用いてオントロジーを記 述している(NASA, 2011). これらのデータモデルを利用して,管理および検 索に関する一連の機能を確認した.準備したモデル を全て登録し,問題なく登録されることを確認した. しかしながら,モデリングツールで作成したUML クラス図に残存する不要なクラスや関連,例えば, 一度作成したクラスなどで,作成過程において不要 となり表示上削除したが,モデル中には残ったまま のものがXMIに出力され,システムにそのまま取 り込まれてしまっている問題もあり,登録を行う際 に注意が必要である.また登録されたデータモデル の評価を行うため,今後は,本レジストリの利用者 の検索ログを分析し,検索結果に対するダウンロー ドの頻度などから重み付けの妥当性を確認する必要 がある. 表 2 登録したデータモデル 分野 登録数 主なモデルの内容 環境 2 沿岸海域の観測データ(水質,底質,流速等)の構造を定義 防災 2 大規模地震災害において必要となる情報を定義 地図 28 GISを構築する際の最も基本的な項目(行政区 域,海岸線,街区,道路中心線,鉄道,公共 施設等)を定義 土木施設 22 道路管理施設を定義,下水道管理施設を定義 河川 4 取排水系統に関する水路ネットワークの構造を定義 生物 2 生物に係る標本や観察などを定義 水文・気象 6 河川流域における観測データ(気温,湿度,風 速,放射,土壌温度・水分等)を定義,同メタ データを定義 地質 1 ボーリングデータの構造を定義 オントロ ジー 1 OWL形式で記述された地球科学についてのオントロジーをUMLに変換し,データモデルとして投入 その他 3 位置情報の与え方を定義 図 5 図表示
6.おわりに 情報の電子化や地理情報標準のさらなる普及によ り,様々なデータモデルが出現することが予想され, 現在個別に管理しているデータモデルを統一した方 法で登録・管理し,その内容及び構造を検索し,目 的に合ったデータモデルを閲覧・再利用できる仕組 みとして,データモデルレジストリを開発した.地 球観測データや地理情報の相互利用を支援すること に焦点をあて,環境,防災,地図,土木施設,河川, 生物,水文・気象等に係る,既存の70種類の様々 なデータモデルを登録し,レジストリの運用を開始 した.データモデルレジストリは,データモデル検 索システムプロトタイプとして,(http://model.csis. u-tokyo.ac.jp/)にて公開している.また,オントロ ジー情報との連携により,分野をまたいだ専門用語 の違いやゆらぎを吸収し,効率的にデータモデルの 相互利用ができるようになった. オントロジー情報との連携を図り,地球観測に係 わる様々な分野をまたいで,意味,定義レベルでの データの相互流通を支援する.オントロジーが横断 的に共有できるようになると,その情報が表してい る内容が明確になり,分野をまたいでデータや知識 の相互利用を手助けすることができる.データセッ トに関する共通認識を高め,データモデルやメタ データの記述を標準的な表現に収束させ,部分的な 標準化にも貢献することができると考えられる.さ らに,オントロジーを利用したデータモデルや仕様, データの相互流通ができるようになると,分散的に 蓄積されている様々なデータや情報が容易に統合で きる様になり,グローバルで学際的な問題に迅速に 対応できる様になると考えられる(長井, 2009). 今後は,開発したデータモデルレジストリを運用 し,既存のデータモデルをさらに登録するとともに, データモデルの公開し,分野やコミュニティを超え て評価を得られる仕組みを構築する必要がある.さ らに,データモデルを評価する仕組みを利用して データモデルが更新され,より最適なデータモデル が構築できるようなると,データの相互流通性が進 んでいくと考えられる. 謝辞 本研究は,国家基幹技術「データ統合・解析シス テム」(DIAS)プロジェクトによるものである. ここ に深謝の意を示す. 参考文献 柴崎亮介(2005)環境情報とオントロジー.「環境情 報科学」,33(4),2-8. 長井正彦(2009)地球観測データの相互流通性の支 援.「JACIC情報」,93,0-83. 地球観測データ統融合連携研究機構 (2010) データ 統合・解析システム. 長井正彦・小野雅史・柴崎亮介(2009)地球観測デー タのためのリモートセンシングオントロジーの構築. 「写真測量とリモートセンシング」,48(1),32-40.
Australian Institute of Health and Welfare (2009) ME-TeOR.
<http://meteor.aihw.gov.au/>
Bruce Bargmeyer・柴崎亮介(抄訳)(2005)米国環 境保護局におけるEDR(環境レジストリ)とISO/ IEC11179.「情報科学」,33(4),18-23.
Coordinated Energy and Water Cycle Observa-tions Pro-ject (2010). <http://www.ceop.net/>
Defense Information System Agency (2009) DoD Meta-data Registry.
<https://metadata.dod.mil/mdrPortal/appmanager/mdr/ mdr>
European Commission (2010) Infrastructure for Spatial Information in Europe. <http://inspire.jrc.ec.europa.eu/ index.cfm>
Global Biodiversity Information Facility (2010) Biodi-versity Data Portal.
<http://www.gbif.org/>
Highways Agency (2010) ITS Metadata Regis-try. <http://www.itsregistry.org.ul/>
NASA (2010) Semantic Web for Earth and En-vironmen-tal Terminology.
<http://sweet.jpl.nasa.gov/>
U.S. Environment Protection Agency (2010) Environ-mental Protection Agency System of Registries.
<http://www.epa.gov/sor/>
Wolfgang Kresse (2008) Standardization in Photogram-metry and Remote Sensing, The XXI Congress The International Society for Photogrammetry and Remote Sensing Proceedings, pp1763-1767.
(2011年1月1日原稿受理,2012年7月28日採用決定, 2012年11月9日デジタルライブラリ掲載)