メタデータの基礎
• メタデータは、「何かについて書いたもの」
• 「何か」、「書き方」は、メタデータを利用する分野、
目的、対象によって決まる。
• 本のメタデータ
• 書店と図書館では必要な情報は異なる
• 古書店と新刊書店でも必要な情報は異なる
• 古紙回収に出すときは、本の中味の情報は使わなくなる
• メタデータは、自分のシステムで使うことに加えて、
ネット上で流通させることが目的になることが多い
• 相互運用性(Interoperability)を持たねばならない
メタデータの基礎
Metadata – 単純化したモデル
• メタデータ( Metadata) は、データに関するデータ
( Data about Data)
• 記述対象リソースに関して、何らかの視点、何らかの目 的の下になされる記述
resource
Metadata Metadata
メタデータの基礎
Metadata – 単純化したモデル
• メタデータ( Metadata) は、データに関するデータ
( Data about Data)
• 記述対象リソースに関して、何らかの視点、何らかの目 的の下になされる記述
resource
Metadata Metadata
メタデータとメタメタデータ
• メタメタデータ:メタデータのメタデータ
• メタメタメタデータ、メタメタメタメタデータ・・・
resource Metadata Metadata
メタデータの基礎
• メタデータを、コンピュータ間で相互に利用、共有 できるようにするには、どんな要件が満たされなけ ればならないか?
• データの共有を行うには、まずコンピュータ同士が コミュニケーションできなければならない
• コンピュータ同士のコミュニケーションとは何か?
• コミュニケーションできること、とはどんなことか?
メタデータの基礎
• コミュニケーションできること
「2者(あるいはそれ以上)の間で、共通の理解(解釈)
ができること」
と定義しよう
• たとえば、 A, B 二つのコンピュータで
• Aから「あ」という文字をBにおくり、Bでそれを「あ」として表示 できること
• Aに表示された図書検索画面で「2000年から2005年の間に 出版された『インターネット』をタイトルに含む本」のBに対して 検索リクエストをだすと、Bでは西暦2000年から2005年、『イ ンターネット』がタイトルの文字列の一部として検索をし、そ の結果をAに返して、Aでそれを正しく表示できること
メタデータの基礎
• これができるためにはどんなことが保証されていなけ ればならないだろうか?
• 二つのコンピュータの上で動くプログラム同士が「コミュニ ケーション」できねばならない
• プログラム同士のコミュニケーションとは?
• 一方から送るデータを他方で「正しく」受け取ることができる
• 一方から送るデータに埋め込まれた指示(暗黙かもしれない)を他 方が「正しく」解釈することができる
• データを「正しく」送受信できることとは?
• ビットレベルで誤りが生じないこと
• 送受信者間で、データの解釈を共通にできること
• \100と$100というように、もし\が$に置き換わってしまうとどうなるか
• 符号化方法(例:文字コード)が同じでなければならないことはない
メタデータの基礎
• メタデータをネット上で流通させ、サービス間(システム 間)で相互に利用することができるのは、ネットワーク上 でのコミュニケーションの仕組みにより、メタデータを扱う プログラム間でデータが「正しく」受け渡しできることが保 証されているから
• コンピュータシステム、コンピュータネットワークは階層モ デルで表されることが多くある。
• 階層モデルでとらえることで
• いずれの階層を定義する場合でも、その階層の 中の機能を考えればよい
• 下位の階層が提供する機能の上に上位の階層を
定義すればよいので、下位階層で実現されるべき
機能はブラックボックス化できる
二つのメタデータを考える
項目 値
なまえ ばんどうたろう 住所 つくば市西平塚 生年 50
職業 飲食業
項目 値
なまえ ばんどうたろう 住所 つくば市西平塚 ジャンル うどん
予算 1000~2000
記述対象は何だろうか?
「なまえ」、「住所」は同じだけど、意味もおなじだろうか?
「ばんどうたろう」は、名字+名前だろうか?
「生年」は何を意味するのだろうか?50は、1950年、昭和50年?
二つのメタデータを考える
• 記述対象は何か?
• 左側は人のように見える、右側はレストラン・食堂であ ろう
• 人だとすると、名字と名前があってもおかしくない
• 名字と名前を区別しない文化はある
• ミドルネームが入る文化もある
• 日本では名前が大人になると変わることもある、あるいは襲名 することもある
• 「なまえ」「住所」の意味は同じだろうか?
• 人の名前とレストランの名前だと意味は違う(かもしれ ない)
• 人だと、勤務先住所と自宅住所の区別があるかもしれ ない
二つのメタデータを考える
• 名前と名字はどこで切れるんだろうか?
• ばんどう・たろう、ばんど・たろう、ばん・どうたろう
• 坂東太郎、バンド太郎、伴堂太郎、、、
• 漢字で書いたものとその読みを書くことは、世界の中で 見た時にそう一般的ではない
• 「生年」は何を意味するか
• 生まれた年なので、たぶん人の生まれ年だろう
• 50だけでは、何もわからない。
• 1950年、昭和50年。。。
二つのメタデータを考える
• このように、パッと見た時に理解できるように思え る記述であっても、詳しく見ていくとわからないこと がいっぱい出てくる
• コンピュータ間でメタデータを共有、流通させるた めには、正確で詳細な解釈規則が与えられなけれ ばならない
• 人間は賢いので、解釈を柔軟にできる。たとえば、左の メタデータが、お店のメタデータだと言われても解釈は できるだろう
• 50のところはかなりあいまいで、解釈しにくくても
メタデータの共有を考える
• コンピュータ同士でメタデータを共有するのにどんなことが 求められるのか?
• データの共有
• メタデータを表現するためのコンピュータ上でのデータ表現が 同じ
• コンピュータ間でメタデータを交換するためのデータ表現が同 じ
• メタデータの表現と解釈
• メタデータの記述項目の意味(=解釈)が同じ
• メタデータの記述項目の値(=記述内容)の解釈が同じ
• たとえば、50は西暦1950年を表す。
• たとえば、飲食業には、うどん屋は入るけど、コーヒーやスナック をその場で食べられるコンビには入らないといった言葉の定義
Title メタデータについて,Dublin Coreとインター ネットの視点から
Creator
氏名:杉本重雄
所属:筑波大学
所属部署: 図書館情報メディア研究科
Subject
Metadata Schema, Interoperability
Date
2004-11-7
Language
ja-JP
Presentation
Location
Osaka, Japan
メタデータを構成するエレメントセット
中味を取り出す
Metadata DB (Catalog DB)
メタデータの具象的な表現
: a DB record
Title メタデータについて,Dublin Coreとインター
ネットの視点から
Creator 氏名:杉本重雄
所属:筑波大学
所属部署: 図書館情報メディア研究科
Subject Metadata Schema, Interoperability
Date 2004-11-7
Language ja-JP
Presentation
Location Osaka, Japan
Metadata DB (Catalog DB)
<dc:Ctle>メタデータについて,Dublin Coreとインターネットの視 点から</dc:Ctle>
<dc:creator xml:lang=“ja”>
<rdf:value>杉本, 重雄 </rdf:value>
<uliscore:pronunciaCon>すぎもと, しげお </uliscore:pronunciaCon>
</dc:creator>
…
メタデータの具象的な表現
: an XML instance
メタデータの表現形式と内容
• 前の例は、内容は同じ、表現形式が異なる例
• たとえば、関係型データベース上に実現したものと、
XMLのデータベースとして実現したもの
• そのままでは、両者を相互につなぐことは難しい
• ただし、内容(=属性や属性値の型)は共通なので形 式変換さえすればつなぐことはできる
• Resource DescripCon Framework (RDF) は、 WWW 上でのメタデータの交換のための共通のデータモ デルと形式を決める標準
• Linked Open Dataの基盤
Title メタデータについて,Dublin Coreとインター ネットの視点から
Creator
氏名:杉本重雄
所属:筑波大学
所属部署: 図書館情報メディア研究科
Subject
Metadata Schema, Interoperability
Date
2004-11-7
Language
ja-JP
Presentation
Location
Osaka, Japan
メタデータを構成するエレメントセット
中味を取り出す
Title メタデータについて,Dublin Coreとインターネットの視点から
Creator 氏名(FN):杉本, 重雄 所属(ORG):筑波大学
所属部局(ORGUNIT): 図書館情報メディア研究科
Subject Metadata Schema, Interoperability
Date 2004-11-7
Language ja-JP
Presentation
Location Osaka, Japan
メタデータを構成するエレメントをばらす
Dublin Core
MySchema vCard
記述項目(エレメント)がどのようなエレメントセットのエレメン トに対応するか、値の書き方について対応付ける。
ISO 8601 RFC 3066
フリーテキスト
フリーテキスト メタデータ
エレメント セット
値の記述形 式あるいは語 彙の名前
メタデータスキーマ (metadata schema)
• メタデータの構造や記述項目の意味を決めるメタ データスキーマは、以下からできている
• 記述項目の定義:名前とその意味
• メタデータの構造定義
• どのような記述項目から全体が構成されているか
• 記述項目ごとの記述制約(必須、省略可等)
• メタデータの実現形式の定義
• よく似たメタデータを比較しながら、メタデータスキー
マを理解し、異なるスキーマのメタデータをつないで
用いるための仕組みについて考える
Title Mixing and Matching Metadata Schema
Creator Name (FN) Sugimoto, Shigeo
Affiliation (ORG) Univ. Tsukuba
Affiliation Unit
(ORGUNIT) Graduate School of Library, Information and Media Studies
Subject Metadata Schema, Interoperability
Date 2007-9-4
Language en
Presentation
Location Bangalore, India
Metadata Schema A
タイトル
Mixing and Matching Metadata Schema
作成者 Shigeo Sugimoto. Univ. Tsukuba, Grad.
School of Library, Information and Media Studies
キーワード Metadata Schema, Interoperability
日付 04/09/07
言語 English
内容記述 Metadata schema interoperability across domains and adaptability