非文献リポジトリとは
著者 高田 良宏
雑誌名 文化資源情報論
巻 2013
号 2
ページ 207‑217
発行年 2012‑03‑25
URL http://hdl.handle.net/2297/34391
非文献リポジトリとは 付録(講義資料)
0 目次(講義の内容)
0 1 機関リポジトリ
2 非文献リポジトリ(学術資源リポジトリ)
3
金沢大学での取り組み(これまでの取り組み)
4
金沢大学での取り組み(現在の取り組み)
5
他大学等での例
1 機関リポジトリ
1
・ 1
Information Media Center of Kanazawa University 4
機関リポジトリ
リポジトリとは:
何らかの情報を体系化して保管している場所
(データ貯蔵庫)
大学等の学術機関において,
生産された研究成果を電子的な形態で蓄積・保存し,
インターネット上で公開するシステム(サービス)
⇒機関リポジトリ(学術リポジトリ)
図書館等が中心となって構築
主に,学術論文,紀要,研究報告書などの書誌系の情報 をデジタル化して格納
⇒このような資料を,ここでは,文献資料と呼ぶ
1
・ 2
機関リポジトリの状況
Information Media Center, Kanazawa University 5
176機関 (2012/6/12)
学術機関リポジトリ構築連携支援事業:機関リポジトリ一覧,
http://www.nii.ac.jp/irp/list/ (2012/6/19参照)
金沢大学の状況
金沢大学学術情報リポジトリ(KURA)
Kanazawa University Repository for Academic Resources http://dspace.lib.kanazawa-u.ac.jp/dspace/ (2012/6/19参照)
2006年からサービス開始
1
・ 3
KURA :金沢大学学術情報リポジトリ
Information Media Center, Kanazawa University 6
KURAの概要より
本学の教職員等が,本学における教育・研究活動の結果として生み 出した学術的な情報(コンテンツ)を電子的な形態で保存し,インター ネット上で公開するシステムです。
対象
学術雑誌掲載論文:学外の学術雑誌等に発表した論文や報告
紀要:本学刊行の紀要・広報等
報告書:本学刊行のCOE等の報告書。
今後,科研費報告書も収録予定です。
学位論文:本学に提出された学位論文 で著者の許諾の得られたもの
その他:会議・学会等の発表資料等を 登録しています。その他,プレプリント,
実験データ,電子教材,シラバス,
統計データなどについても可能です。
1
・ 4
KURA :金沢大学学術情報リポジトリ
Information Media Center, Kanazawa University 7
1
・ 5
KURA :検索(キーワードによる検索結果一覧)
Information Media Center, Kanazawa University 8
1
・ 6
KURA :金沢大学学術情報リポジトリ
Information Media Center, Kanazawa University 9
1
・ 7
KURA :ブラウズ
(階層化された分類による検索)Information Media Center, Kanazawa University 10
1
・ 8
KURA :ブラウズ
(階層化された分類による検索)Information Media Center, Kanazawa University 11
1
・ 9
KURA :アイテムの簡易表示画面
Information Media Center, Kanazawa University 12
Dublin Core
世界中で一意の識別子
1
・ 10
KURA :アイテムの詳細表示画面
Information Media Center, Kanazawa University 13
Dublin Core
1
・ 11
Information Media Center of Kanazawa University 14
メタデータ : Dublin Core
メタデータを記述するための語彙
WWW上のリソース情報を記述
限定された小数の要素を標準化
青:基本要素 15個
(基本的な概念を幅広く表す)
緑:拡張要素
(より狭い概念を表す)
構成要素
☆
書誌系のコンテンツでは,Dublin Coreの 考え方に沿った,メタデータの記述法が 確立
1
・ 12
メタデータ : Dublin Core
Information Media Center, Kanazawa University 15
15の基本要素とは…
Title タイトル。通常はあるリソースが公式に知られる名前を指す。
Creator制作者。リソースの内容に責任を持つもの。人や組織などがあげられ、その名前を記す。
Subjectテーマ。リソースの内容が持つトピック。まとめられた語彙の中から使うことが望ましい。
Description詳細。リソース内容の説明。要約、目次など形式は定められていない。
Publisher提供者。リソースを発行に責任を持つもの。Creatorに同じく人や組織などがあげられ、その名前を記する。
Contributor協力者。リソースの内容に協力するもの。人や組織などの名前を示す。
Date日付。リソースに関する主要な出来事が起こった日付(更新日、作成日など)を記述する。
Type タイプ。リソースの内容が持つカテゴリ、ジャンルなど。まとめられた語彙から使うことが推奨されている。なお、
物理的/デジタル化されているものには、format要素を用いることが定められている。
Formatフォーマット。リソースが持つ物理的/デジタル化されている性質。メディアタイプなどがあげられ、リソースを
処理するソフトウェアやハードウェアを知るための手がかりとすることができる。MIMEなど。
Identifier 識別子。曖昧さのないものが必要とされる。URIやISBNなどが相当する。
Sourceソース。リソースが参照しているもの。公式な識別システムに従っている文字列や番号が望ましい。
Language言語。リソースがどの言語で書かれているのかを、RFC 3066の言語コード書式で書くのが望ましい。
Relation関連。関連リソースを公式な識別システムに従っている文字列や番号で記述するのが望ましい。
Coverage 範囲。地名や緯度経度などで表記されるものや、日付、管理している範囲など。地名や時代の名前が緯
度経度や日付より推奨される。
Rights権利。著作権や知的所有権などの権利に関する情報を記述する。この要素が記述されていない場合にリ
ソースの権利情報を推測しても、それは何も意味しないことに注意すること。
1
・ 13
横断検索:学術機関リポジトリポータル
Information Media Center, Kanazawa University 16
JAIRO
(呼称:ジャイロ)日本の学術機関リポジトリに蓄積された学術情報(学術雑誌論文、
学位論文、研究紀要、研究報告書等)を横断的に検索可能
国立情報学研究所(NII)が運用.各機関の学術機関リポジトリのメタデータ を収集
http://jairo.nii.ac.jp/ (2012/6/19参照)
1
・ 14
横断検索:ハーベスティング
Information Media Center, Kanazawa University 17
ハーベスティング:
機関リポジトリに登録されているメタデータを収集する(刈り取る)こと
サービスプロバイダが,各データプロバイダにメタデータを取りに来 る(刈り取りに来る)
金沢大学 JAIRO リポジトリポータル
○○研究所 ハーベスティング
○○大学
データプロバイダ
△△大学 データプロバイダ
(機関リポジトリ)
サービスプロバイダ
(JAIRO等)
要求 応答
サービスプロバイダ
1
・ 15
Information Media Center, Kanazawa University
ここまでのまとめと問題点
世界的に見ても価値の高い情報
日々確実に増加 大学には…
学術論文 紀要 研究報告書
機関リポジトリ等
・世界に向けて発信
・有効に利用
集中的に管理
書誌系の情報
画像,動画,
音声などの コレクション 実験・観測 データ
学術的に非常に貴重 学内外から参照要請
・公開が遅れている
・有効に利用されていない
18 ☆
2 非文献リポジトリ(学術資源リポジトリ)
2
・ 1
文献資料
⇒学術論文,紀要,研究報告書など,書誌情報を元に 管理できる資料
Information Media Center, Kanazawa University 20
非文献資料リポジトリ
非文献資料
⇒文献資料以外.写真,動画,音声,教材などの コレクション,実験観測データ
ここでは,非文献資料を対象としたリポジトリを 非文献資料リポジトリと呼ぶ
☆
2
・ 2
学術資源リポジトリ
Information Media Center, Kanazawa University 21
文献,非文献の境界は明確でない
大学等研究教育機関あるいは研究者がその活動におい て,収集あるいは生成した貴重な(学術的な)資料の総 称を学術資源と呼ぶ
学術資源には,博物館や資料館に納められるような貴 重資料をはじめ,研究者が収集する歴史的資料,標本 類,実験観測データから文献等まで含まれる
学術資料を蓄積し,現在および将来の社会(研究活 動?)で利活用できる形で発信および提供するものを 学術資源リポジトリと呼ぶ
2
・ 3
問題点
Information Media Center, Kanazawa University 22
プラットフォームの課題
多種多様な非文献資料の取り扱いに適した汎用プラッフォー ムが必要
機関リポジトリで多用されているプラットフォームは非文献の取り扱 いを考慮していない
メタデータの課題
非文献資料の多種多様かつ専門的な情報を的確に表現する ためのメタデータ要素群の設計が必要
機関リポジトリで一般的に使われているメタデータ要素群は非文献 の取り扱いを考慮していない
横断検索の課題
分野,機関横断的検索環境が必要
機関リポジトリポータルであるJAIROの非文献資料版が必要
3 金沢大学での取り組み(これまでの取り組み)
3
・
1
蓄積している非文献資料(抜粋)Information Media Center, Kanazawa University
金沢大学での取り組み(これまでの取り組み)
コンテンツの内容 分野 種類 全文検索 件数等 地名等の情 報 インドの仏像・壁画・
遺跡 人文科学 写真 不可 2万件以上 発掘地/所蔵
地 中国語の方言 人文科学 音声/地図 不可 約千件 調査地 中国の伝統芸能 人文科学 動画/写真 不可 800GB以
上 撮影地
岩石標本 自然科学 写真 不可 数万件 採取地
「あけぼの衛星」の観
測データ 自然科学 バイナリ/画像 不可 約7千件 観測座標 資料館所蔵品 共通 写真 不可 数千件 作成地/他
e-Learning素材 共通 作成ソフトに依
存 一部可 約1万件 作成地
24
3
・ 2
Information Media Center, Kanazawa University 25
蓄積している非文献資料 その2
インドの宗教画像
(アジア図像集成)
あけぼの衛星の観測データ
(サマリープロット)
e-Learning素材 四高物理機器
☆
3
・ 3
Information Media Center, Kanazawa University 26
実装例:その1 アジア図像集成
☆
サムネイル
分類
メタデータ 簡易表示
3
・ 4
Information Media Center, Kanazawa University 27
実装例 その2
e-Learning用素材 四高物理機器
(資料館収蔵品)
あけぼの衛星観測データ サマリープロット
3
・ 5
Information Media Center, Kanazawa University
1. リポジトリプラットフォームのDSpaceをベースにする
(KURAをはじめ,国内の機関で最も多く使用されている)
⇒機能を改良,追加するという形で開発を進める 2. メタデータの互換性の確保
⇒当該リポジトリでの詳細な定義と他との互換性の両立 3. 保守性の確保
⇒情報技術に詳しくない管理者でも,容易に管理できる 仕組みの導入
4. Google Earthによる情報の可視化
⇒地理的な位置情報を用いた視覚的な検索機能の導入 5. 他リポジトリとの連携
⇒文献コンテンツと非文献コンテンツを統一的に検索
28
開発方針
非文献資料に対応した汎用性の高い 非文献資料リポジトリ
☆
3
・ 6
文献資料 ⇒メタデータの記述法が確立
非文献資料 ⇒多様で専門的な情報を的確に表現できない
⇒Dublin Coreを拡張する必要あり!
Information Media Center, Kanazawa University 29
メタデータの互換性の確保
メタデータの互換性を確保
当該リポジトリ内での詳細な定義と他リポジトリとの互換性の両立が可能 非文献資料の特性の違い
によるメタデータ項目の差異を吸収 メタデータを記述するための語彙:Dublin Core
Dumb-Down 原則
メタデータを拡張する場合の原則
⇒組織間の運用ポリシーの違いなどに よるメタデータ項目の差異を吸収 無暗に拡張すると
リポジトリ間の整合性が 取れない
☆
3
・ 7
Information Media Center, Kanazawa University 30
メタデータの互換性の確保
アジア図像集成用の拡張メタデータ語彙
アジア図像集成用の拡張メタデータ語彙(抜粋)
基本要素 限定子 項目名
Coverage currentLocation 所蔵・所在
originalLocation 出土地
Description material 材質
dimensions サイズ
Date datePhotograhed 撮影日
Identifier original 画像コード
Appendix nameOfFile ファイル名
nameOfFolder フォルダ名
3
・ 8
Information Media Center, Kanazawa University 31
保守性の確保
異種コンテンツの共存
複数の異種資料の管理を容易に行いたい!
⇒同一リポジトリに性質の異なる非文献資料を複数登録 Dublin Core標準語彙
・・・ ・・・ コレクション サブ コミュニティ
・・・
アイテム
・・・
・・・
・・・
・・・
ルート コミュニティ
サブ コミュニティ
資料A 資料B 資料C
メタデータ語彙A メタデータ語彙B
アイテムは,
コレクションと コミュニティで分類 資料毎にルート コミュニティを分ける ルートコミュニティ毎に
•メタデータ語彙割当て
•表示設定
コミュニティ ごとの管理
☆
3
・ 9
Information Media Center, Kanazawa University 32
保守性の確保
分類とアイテムの登録・管理
管理者にとって最も負担となる部分である!
資料管理者は,資料関する情報をExcelなどの表計算 ソフトで管理している場合が多い
分類の管理
⇒コミュニティ,コレクションの登録など
アイテムの管理
⇒アイテムの一括登録など
エクセル形式のファイルやエクセルの出力ファイル
(タブ, CSV 形式)を用いて管理を可能とした
☆
3
・ 10
Information Media Center, Kanazawa University 33
保守性の確保
コミュニティとコレクションの記述
☆
コミュニティ コレクション コミュニティ コレクション
エクセル上の記述 リポジトリ上の表示
既存リポジトリの階層をエクセルに保存することも可能
3
・ 11
Information Media Center, K Kanazawa University 34
保守性の確保
一括登録
メタデータを
Excel
等の出力であるタブ区切りテキスト等 から読み込む 様々なコンテンツ登録に使用できるよう、汎用的に作成
1行目:ヘッダ行:メタデータ要素並び
2行目以降:1行1アイテムの情報(1行目に対応したメタデータ並び,
登録先のコミュニティとコレクション,アイテムが保存されているパス)
既存リポジトリのメタデータを保存することも可能
(準備するデータの形式)
3
・ 12
Information Media Center,Kanazawa University 35
異種資料共存 実証運用1
エクセルでの管理例
3
・ 13
Information Media Center, Kanazawa University 36
異種コンテンツ 共存
実証運用2
コミュニティ・
コレクション
3
・ 14
Information Media Center, Kanazawa University 37
異種コンテンツ共存 実証運用3
一覧画面(ブラウズから表示)の表示:コンテンツごとに変更可能
インドの宗教画像
(アジア図像集成)
あけぼの衛星の観測データ
(サマリープロット)
四高物理機器図録
3
・ 15
Information Media Center, Kanazawa University
可視性の向上
Google Earth による情報の可視化
非文献コンテンツの検索性を改善!
⇒全文検索を利用できない(メタデータに対する検索のみ)
非文献資料の持つ位置情報に着目
地図上に情報をプロット
DSpaceの情報を地図上へ表示
Google EarthからDSpaceへの検索 Google Earth
DSpace
発掘地,所蔵地,作成地など
38 ☆
地図上に可視化する仕組み
3
・ 16
Information Media Center, Kanazawa University 39
他リポジトリとの連携
アジア図像集成 ポータルリポジトリ
KURA ハーベスタ
ハーベスティング
非文献資料
文献資料 プロバイダ
他リポジトリとの連携が可能であることを実証
⇒ポータルリポジトリ(ハーベスタ)を構築(図書館に協力)
文献コンテンツと非文献コンテンツを統 一的に検索できることを実証
☆
4 金沢大学での取り組み(現在の取り組み)
4
・ 1
金沢大学での取り組み(現在の取り組み)
Information Media Center, Kanazawa University 40
金沢大学資料館のバーチャルミュージアムプロジェクト
(VM)
http://kuvm.kanazawa-u.ac.jp/
デジタルアーカイブ
4
・ 2
金沢大学資料館の VM
Information Media Center, Kanazawa University 41
金沢大学資料館所蔵所蔵資料を中心に6種類を公開
4
・ 3
例:四高物理実験機器
Information Media Center, Kanazawa University 42
4
・ 4
例:四高物理実験機器:化学天秤
Information Media Center, Kanazawa University 43
4
・ 5
Information Media Center, Kanazawa University 44
例:四高物理実験機器:化学天秤 つづき
4
・ 6
Information Media Center, Kanazawa University 45
例:四高物理実験機器:化学天秤 つづき
4
・ 7
例:明治38年(1905)8月に金沢市小立野に完成した石川県立金沢 病院(後金沢大学附属病院)の設計図
Information Media Center, Kanazawa University 46
4
・ 8
例:きのこムラージュ標本:サクラシメジ
Information Media Center, Kanazawa University 47
1件 紹介
5 他大学等での例
5
・ 1
他大学の例
京都大学資源アーカイブ
Information Media Center, Kanazawa University 48
京都大学デジタルアーカイブシステム
http://das.rra.museum.kyoto-u.ac.jp/infolib/supsearch/
5
・ 2
例:京都大学カラコラム・ヒンズークシ学術探検隊地質班 関係資料, 1955-1956
Information Media Center, Kanazawa University 49
京都大学デジタルアーカイブシステム
http://das.rra.museum.kyoto-u.ac.jp/infolib/supsearch/
5
・ 3
例:京都大学カラコラム・ヒンズークシ学術探検隊地質班 関係資料, 1955-1956
Information Media Center, Kanazawa University 50
京都大学デジタルアーカイブシステム
http://das.rra.museum.kyoto-u.ac.jp/infolib/supsearch/
5
・ 4
例:宮本正太郎資料: 火星スケッチ, 1955-1976
Information Media Center, Kanazawa University 51
京都大学デジタルアーカイブシステム
http://das.rra.museum.kyoto-u.ac.jp/infolib/supsearch/
5
・ 5
例:宮本正太郎資料: 火星スケッチ, 1955-1976
Information Media Center, Kanazawa University 52
京都大学デジタルアーカイブシステム
http://das.rra.museum.kyoto-u.ac.jp/infolib/supsearch/
5
・ 6
遺跡資料リポジトリ
http://rarcom.lib.shimane-u.ac.jp/
Information Media Center, Kanazawa University 53
5
・ 7
島根県:遺跡資料リポジトリ
http://rar.lib.shimane-u.ac.jp/Repository/
Information Media Center, Kanazawa University 54
5
・ 8
島根県:遺跡資料リポジトリ
http://rar.lib.shimane-u.ac.jp/Repository/
Information Media Center, Kanazawa University 55