第6回データベースフォーラム(金沢大学総合メディア基盤 センター)発表資料 2006年9月4日
金沢大学学術情報リポジトリ KURA の概要と今後の展望
金沢大学情報部情報企画課情報企画係長
橋 洋平
はじめに
z 金沢大の教育・研究成果を電子的な形態で 保存し,無料公開する金沢大学学術情報リポ ジトリ KURA (以下 KURA )を 2006 年 6 月 12 日 に公開
*KURA=Kanazawa University Repository for Academic resources
z KURA は,全国の大学で公開が始まりつつあ る,「機関リポジトリ( Institutional Repository;
以下 IR) 」と呼ばれる新しい学術情報提供形
態の一つ
発表の内容
z IR とはどういうものか?
z IR の登場した背景
z IR を運用するためのハードとソフト
z IR の特徴:ハーベスティングとメタデータ z KURA の概要のデモ
z KURA の目指す方向と課題
機関リポジトリとは?
大学等の特定の学
術機関がその中で
生産された電子的な
コンテンツを収集・公
開する仕組
電子図書館/電子ジャーナルとの違い
論文や記事の全文をインターネット上に公開し ているという点では大差はない。
電子図書館・・・著作権保護期間の過ぎた貴重 書や利用許諾を得やすい紀要類中心。各大 学のアーカイブ的な位置づけ
電子ジャーナル・・・商業的に販売されている冊
子体の学術雑誌を電子化したものが中心。
学術コミュニケーション変革の動き
z 電子図書館の機能に加え,電子ジャーナル のオルタナティブになろうとしているのが IR z 背景には,各教員が自分の業績をセルフ・
アーカイビングして行くことによって,学術コ ミュニケーションのしくみを変えていこうという 欧米発の「オープンアクセス運動」がある。
z この辺の事情については昨年度の当フォーラ
ムで報告(「機関リポジトリと Open Access 」)
機関リポジトリをめぐる動向
z 欧米の動きが日本にまで拡大
z 物理学分野での e-print archive の成功が IR の前提
• H 17 CSI (最先端学術情報基盤)構築事業
を国立情報学研究所が開始→その事業の一
部が IR 構築→金沢大を含む 18 大学に IR 構築
事業を委任
KURA の立ち上げまでの活動 (1)
z H 17.9 CSI 事業に金沢大学が採択される。
z H17.10 「金沢大学機関リポジトリの在り方 に関する検討委員会」(座長:橋本情報担当 理事)の設置。 3 月までに 3 回実施。
z H17.11 教育研究評議会でアナウンス
z H17.11 自然科学系図書館開館記念シンポ
ジウム:これからの学術コミュニケーション:電
子ジャーナル,オープンアクセス,機関リポジ
トリ
KURA の立ち上げまでの活動 (2)
z H17.12 第1回アンケート調査(学内刊行物調査 ) z H17.12 ~ H17.1 学内説明会の実施
z H18.1 第 2 回アンケート調査(学外刊行物調査)
z H18.1 ~ 2 Open Repositories2006 (シドニー大 学)に 2 名参加。( DSpace ユーザ会, CSI 参加大学 との情報交換,オーストラリア各大学の訪問調査)
z H17.11 & H18.2 CSI 実務担当者会議
z H18. 3 IR 設置要綱承認=附属図書館が担当
z H18. 6 公開&プレスリリース
DSpaceの概要
z MIT と HP 社が共同開発したリポジトリ構築ソ フト。オープンソフトを使って構築
z 各種データ( PDF/HTML/JPEG3 等)の投稿 機能
z 投稿の際にメタデータ(ダブリンコア( Dublin Core Metadata Element Set ))を付与する z メタデータの検索機能
z OAI-PMH のメタデータ・ハーベスティングに
対応(後述)
KURA の DSpace インストール環境
ハードウェア・・・ HP ProLiant ML370 ( OS SUSE Linux )
ソフトウェア ( いずれもオープンソース)
z リポジトリ構築ソフト・・・ DSpace Ver.1.3.2 z データベース・・・ PostgreSQL
z Web サーバ・・・ Jakarta tomcat
z 検索エンジン・・・ Lucene
KURA のメタデータの内容
ダブリンコア及びJuNii準拠したメタデータ
ハーベスティング
1. OAI-PMH (Open Archives Initiative Protocol for
Metadata
Harvesting)に準拠 してメタデータを各 IRに登録
2. データプロバイダ
(各IR)→サービス プロバイダ(JuNii,
OISter,Google Scholar…)へとメ タデータが刈り取 られる
3. 各館がIRに登録し
ていけば,自然に ネットワーク上に露 出していく
IR 公開に際しての準備・登録
1)プロトコル(OAI-PMH)についてよく知っておく
http://www.openarchives.org/OAI/openarchivesprotocol.html 2)データプロバイダとなるためのソフトウェアを選ぶ
http://www.openarchives.org/tools/tools.html
3)IR用サーバの設置。この際,ハンドル名を取得するための登録を行って おく必要がある(業者が代行して行う)http://www.handle.net/
4)ダブリン・コアに従ってメタデータを作成する。
http://dublincore.org/usage/terms/dc/current-elements/
5)リポジトリを Official Open Archives registryに登録する。
http://www.openarchives.org/data/registerasprovider.html The University of Illinois OAI-PMH Data Provider Registry
http://gita.grainger.uiuc.edu/registry/searchform.asp OAデータサービスプロバイダのリストに登録される。
7)DSpaceへのユーザー登録 http://wiki.dspace.org/DspaceInstances 8)JuNii,Google Scholar,Scirusなどサービスプロバイダへの登録
KURAの画面紹介(1)トップ画面
ほとんどDSpace のデフォルト画面 を使っているシン プルな画面
※他大学の事例 http://www.nii.ac .jp/irp/info/list.ht ml
KURA の画面紹介(2)ブラウズ画面
KURA の画面紹介(3)各アイテムの画面
KURA の画面紹介(4)検索画面
KURA の画面紹介(5)関連画面
登録コンテンツ
金沢大学オリジナルコレクションである。
z 学内紀要→金沢大学発の電子ジャーナル化を狙う z 発表済の学術論文
・著者最終稿
→Elsevier等欧米の大半の出版社はIR登録を許可・雑誌掲載版 PDF → APS , IEEE 等は登録可能
SHERPA(http://www.sherpa.ac.uk/romeo.phpで確認
z COE 報告書(予定)
z 科研費報告書(可能なものから)
z 博士論文(予定)
z 図書の一部
データの登録の実際
KURA 内では,コミュニティ(=部局)とコレク ション(≒雑誌名)で管理
(方法1) 1 点ずつメタデータ+ PDF を登録
(方法2)コレクション単位で一括登録
CSV 形式の複数論文のメタデータ+ PDF を圧縮
→サーバで解凍→シェルスクリプトを実行 現状では,図書館で登録する方が良いだろう。
(教員自身での登録=セルフアーカイビング大歓迎)
ここまでのまとめ
IR のメリットとインパクト(1)
ハーベスティングによる視 認性(=Visibility)向上
z 論文の被引用度アップ z 大勢の人の目に触れる z 世界中からのアクセス z 論文単位のダウンロード
数を調べることも可能
(参考文献)
同一ジャーナルに掲載されたオープンアクセス 論文と非オープンアクセス論文のインパク トを比較する/Stevan Harnad and Tim Brody, D-Lib Magazine 10(6),2004 http://www.nii.ac.jp/metadata/irp/harnad /
ここまでのまとめ
IR のメリットとインパクト( 2 )
z 学内の業績の恒久的保存=業績 DB との連携 http://hdl.handle.net/2297/1842
一意に決まるハンドル名が付与される。
2297= 金沢大学の番号(固定)
1842= この番号は一例。論文ごとの番号
業績を溜め込んでいけば,一元管理ができる。
z 学術コミュニケーションの改革=商業的な学術雑誌
の価格高騰傾向へのインパクト
課題と展望
z IR に関する課題は「コンテンツの登録数をど うすれば増やせるか?」ということに尽きる。
z IR を支える技術及び著作権という世界的な動
向を意識する必要がある→ IR は非常にワー
ルドワイドなものであり,従来の図書館の世
界とはかなり違う。
コンテンツを増やすための方策1
いかに教員の手間を減らすか?
z 類似 DB との重複をなくし,教員の登録の手間 を無くすことがポイント
z 業績 DB との連携を検討中(今年度, CSI 事業 で,九大,早大と連携して検討中)
(1)業績 DB のインターフェイスから図書館に 全文を送付
(2) IR に全文登録可能か図書館で確認
(3)全文登録可能ならば KURA に登録
(4)不可能な場合は業績 DB のみに登録
コンテンツを増やすための方策2
リポジトリの有用性を高める方策
z OAI-Ster ? JuNii ?研究者の認知度は低い。
z 他 DB と IR を併用して利用するのは非効率的
→商用のデータベースからのナビゲート=リン クリゾルバとの連携が求められる。
z その一方,検索をするときにはデータベース
を使わずにGOOGLEを使うという人が多い
コンテンツを増やすための方策3
PR = KURA の認知度アップ
z 学内広報の工夫・・・ポスター、チラシ,粗品 z 図書館主催説明会,教授会,講習会 ... あらゆ
る機会の利用。秋以降予定
z 教員宛のダイレクトメール
コンテンツを増やすための方策4
著作権をめぐる動きへの対応
z 「最初から電子媒体」というコンテンツの増加。
z 生まれたその瞬間から著作物=著作者の意 図とは別に著作権法で保護される。
z 「ここまでは保護していらない。それよりは
使ってほしい」と著作権を放棄することを明示 z 無料利用を原則とする IR のコンテンツの場合
にもこの表示が必要になるだろう。
今後の課題