ゆうキャンパスリポジトリ
-
山形県域地域リポジト リ-
山形大学 小白川事務部小白川図書ユニット 図書チーム(情報サービス担当)
チームリーダー
三 角 太 郎
[email protected]
本日は技術寄りの話
http://drf.lib.hokudai.ac.jp/drf/index.php?plug in=attach&refer=DRF%2FShaRe-Hiroshim a&openfile=yamagata_ShaRe2008.pdf
運用寄りの話題は
DRF/ShaRe-Hiroshima
の資料を見てください2004 2005 2006 2007 2008 2009 2010
学術機関リポジトリ構築ソフトウェア 実装実験プロジェク
CSI:学術機関リポジトリ構築連携 支援事業
第一期
CSI:学術機関リポジトリ構築連携 支援事業
第二期
フェイズ1 構築
フェイズ2 展開
フェイズ3 運用
NII
ゆうキャンパス
リポジトリ
CSI:学術機関リポジトリ構築連携 支援事業
第三期 ???
学術情報部会への参加図書館
●
●
●
●
● 山形大学山形大学(農)(農)
山形大学山形大学(工)(工)
山形大学山形大学(人文・教育・理)(人文・教育・理)
山形大学山形大学(医)(医)
東北公益文科大学 東北公益文科大学
山形短期大学 山形短期大学
県立保健医療大学 県立保健医療大学 県立米沢女子短期大学
県立米沢女子短期大学
羽陽学園短期大学 羽陽学園短期大学
東北芸術工科大学 東北芸術工科大学 鶴岡工業高等専門学校
鶴岡工業高等専門学校
放送大学放送大学(山形学習センター)(山形学習センター)
鶴岡市鶴岡市
山形市山形市
米沢市米沢市
●
●
●
酒田市酒田市
●
天童市天童市 ●
新庄市新庄市
●
県立産業技術短期大学校 県立産業技術短期大学校
県立農業大学校 県立農業大学校
機関別統計
アイテム数 アクセス数 DL数 アイテムあた りアク セス数
アイテムあ たり DL数
山形大学 1450 100510 37074 69.32 25.57 東北公益文科大学 149 8662 3148 58.13 21.13 山形県立産業技術短期大学校 95 9084 3144 95.62 33.09 東北芸術工科大学 93 7755 5280 83.39 56.77 鶴岡工業高等専門学校 91 7364 2095 80.92 23.02 山形県立米沢女子短期大学 84 5572 1978 66.33 23.55 山形県立保健医療大学 38 3884 1149 102.21 30.24 羽陽学園短期大学 12 1784 526 148.67 43.83
2008.04.01-09.30 総 DL 数
こんなにアクセスが あるとは思わなかっ
た
JAIRO
• http://jairo.nii.ac.jp/en/
Japanese Institutional Repositories Online
launched at October 22, 2008(test open)
強力な手段であることは 間違いない
総数 IR 数 共同 IR
国立大学 87 59
公立大学 89 2 2
私立大学 580 21 8
短大 434 0
高専 64 0
共同利用機関 19 0
2008 年 9 月時点
総数、IR数はIRDBコンテンツ分析( http://irdb.nii.ac.jp/analysis/index.php)IR整備率 より( 2008.10.25確 認) 。共同IR数はJAIRO(http://jairo.nii.ac.jp/)機関一覧、HARP(http://harp.lib.hiroshima-u.ac.jp/)参加大学を比較 し算出(2008.10.25確認)
私立大学のIR事情
呉大学 (27 件 ) 日本赤十字広島看護大学 (100 件 ) 広島 経済大学 (64 件 ) 広島工業大学 (61 件 ) 広島国際学院大 学 (42 件 ) 広島国際大学 (29 件 ) 広島女学院大学 (35 件 ) 広島文教女子大学 (71 件 )
関西学院大学 (256 件 ) 関東学院大学 (527 件 ) 近畿大学 (509 件 ) 慶應義塾大学 (12,681 件 ) 高知工科大学 (236 件 ) 国士舘大学 (3,049 件 ) 東京歯科大学 (462 件 ) 東京 慈恵会医科大学 (1,736 件 ) 同志社大学 (9,416 件 ) 日本 貿易振興機構アジア経済研究所 (626 件 ) 法政大学
(1,642 件 ) 明治大学 (103 件 ) 立命館大学 , 立命館アジ ア太平洋大学 (63 件 )
HARP
独立
*JAIRO(http://jairo.nii.ac.jp/)機関一覧、HARP(http://harp.lib.hiroshima-u.ac.jp/)参加大学を比較しリスト アップ(2008.10.25確認)
東北芸術工科大(93)、東北公益文化大
(149)
ゆうキャンパス
公立大学のIR事情
尾道大学
(11
件)
広島市立大学
(105
件) HARP
*JAIRO(http://jairo.nii.ac.jp/)機関一覧、HARP(http://harp.lib.hiroshima-u.ac.jp/)参加大学を比較しリスト アップ(2008.10.25確認)
山形県立保健医療大学
(38)
ゆうキャンパ スリポジトリ
短大のIR事情
*JAIRO(http://jairo.nii.ac.jp/)機関一覧、HARP(http://harp.lib.hiroshima-u.ac.jp/)参加大学を比較しリスト アップ(2008.10.25確認)
山形県立米沢女子短期大学 (84) 羽陽学園短期大学 (12)
山形県立産業技術短期大学校 (95)
ゆうキャンパス
IR
公開短大はゆうキャンパスのみ!
高等専門学校のIR事情
*JAIRO(http://jairo.nii.ac.jp/)機関一覧、HARP(http://harp.lib.hiroshima-u.ac.jp/)参加大学を比較しリスト アップ(2008.10.25確認)
鶴岡工業高等専門学校
IR
公開高専もゆうキャンパスのみ!ゆうキャンパス分がすべて山形 大学のコンテンツとしてカウン
トされてしまっている
山形大学
(2010)
山形大学(1450)
東北公益文科大学
(149)
山形県立産業技術短期大学校
(95)
東北芸術工科大学
(93)
鶴岡工業高等専門学校
(91)
山形県立米沢女子短期大学
(84)
山形県立保健医療大学(38)
羽陽学園短期大学
(12)
実際の数字JAIRO上の 数字
搾取 してる
気分
NII
が参加機関 把握できていないをIR
整備率が、すでに実態とずれてしまって いる今日の本題
なぜこんな事に なったのか?
山形でしか起きてないが、何処でも起きうる 問題なので、どこかで言っておかないとマズ イ!
Repositry System
Web Server
contents
University
Contents upload metadata register Metadata register
System administration Metadata administration Copy right management Material digitalization
Library
Contents upload
contents metadata contents
Paper, education
material,software,experim ent data, letter,report etc
members
contents
Contents
IR flow
Repositry System
metadata register
members
IRDB
harvesting
University NII
CiNii JAIRO
IRDB analysis
Shared IR
metadata
C univ.
metadata
A univ.
metadata
B univ.
harvesting
metadatametadata metadata
Shared IR
Institute
Contamination
一括ハーベスティングすると
IRDB
上で“機関コンタ
ミ“が起きる!Junii2
には機関識別情報が無いので混ざると仕分けができない
IRDB
Shared IR
metadata
では
HARP
は?C univ.
metadata
A univ.
metadata
B univ.
harvesting
metadata
C univ.
metadata
A univ.
metadata
B univ.
harvesting
harvesting
機関の数だけ、ハーベストを繰り返 す
IRDB
少しだけ
Dspace
に特化した話・
Dspace
の個々のアイテムには、機関を識別するコードが入ってない(コレク ションを識別するコードのみ)
・
HARP
はかなりイレギュラーな処理を 行っている(広工大:森保さん)←具体的にどういう処理をしているの か?
DRF/ShaRe-Hiroshima
で 森保さんに直接聞いてみたわからない さっぱり
『ガリレオ』風に言うと
森保さんから送っていただいたメー ル
import org.dspace.content.Community;
import java.sql.SQLException;
import org.dspace.content.Collection;
...<中略>...
public String createMetadata(Object nativeItem) throws CannotDisseminateFormatException {
Item item = ((HarvestedItemInfo) nativeItem).item;
Community parentCommunity = null;
Community community = null;
String communityHdl = null;
try {
//Itemが属するトップコミュニティーを見つけます。
Collection collection = item.getOwningCollection();
Community[] communities = collection.getCommunities();
parentCommunity = communities[0];
while(parentCommunity != null) {
community = parentCommunity;
parentCommunity = community.getParentCommunity();
}
communityHdl = community.getHandle();
}
catch (SQLException sqle) {
System.out.println(sqle);
}
//アイテムが属するトップコミュニティのハンドルID
//が123456789/5(広大)でない場合例外を投げます。
if (!(communityHdl.equals("123456789/5"))) {
throw new CannotDisseminateFormatException("oai_dc");
}
> // Get all the DC ...<以下略>...
これでdspace-oai.warをビルドし、大学ごとにファイル名を変えて、 (工大:dspace-oai.war、広大:dspace2-oai.warとしました。)
tomcatのウェブ・アプリケーション・ディレクトリに配置します。
プログラムをみて、ようやく 意味がわかってきた
← すぐにわかったわけではな
い!← わかるまでは、トンチンカンな ことを言いまくってた
← しかし、わかってないのはみすみだ けではないのでは?
Dspace
のデータはツリー構造3 5 2
もみじ経済
大 宮島水産大 流川産業大
大学毎にコミュニティ分 け
もみじ経済大のデータのみをハ ーベスティングするには
11 8
2
16 親が
No.11
親が
No.8
親がNo.2
親はない←一番トップ
No.16
の所属コミュニティはNo.2
メタデータをわ たす
もみじ経済大は
No.2
もみじ経済大のデータのみをハ ーベスティングするには
11 8
5
16 親が
No.11
親が
No.8
親がNo.2
親はない←一番トップ
No.16
の所属コミュニティはNo.5
メタデータをわたさ ない
もみじ経済大は
No.2
だから 違う雑誌の変遷をイメージしてほし い
•
単独の書誌を見ても継続前誌はわかるが 継続前誌のさらに前はわからない・前に前にとたどっていけば最初がわかる
・メタデータも親をたどっていかないとコ ミュニティがわからない
すべてのメタデータのコミュ ニティを一つ一つ調べていけ ば、もみじ経済大のみのメタ
データを抽出できる
HARP
は抽出プログラムを機関の数だけ作成
機関ごとにディレクトリを作成し、そ の機関のメタデータだけを渡すプロ グラムを置いて、そのディレクトリ をその機関の
BaseURL
としてNII
に 登録イレギュラー 確かに
森保さん
がいたからこその
HARP
広島は人材が豊富だなぁ。。
。
森保さんが居ない
山形はどうすべきか?
•
あんまり複雑なことはしたくない← やりたくったってで
・できるだけ汎用的な方法をとりたいきない
とりあえず今考えていること 選択的ハーベスティングは
可能か?
http://www.nii.ac.jp/irp/archive/translation/oai- pmh2.0/OpenArchivesProtocol.htm#SelectiveH
arvestingandSets
OAI-PMH
• http://repo.lib.yamagata-u.ac.jp/dspace-oai/req uest?verb=ListRecords&metadataPrefix=junii 2&from=2008-04-01&until=2008-10-30&set=
hdl_123456789_3893
Metadata’s format=junii
Register_date=2008/04/01-2008/10/30
Collection’s handle=hdl_123456789_3893
Set
がhdl_123456789_3893
のみを選択的に抽出Reseponse
XML data
<OAI-PMH xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/ htt p://www.openarchives.org/OAI/2.0/OAI-PMH.xsd">
<responseDate>2008-11-11T09:05:19Z</responseDate>
−
<request metadataPrefix="junii2" until="2008-10-30" verb="ListRecords"
set="hdl_123456789_3893" from="2008-04-01">
http://repo.lib.yamagata-u.ac.jp/dspace-oai/request </request>
−
<ListRecords>
−
<record>
<header>
<identifier>oai:repo.lib.yamagata-u.ac.jp:123456789/3894</identifier>
<datestamp>2008-04-09T16:00:22Z</datestamp>
<setSpec>hdl_123456789_3893</setSpec>
</header>
<metadata>
<meta xsi:schemaLocation="http://ju.nii.ac.jp/junii2 http://www.nii.ac.jp/irp/info/junii2.xsd">
<title>やわらかな夜</title>
<alternative>ヤワラカナ ヨル</alternative>
<alternative>A Sweet Night</alternative>
<creator>木原, 正徳</creator>
<creator>キハラ, マサノリ</creator>
<creator>Kihara, Masanori</creator>
<publisher>東北芸術工科大学 </publisher>
<publisher>トウホク ゲイジュツ コウカ ダイガク</publisher>
<publisher>Tohoku University of Art and Design</publisher>
<dateofissued>1993-11-15</dateofissued>
<type>論文(Article)</type>
<NIItype>Departmental Bulletin Paper</NIItype>
<type>text</type>
<format>text/html</format>
↓continue↓
XML data(2)
Metadata
format=junii2
XML data(2)
↓ ↓
<URI>
http://repo.lib.yamagata-u.ac.jp/handle/123456789/3894
</URI>
<NCID>AN10437272</NCID>
<jtitle>
東北芸術工科大学紀要 = Annual Review of Tohoku University of Art
& Design
</jtitle>
<issue>1</issue>
<spage>22</spage>
<epage>27</epage>
<language>jpn</language>
</meta>
</metadata>
</record>
handle=hdl_123456789_3893
は東北芸術工科大学紀要のコレクションに対応
選択的ハーベスティングのため に
1) Dspace の set にコミュニティのコードをい
れる
← パッチはある
[ 1620700 ] Add Community and Sub-Community to OAI Sets
http://sourceforge.net/tracker/index.php?func=detail&aid=1620700&group_i d=19984&atid=319984
2) NII と交渉して、選択的ハーベスティング に対応してもらう
←
他のシステムのためにも!いずれにせよ
メタデータの再構築が必要
IRDB
だけならまだいいがCiNii 連携していると厄介!
convert 4912→ repo.yamagata.jp/4912
http://www.handle.net/
J
AIRO
はHandle system
っぽいものを 使ってるらしい ← 中がよくわからないprefix
http://hdl.handle.net/4912/916
CNRI handle server
http://repo.yamagata.jp/4912/916
Changing the server, only need to update
convert table
Prefix:institute identification number
user
metadata
A univ.
metadata
B univ.
harvesting
metadatametadata
CiNii
と連携したメタデータは 変更ができないA univ.
metadata
B univ.
IRDB ShaRe
CiNii
metadata
metadata
動かすとCiNii との 連携が切れてしまう
フルテキストへの リンクもおかしくなる
FAQ
より• Q7-3 : CiNii 連携しています。
junii2 フォーマットで出力する設定( ex. クロスウォーク)を変更
しました。通常の差分ハーベストではなく、 IRDB から一度全件 削除して、再度全データをハーベストして欲しいのですが。
A7-3 : CiNii 連携をしている IR のデータを IRDB ・ CiNii から削除
し、全件取り直す方法ですと、 CiNii で行った同定処理(機械処 理・人手処理)を 解除し、再度同定処理をやり直すことになりま す。このため CiNii 連携している IR については、全件置き換えは お引受け致しかねます。
なお、クロスウォークのみの修正の場合、個々のアイテムの datest amp は変更されないため、差分ハーベストでデータを更新するこ とができません。
つきましては、通常の差分ハーベストで上書き更新ができるよう
、該当データ全ての datestamp を変更してくださいますようお願い いたします。
SQL で一括書きかえ可能と思われますので、システムご担当者様 にご相談ください。
---http://www.nii.ac.jp/irp/contact/faq.html#irdb
これから共同リポジトリを はじめる機関へ
ハーベスティングを開始する前に メタデータがどう流れていくかを
十分に
シミュレーションすること
を 強く
オススメします!!!ゆうキャンパスリポジトリ
・システムのカスタマイズが必 要 ←今年度は予算がない
・IRへのデータ投入は控えめ に
←投入して大丈夫なのか?
やっちまったものは仕方がない
♪
反省はしているが
後悔はしてません
来年度の
ShaRe
にむけて•
システム毎のノウハウの共有が必要•
組織の独立、合併のシミュレーション•
アクセス解析さらにいろいろなシステムの問題 が
でてきそう
共同リポジトリ
≠
機関リポジトリ
Happiness Only Real When Shared
from “Into the Wild “J on Krakauer
最後に