には,論文を始めとして,各種報告書,会議・講演録,教材等様々なタイプが想定される。
それらについて,何をメタデータとして入力し,どの項目に格納するか,また各項目をど のように記述するかは十分な検討をすべきであろう。
そのタイプ毎に例えば,各情報資源独自の管理番号,対応する図書館所蔵資料の請求記号・
資料ID等や,あるいは,各学術機関リポジトリで詳細な検索を提供した場合に用意しておく べき種別等の項目など,各機関の目的に応じたメタデータスキーマの拡張・詳細化を行うこ とも想定されよう。このような点を考慮すると,メタデータ項目のカスタマイズの容易さや 拡張性という点も,学術機関リポジトリソフトウェア選択時の一つのポイントとなるであろ う。
なお,一方,メタデータがハーベスティングされ統合的データベースに収録された場合 等での相互利用性の観点からすると,使用項目・記述方法等について何らかの共通ルール を決める枠組みも望まれる。具体例として,ダブリン・コアを採用している先行リポジト リを見てみても,論文の掲載誌情報(雑誌名・巻号・出版社等)の格納項目・記述方法等 に,機関毎のばらつきが見られる状況である。
5.2 メタデータ・ハーベスティング
ここでは,メタデータを介した他機関とのシステム間リンクに関わる部分を述べる。
5.2.1 メタデータ・ハーベスティングとOAI-PMHについて
学術機関リポジトリの狙いの 1 つには,研究成果物の可視性向上があるが,その効果を 高める技術的手法としてメタデータ・ハーベスティングがある。その仕組みは,自機関リ ポジトリサーバに登録されたメタデータを機関外に流布させることで情報発見・アクセス を促進させるという考え方に基づいている。
OAI-PMH(Open Archives Initiative Protocol for Metadata Harvesting)は,メタデー タ・ハーベスティングのための通信規約(プロトコル)である。学術機関リポジトリソフ トウェアといえば,本プロトコルに準拠していることが事実上の必須要件となっており,
本報告書で取り上げた各学術機関リポジトリソフトウェアもすべて対応している。
OAI-PMHは,コンテンツを保有しそのメタデータを発信する機関(データ・プロバイダ)
と,メタデータを収集し情報サービスを運営する機関(サービス・プロバイダ)との間の データ交換の標準化を目指すものである。サービス・プロバイダは,ハーベスタと呼ばれ るメタデータ収集ソフトウェアを用い,データ・プロバイダが運営する OAI-PMH 準拠の リポジトリ群からメタデータをハーベスト(harvest=刈り取り,収集)し,自らの情報サー ビスを構築する。
なお,メタデータ・ハーベスティングは,統合・横断検索を実現させる技術の1つと位 置付けられるが,例えば類似する,Z39.50 などを利用した横断検索システムと比較した場
合,検索実行時に分散する複数のデータベースを直接検索するのではなく,中央集約的な 1つのデータベース中に予め収集・蓄積されたメタデータを検索に用いるという点で特徴 がある。また,機関外のシステムとのデータ交換・収集を行うものであるが,これは通常 メタデータのみを送受信するものであって,PDF 等の研究成果物本体については,各学術 機関リポジトリに格納されているデータが参照される。
5.2.2 メタデータ・ハーベスティングのための設定と注意点
OAI-PMHを利用したメタデータ交換では,限定子(qualifier)無しのダブリン・コア形 式(Simple Dublin Core)の出力応答が最低要件となっている。Simple Dublin Coreに変 換することをダム・ダウン(Dumb-Down)と呼ぶ。
学術機関リポジトリは,ハーベスタに応答し,要求された形式でメタデータ出力できるよ うに(少なくともSimple Dublin Coreでデータを返せるように)設定しておくとともに,
Dumb-Down して出力した時にも項目内容の整合性が保たれるよう配慮しておく必要がある。
また,学術機関リポジトリに収録しているメタデータをすべてハーベスティングさせる か否かについても考えておくべきである。研究成果物の種別や,論文の査読の有無,論文 の掲載雑誌等で区別したいというニーズがあれば,ハーベスティングの可否を判断できる 項目をメタデータ中に用意しておくことなども想定される。なお,OAI-PMHでは,ハーベ スティングの可否判断はサポートされていないため,学術機関リポジトリ側の各ソフト ウェアレベルでの対応が必要となる。
5.2.3 国立情報学研究所メタデータ・データベース(JuNii)との連携
国内の各大学・研究機関等のメタデータを蓄積し,統合検索できる環境を提供するサー ビスとして,国立情報学研究所の「JuNii 大学 Web 資源検索-大学メタデータポータル-」
がある。JuNiiは,OAI-PMHにおける,サービス・プロバイダ機能及びデータ・プロバイ ダ機能を備えている。
国内において構築される学術機関リポジトリでは,ハーベスティングによるメタデータ 登録対象としては,まずはJuNiiが第一目標となると考えられる。JuNiiは,国内学術機関 からのメタデータを集約し検索を提供することで,日本における研究成果物のポータル的 役割を果たす。
図5-1 学術機関リポジトリとJuNiiとの関係
なお,JuNiiは,ダブリン・コアに準拠した標準的なデータ形式を基本としているが, NII 独自の限定子を採用するなど拡張したものである。詳細は,「NIIメタデータ・データベー ス入力マニュアル1.2版」および「XML Schema for NIIメタデータ・データベース」等で 参照できるが,例えば,SubejectにはNDC付与,Type(資源タイプ)にはNII所定のタ イプ名付与などを必須としている。国内での学術機関リポジトリソフト導入に当たっては,
これらに対応したシステムが用意されることが望まれる。
図5-2 JuNiiメタデータ項目
また,「NIIメタデータ・データベース入力マニュアル」は,各項目の記述規則等を示し ているが,学術機関リポジトリが収録対象とする個々の研究成果物レベルでの記述に関し ては,それらのコンテンツの特性に即した,より詳細な応用プロファイルを考えていく余 地がある。これについては,今後,学術機関リポジトリを構築する大学と国立情報学研究 所でさらに議論を深める必要がある。
5.2.4 その他のサービス・プロバイダへの対応
OAI-PMH に対応したリポジトリであれば,JuNii に限らず他のハーベスタからのメタ
データ収集を受け付けることができる。メタデータの広汎な流布には,様々なサービス・
プロバイダからハーベストしてもらうことが1つの方法とも言える。
OAI(Open Archive Inisiative)では,データ・プロバイダおよびサービス・プロバイダ の公式リストを維持しており,学術機関リポジトリをこのリストに登録する際は,OAI 準 拠であるかのテストを行う機能を持っている。
大規模なサービス・プロバイダの例としては,ミシガン大学によるプロジェクトである OAIsterがある。OAIsterは,世界中のリポジトリから収集したメタデータをデータベース に蓄積し,検索インターフェースを提供している。2005年1月現在,396のリポジトリか ら収集された 480 万件以上のメタデータが登録されている。日本国内のリポジトリとして は,JuNii(57801件),千葉大学(638件)のメタデータが収録済みである。
OAI 等のデータ・プロバイダリストに,自学術機関リポジトリの情報を登録すれば,そ のメタデータの流通の可能性は一層高まることとなる。
なお,ここで注意したいのは,一度プロバイダリストに登録されると,不特定のハーベ スタからのハーベスティングを受け付けることになる点である。JuNiiや千葉大学では,リ スト登録後数日中に,ハーベスティングが開始された。
5.3 メタデータの入力・品質管理
千葉大学附属図書館をはじめとした先行事例を見てみても,研究成果を学術機関リポジ トリに登録する研究者に対して,詳細で正確なメタデータ入力を求めるのは困難と言える。
このため,研究者がデータ登録を行った後に,リポジトリ管理者がメタデータの品質チェッ ク・修正を行うステップを用意しておくことが現実的であろう。このことはデータ登録か ら公開までのフローを決定する際も,考慮すべき点となる。
また,データ登録・修正作業の効率化を考えれば,入力画面の使い勝手の良さや一括登 録機能も当然要求される。
5.4 学術機関リポジトリ用ソフトウェア機能要件
以上を踏まえ,メタデータに関わる観点から学術機関リポジトリソフトウェアに求めた い要件を列挙すれば以下のようになる。
• メタデータ項目の拡張性,カスタマイズの容易さ(入力画面,検索画面に対応)
• OAI-PMH対応(ダブリン・コア形式,JuNii形式)
• 管理者用メタデータ修正画面の使い勝手(特に,JuNiiに対応した必須項目表示・入力 支援機能等)
• 一括登録機能
5.5 その他の課題・注意点
前節まで,学術機関リポジトリ稼動に当っての基本要件というべきものを述べたが,そ のほかにもメタデータに関連し,以下のような課題・留意点があるので列記する。