• 検索結果がありません。

分担研究報告書

N/A
N/A
Protected

Academic year: 2021

シェア "分担研究報告書 "

Copied!
16
0
0

読み込み中.... (全文を見る)

全文

(1)

厚生労働行政推進調査事業費補助金(厚生労働科学特別研究事業)

分担研究報告書

国立研究開発法人におけるデータポリシー策定にあたり検討すべき事項の整理

〜「国立研究開発法人におけるデータポリシー策定のためのガイドライン」を羅針盤として〜

木村 映善 国立保健医療科学院保健医療情報管理分野 統括研究官

研究要旨

本文書は国立保健医療科学院のワーキンググループにおいてデータポリシーを策定するにあた って作成した参考資料である。ワーキンググループにおいて「国立研究開発法人におけるデータ ポリシー策定のためのガイドライン」を参考にしたときに、当ガイドラインのみでは判断が困難 な構成員向けに情報提供をすべく調査した事項をまとめたものを、公開向けに再構成したもので ある。

A.

本文書の位置付け

本文書は国立保健医療科学院のワーキン ググループにおいてデータポリシーを策定 するにあたって作成した参考資料である。

す な わ ち 、 ワ ー キ ン グ グ ル ー プ に お い て

「国立研究開発法人におけるデータポリシ ー策定のためのガイドライン」を参考にし たときに、当ガイドラインのみでは判断が 困難な構成員向けに情報提供をすべく調査 した事項をまとめたものである。他の研究 組織におけるデータポリシーの検討の際に 参考になると判断し、公開するものである。

なお、この文書中における提言はワーキン ググループへの問題提起として記したもの であって、国立保健医療科学院の最終的結 論ではないことはご留意頂きたい。

B. ガイドライン検討にあたって背景 統合イノベーション戦略(平成 30 年 6 月 15 日閣議決定)において「オープンサイエ ンスのためのデータ基盤の整備」、つまり、

すべての者がサイバー空間の研究データを 利活用し、協働によってイノベーションを 創出するというオープンサイエンスを推進 するための社会インフラとしてのデータ基 盤の整備が明示され、国立研究開発法人は、

研究分野の特性、国際的環境、産業育成等 に配慮したデータポリシーを 2020 年度中に

策定し、これに基づく研究データの管理・

公開等を促進することとなった。また、デ ータポリシーの策定にあたっては、内閣府 総合科学技術・イノベーション会議(CSTI)

が設置した「国際的動向を踏まえたオープ ンサイエンスの推進に関する検討会」によ る「国立研究開発法人におけるデータポリ シー策定のためのガイドライン」(以下ガイ ドライン)(平成 30 年 6 月 29 日)を参考に することが求められている。

これを受けて厚生労働省は、厚生科学審 議会科学技術部会(平成 30 年 7 月開催)で の議論を踏まえ、厚生労働省所管の研究機 関(医薬基盤・健康・栄養研究所、国立が ん研究センター、国立循環器病研究センタ ー、国立精神・神経医療研究センター、国 立国際医療研究センター、国立成育医療研 究センター、国立長寿医療研究センター)

だけでなく、その他の研究機関(国立医薬 品食品衛生研究所、国立保健医療科学院、

国立社会保障・人口問題研究所、国立感染 症研究所、国立障害者リハビリテーション センター、独立行政法人国立病院機構。独 立行政法人労働者健康安全機構、独立行政 法人国立重度知的障害者総合施設のぞみの 園、独立行政法人労働政策研究・研修機構)

においてもデータポリシーを策定し、所管

する全ての研究機関でオープンサイエンス

を推進することとなった。

(2)

上記の「ガイドライン」によれば、デー タポリシーは研究機関の研究分野の特性や ミッション等に基づいて定められるものと されているが、厚生労働行政や他の分野の 政策等に資するデータの利活用を促進する ためには、研究機関等で一定の共通する事 項や内容を設定して、研究データの横断的 連携の推進等に向けて相互運用性を高める 必要もある。しかしデータポリシーの記載 事項や記載内容をどこまで機関共通にすべ きか、その具体的な考え方や根拠は明らか に さ れ て い な い 。 ま た 、 研 究 デ ー タ の 公 開・利活用の基盤となる機関リポジトリに 関しても、具体的な整備・運用の方法が確 立していない。

そこで本研究では、厚生労働省が所管す る研究機関で策定すべきデータポリシーに 関して、機関共通で取り組むべき事項、各 機関の特性に応じて取り組むべき事項を整 理し、厚生労働行政等に資する研究データ の利活用を最大限に促進するために必要な、

一貫性及び整合性のあるデータポリシーの 要件を明らかにするとともに、機関リポジ トリの整備及び運用に関する提言を取りま とめることを目的とする。

データポリシー策定にあたって考慮すべ きことがらはきわめて広範囲にわたるので、

「国立研究開発法人におけるデータポリシ ー策定のためのガイドライン」(以下、DPG:

Data Policy Guideline)[1]及び当ガイドラ インの解説資料 平成 31 年 4 月 2 日版 (以 下、AG: Appendix of Guideline)[2]をデー タポリシー策定プロセスの羅針盤とし、逐 条的なガイドラインの検討をとおして課題 を整理し、2020 年度中のデータポリシー策 定にむけて準備すべきことを洗い出す。

なお、AG において、各法人の研究分野 の特性やミッションの反映を阻害すること が懸念されるため、データポリシーのひな 型は敢えて提供されておらず、ガイドライ ンに沿って各法人にて検討すべきことが記 載されている。しかしながら、各法人で委 細にデータポリシーを検討できる人員は限

られているため、本稿において、DPG、AG に 加えて独自に調査、分析した事項を提供す ることによって、各法人での検討の一助に なることを期待するものである。

以下、内閣府の「国立研究開発法人にお けるデータポリシー策定のためのガイドラ イン」(DPG)に記載されている内容を元に、

逐条的に当院におけるデータポリシーを検 討するにあたっての考察を記述する。DPG の

「3.データポリシーで定めるべき項目」以 降に提示されている項目(番号)と解説を 囲みで引用し、その後我々が検討したこと を記述する。

C. DPG の逐条的検討

機関におけるポリシー策定の目的につ いて

・機関のビジョン、ミッション等を踏 まえ、ポリシーを策定した背景と研究 デ ータ利活用の目的について記述する。

・機関が Web サイト等で公開している機関 のビジョン、ミッションをベースに解説す る。

・公的資金を活用して実施した事業・研 究を通して得られた成果を国民に還元し、

広く利活用を促進することを通し、機関に 求められている役割の強化とアウトリーチ を拡大することを説明する。

管理する研究データの定義、制限事項 について

・ 機関のミッションに従い、ポリシー が対象とする「研究データ」の定義・ 範 囲を明確にし、利活用が想定されるデー タ、将来的に利用の可能性が考えられる データなど、研究データの種別・内容等 について記述する。

・ 研究データの利活用に関する機関の 方針や基本的な考え方を踏まえ、また、

第5期科学技術基本計画が示すオープン

サイエンスの推進に係る方針にも留意し

(3)

て、非公開、共有等の対象となる研究デ ータや公開・共有における 制限事項につ いて記述する。

C.2.1 研究データ利活用に関する機関の方 針・基本的な考え方

第 5 期科学技術基本計画 が示すオープン サイエンスの推進に係る方針

1

に記述されて いる、オープンサイエンスの推進体制の基 本的姿勢は、公的資金による研究成果の利 活用の機会を可能な限り拡大することとし ている。我々の活動は、国の予算と公的機 関からの競争的研究資金に基づいている。

それを踏まえて、基本的に保有しているデ ータは公開が前提であるとし、非公開とな るものについて例外的に指定・除外してい く手法を採用することとする。

C.2.2 検討対象となるデータの種類

保健医療科学院に所属する研究者の研究 テーマは多種多様である。結果としてデー タの種類は多種多様であり、ポリシーレベ ルで具体的かつ個別に指定することは、煩 雑かつ、各部局単位での運用を限定する可 能性がある。従ってデータの具体的な種類 については言及せず、対象となるデータの 範囲のみ提示することとする。データの由 来に着目し、下記の通りに公開対象となる データの分類をした。

・(A) 公開対象となるデータの定義、範囲

・機構の施設・設備を利用して得られ たデータ

・外部の公的資金を活用して実施した 事業・研究を通して得られたデータ

1 第 5 期科学技術基本計画 第4章 科学技術イノベー ションの基盤的な力の強化

(2)知の基盤の強化 ③ オープンサイエンスの推進

(抜粋)

国は、資金配分機関、大学等の研究機関、研究者等の関 係者と連携し、オープンサイエンスの推進体制を構築する。

公的資金による研究成果については、その利活用を可能な 限り拡大することを、我が国のオープンサイエンス推進の

・外部組織との協業、共同研究等を通 して得られ、公開に同意されたデータ

・及び、上記から得られたデータをも とに派生して得られたデータ

・(B) 潜在的に対象となるが一般的に公開 せず、審査・契約等締結後に限定公開する もの

・機微な個人情報を含むデータ

・商業利用等に制約を課せられたデー タ

・公的機関、国内の研究者等に、開示 対象を制限すべきデータ

・(C) 対象から外すデータの定義・範囲

・国家安全保障、個人の安全・プライ バシーに係るデータ

但し、個人の安全、プライバシーに関し ては、適切な匿名加工処理を加えて公開す ることを検討し、それでも技術的、制度的 に困難なものであると判断したもののみに 制限する。技術的困難とは、安全性を担保 した匿名加工後にデータとしての有用性を 確保できないものである。制度的困難とは、

そもそもその存在を秘匿すべきもの、外部 への提供が許可されていないものである。

C.2.3 対象となるメタデータ

非公開となったものであっても、保有し ていることの情報開示をするために、メタ データは上記の公開の対象、非対象に関わ らず、全てメタデータを作成し公開するも のとする。但し、国家安全保障に係るもの

基本姿勢とする。その他の研究成果としての研究二次デー タについても、分野により研究データの保存と共有方法が 異なることを念頭に置いた上で可能な範囲で公開する。た だし、研究成果のうち、国家安全保障等に係るデータ、商 業目的で収集されたデータなどは公開適用対象外とする。

また、データへのアクセスやデータの利用には、個人のプ

ライバシー保護、財産的価値のある成果物の保護の観点か

ら制限事項を設ける

(4)

及び院長から具体的に指定のあったものに ついては、メタデータも非公開の対象とな る。非公開対象データについては、行政開 示請求の文脈で対応することとする。

メタデータとは、検索システムの対象と なるデータに関する情報である。しかし、

検索システムによってメタデータの構造が 異なるとメタデータの交換や横断的な検索 が困難となるため、メタデータの構造を標 準化する動きがあり、例えば書誌情報では 書誌名、著者、日付、出版社等の標準的な 15 要素を定めた Dublin Core[3]が知られて いる。図書以外のデータについてのメタデ ータについても検討がなされており、採用 するメタデータについては後述する。

以下、データ、メタデータの対象につい て整理した表を掲示する。

メタデータは基本的に公開するが、存在 自体を知られるべきではないデータについ てはメタデータも非公開とする。メタデー タはリポジトリや検索システムに登録され、

利用者が検索した時に検索結果として表示 される。しかし、データの本体がリポジト リに登録されていなければ、データ本体へ のアクセスは不可能である。このような状 態が発生するのが、「公開範囲」が限定的公 開・非公開に設定されている状況である。

個人情報が含まれており、匿名加工がなさ れるべきものについては、匿名加工の処理 が終了して公開の許可が下りたときにメタ データとデータ本体が同時に公開される。

表 公開対象とメタデータ、データの関係

匿名加工が困難あるいは加工するとデー タの有用性が著しく落ちる場合は、限定的 公開(メタデータのみ公開)での運用を検 討する。

エンバーゴ期間(後述)が指定されてい るものについてはメタデータを先に公開し、

データ本体はエンバーゴ期間経過後にアッ プロードして公開するか、リポジトリの機 能を利用してエンバーゴ期間経過後に自動 公開する設定を適用する。

なお、機微な情報を含むデータの公開に 関する判断は ANDS のガイドラインで解説さ れており、メタデータとデータを公開する パターンの組合せを検討する際に参考にし た[4]。

エンバーゴ(Embargo)については、複数 の意味で使われており、どの文脈で使用さ れているのかを区別する必要があることに 留意されたい。

(1)論文公開前の広報(情報解禁日)と しての意味

出版社側から論文公開前に論文に関する プレスリリースを著作者・機関側で出すこ とを自粛するよう要請しているもの。例え ば、Nature research press の Embargo に関 するポリシーは下記の通りである。

Nature research Press and embargo policies

https://www.nature.com/nature- research/editorial-policies/press-and- embargo-policies

We strongly discourage authors and 公開範囲 一般公開

(個人情報のない もの)

一般公開

(個人情報がある が匿名加工がなされ

たもの)

限定的公開 非公開 非公開

(機密)

メタデータ 公開 公開 公開 公開 非公開

データ 公開

(エンバーゴ指定 されているものは期

限後に公開)

匿名化後公開 非公開・契約締 結後に公開

非公開 非公開

(5)

potential authors from direct solicitation of media coverage of material they have submitted to Nature and the Nature Research journals.

Accepted contributions can be discussed with the media only once the publication date has been confirmed and no more than a week before the publication date under our embargo conditions. Please refer to the "Communications between scientists"

section for more information about our embargo policy as it pertains to conference presentations and preprints.

このように期間を指定されたものについ ては、その期間以前にメタデータやデータ をリポジトリに置いても公開、露出状態に しないことが求められる。

(2) 公開猶予期間

無料公開されない購読型論文が、一定 期間を経て無料公開される際に設定される 期間。ただし、無料公開されたからといっ て、その論文をリポジトリにても公開して よいとは限らないので、出版社の規約を確 認されたい。

(3)著者の権利や契約にもとづくもの 例えば、データを公開する研究者が、

研究の先行利益を確保するために、リポジ トリに登録してもただちに公開を希望しな い場合に、公開予定日を設定する。リポジ トリの機能によって公開予定日を過ぎた時 に初めてデータが公開されるといった設定 が可能である。

研究データの保存・管理・運用・セキ ュリティについて

・ 研究データの特性に応じたデータの 保管、運用方針と国研としての取組につ いて記述する。

(記述上の留意点)

・ 機関内で実施される研究活動におい

て順守すべき研究データの保存・ 管理・

運用・セキュリティに関する対応につい ての方針、及びこれらを実施するための 体制、並びにワークフローについて記述 する。その際、 研究データの特性、運用 のフォローアップ、その他のポリシーと の整合性に留意する。

・ 研究データを登載するリポジトリ 等について記述する。なお、特定のリポ ジトリ等名のほか、リポジトリ等が備え るべき条件について記述することが望ま しい。

・ 研究プロジェクト終了後における研 究データの保存・管理等の継続性にも考 慮することが望ましい。

C.3.1 運用管理規程について

機関内で実施される研究活動において遵 守すべき研究データの保存・管理・運用・

セキュリティについては、既存の機関のセ キュリティポリシー、システム運用管理規 程に従うこととし、研究者の業務の増加を 最小限に抑える。但し、行政文書について の分類やライフサイクルについての具体的 な規程はあるが、研究、教育に関するデー タについては、研究者の自主的管理に依存 するところが多く、具体的な規程に乏しい。

状況を調査し、必要に応じて規程を整備す る必要がある。別途記述するようにデータ 公開にそなえて、データを保管する期間・

場所を定めることになるが、このデータ保 管・管理を研究者に要求するのは業務圧迫 につながる怖れがある。また人事異動、退 職、研究プロジェクト終了等に伴い、デー タ管理の継続性が損なわれる可能性がある ことから、個人従属的な業務形態にするこ とは避けるべきである。従って、機関内あ るいは「機関横断的」にデータのアーカイ ブに関わる担当者の設置を検討し、研究者 からデータを引き渡されたあとは、管理責 任は機関が一義に負うような体制、管理規 程を整えることが望ましいと考えられる。

「機関横断的」とは、省庁下の国研群にお

(6)

いて、各々でデータを管理する担当者を雇 用するのではなく、省庁単位で国研群のデ ータを一括して管理する部署・担当者を設 置するアプローチである。現在、我が国に おいてはデータを管理できるスキルを備え た人材が不足しており、また雇用が不安定 な傾向がある 。長期的視野に立てば、専門 スキルを持つ方を集約して安定して雇用で きるような環境を創出することが望ましい と思われる。

C.3.2 リポジトリ等が備えるべき要件等に ついて

オープンアクセスにむけた研究データの 管理方式は、Open Archive(OA)ジャーナルに 投稿する Gold OA 方式と、機関リポジトリ等 にセルフ・アーカイビングする Green OA 方 式がある[5]。投稿した論文誌の出版社のポ リシー、研究助成機関による論文の公開に 関する方針もあり、出版された論文をセル フ・アーカイブすることが必ずしも認めら れていないため、どちらかの方式のみ採用 す る と い う こ と は 不 可 能 で あ る 。 た だ 、 Gold OA の掲載にはコストがかかり研究者の 負担、引いては税金の有効活用の観点から、

可能な限り Green OA への掲載も認める出版 社への投稿を推奨し、同時に機関における セルフアーカイビングを推進することが望 ましいと考える[6]。また、今後の研究資金 提供者によって OA セルフアーカイビングが 義務つけられるようになった時に研究者を 支援すべくセルフアーカイブが無償ででき る機関リポジトリの存在は必要になると思 われる。

Green OA のリポジトリの種類は、大学・

研究機関みずからが保有する機関リポジト リ、研究者コミュニティによって運用され る分野別のリポジトリ(arXiv 等)、助成機関 によって運営される、助成を受けた研究の 成 果 を 格 納 す る セ ン ト ラ ル リ ポ ジ ト リ (PubMed Central (PMC)等)の形態がある[7]。

本データポリシーの検討の対象となってい るのは国立研究開発法人であり、国の事業

として実施している研究、調査にもとづい て開示すべきデータ等もあることが予想さ れることから、研究者コミュニティや助成 機関等の第三者が運用しているリポジトリ で開示するのではなく、自らあるいは委託 したリポジトリで開示するという運用を採 るのが適切なケースがあると思われる。な お、NIH が Funding Agency として助成した 研究の成果を公開させるために PMC をセント ラルレポジトリとして提供しているように、

国立研究開発法人が Funding Agency として の役割を果たしているならば、セントラル レポジトリの運用も担うことを検討すべき であると考えられる。

ただし、現状の研究機関の予算と人員状 況下では、Green OA を実現するための体制 を構築することは困難である。他の国立機 関によって提供されているリポジトリ等の サービスを活用し、研究機関内にそのサー ビスを管理したり研究者によるデータ登録 を支援したりする人員を配置、育成してい くという方針を採用すれば、持続性のある 運用が可能であると考える。もし、研究機 関ごとに担当者を配置することが困難であ れば、厚生労働省あるいは厚生労働省から 指定された国立研究開発法人に人材を集約 し、他の研究開発法人のデータ管理をもま とめて引き受けるとことで運用の最適化を 図る必要があるかもしれない。

機関リポジトリのサービスについては、

自 前 で 機 関 リ ポ ジ ト リ を 構 築 す る 他 、 J-

Stage や CiNii 等の外部リポジトリが多数使

われている[8]。ただ、自前で機関リポジト

リといっても完全に独自に構築している事

例は少なく、外部の機関リポジトリサービ

スを利用しているのが実情である。国立研

究開発法人の機関リポジトリとしては、オ

ー プ ン ア ク セ ス リ ポ ジ ト リ 推 進 協 会

(JPCOAR)[9]下に、国立情報学研究所が運営

し て い る Japanese Institutional

Repositories Online Cloud (JAIRO Cloud)

という、機関リポジトリ環境を提供するサ

ービスが検討に値すると考える。理由は下

(7)

記の通りである。

(a)低廉なシステム運用コスト – 事業継続 性の確保

JAIRO Cloud の利用は、JPCOAR 基本会費 と JAIRO Cloud 利用料金の組合せの年間会費 を支払えば可能であり、構成員が 200 名規模 では年間 10 万円程度、1000 名規模でも数十 万円程度と低廉な利用料金の設定がなされ ている(2019 年度時点)。また、JPCOAR 会員 に加入するため、JPCOAR で開催される人材 育成や啓蒙活動に参加することで、独自に 取り組むよりもオープンデータに関わる人 材育成のマネジメントの負担も軽減される ことが期待される。

(b)科学技術基本計画のプロットへの追従 JPCOAR は、2019 年〜2021 年度にかけて の戦略[10]として、JPCOAR はオープンサイ エンスの推進に寄与するため、研究データ の公開、流通に関する先導的な取組み、 オ ープンアクセスを推進する学術情報流通の 基盤を整備し、コンテンツの流通、活用を 促進する、 オープンアクセス、オープンサ イエンスの推進に対応できる人材育成を行 う、ことを挙げている。JPCOAR の会員とな り、活動に参加することで最新のオープン サイエンスに関する動向の把握と、最新の 機関リポジトリ環境の整備、人材育成に寄 与することが期待される。

(c)外部への委託による機関内業務の削減 国立情報学研究所によって情報セキュ リティ、システムの継続的運用上の配慮が 十分になされたクラウド環境に機関リポジ トリ業務を委託することにより、機関にお けるシステム管理者の雇用、情報セキュリ ティの確保に係る諸業務を節約できる。ま た、クラウドにデータを展開することによ り、自然災害、停電等によるデータの損壊、

損失の機会を最小化し、オープンサイエン ス時代に求められているデータ保存・管理 の継続性に対する要件に対応することが可

能になる。すなわち、DPG で求められている

「研究プロジェクト終了後における研究デ ッタの保存・管理等の継続性への考慮」に も応えられると考える。

(d)データの真正性、保存性の確保 データの保存期間は事業が継続する限 り、半永久的としたい。保存に関するコス トへの配慮もそうであるが、長期間保存に よるデータの消失、損壊を回避する必要が ある。オンプレミスの運用であればサーバ やストレージの更新によるマイグレーショ ンが必要であるが、データ移行はデータの 欠損、破壊の最も大きな契機の一つであり 可能な限りさけたい。また、ストレージに 高品位なものを利用することでデータその ものが損傷を受ける機会を削減したい。こ のような要求を鑑みれば、データの多重複 製、データ損傷のモニタリング、自動修正 を行う高機能なストレージに保管すること が望ましい。近年のクラウドサービスはビ ッグデータを確実に保存するためにオブジ ェクトストレージ等の仕組みを取り入れて データ保存に関する品質を飛躍的に高めて いる。そういう意味でも最先端のストレー ジ技術の運用が期待されるクラウドベース での運用としたい。

なお、DPG には「実施するための体制、並 びにワークフローについて記述する。」とい う言及はあるが、これは院内で運用される 対策基準あるいは実施手順レベルにおいて 記述すべきものであり、対外的に公開され る ポ リ シ ー に お い て 記 載 す る よ う な 内 容

(粒度)ではないと考える。

C.3.3 研究データのマネジメントについて

研究データの管理は研究を開始する前

に計画するべきであり、標準的な研究上の

実務に組み込まれるのであれば、必ずしも

時間や費用を大きく費やすことにはならな

いという主張がある[11]。しかし、現時点

(8)

では我が国の Funding Agency でも Research Data Management (RDM)の提出を求めるよう になっているが、必ずしも実際の研究上の 詳細な計画まで踏みこんだ内容になってお

らず、また研究者が利用できる標準的なデ ータ管理環境も存在しておらず、依然とし て研究者自身による管理に委ねられている。

我が国では、国立情報学研究所オープ ンサイエンス基盤研究センターが米国 NPO の Center for Open Science が開発している研 究 デ ー タ 管 理 用 の Open Science Framework[12]をカスタマイズして GakuNin RDM[13]という研究データ管理基盤を提供し ている。研究データ管理基盤をあらためて 導入するメリットは、研究者の本来の業務 ではない研究データを安全に管理するため のシステムの運用・保守を外部化できるこ と、データの永続性を保証し研究資料の消 失・散逸を抑制するというセキュリティ保 全[14]の他に、研究者コミュニティでのデ ー タ 共 有 を 促 進 し 、 研 究 プ ロ セ ス を 共 用 化・再利用することで研究を加速する効果 が期待される。

ただ、この GakuNin RDM を用いた先行検証 を含めて、一般的に利用出来るかたちで提 供されている研究データ管理用基盤を用い た研究活動およびその成果として得られた

エビデンスについて確認されていない。研 究データ管理用基盤の導入について検討す るのはよいとしても、この数年間以内に研 究データ管理用基盤を利用したマネジメン

トが確立されている状態を想定するのは困 難である。

従って、当面は RDM システムの活用にむけ た取り組みと並行して、従来のプロセスで 出来上がったデータをどのように公開する かの検討を進めることとしたい。

対象となる研究論文、データが発生した あと、どのようなプロセスを経て公開に至 るかを検討する必要がある。現実的な問題 として、対象論文・データの把握は研究者 の自己申請に依らざるを得ない。自己申請 に関して、研究者やデータ公開を支援する 担当者の業務負担を軽減するために下記の 様な運用モデルの検討を進めているところ である。

別途に記述するように、研究者には国 際的な研究者 ID の獲得と研究者データベー スへの業績登録を依頼する。その代わり、

これまで年度の事業報告や業績評価の為に 作成していた資料から研究、論文に関する 業績の報告にかかる業務を免除するような サポートをする。具体的には、研究機関の

J‐Global

Research Map

科学院研究者 研究情報⽀援センター

データ公開基盤 データ検索基盤

オープンサイエンス基盤

(国⽴情報学研究所)

研究者情報、

業績の⼊⼒、

露出拡⼤

科研費DB CiNii Aritcle

PubMed arXiv

DBLP

研究情報の連係

NRID ORID

メタデータ、データの 整備・公開⼿続き

研究者の事務 作業の負担軽 減、研究成果 の露出向上

データ管理基盤 の外部化による 運営負担軽減・

露出増加

研究者情報・業績データ提出 ResarchMap

からのExport

研究データの提出、メタデータアノテーション

研究者がResearchMapのデー タからの提出を希望する場合

の選択肢も提供

図 1 研究データベースとリポジトリの連携を活用したオープンデータ登録支援

(9)

データ公開支援者は、研究機関に所属して いる研究者が登録している研究者データベ ースをクローリングし、新たな業績が登録 されたことを確認次第、データ公開申請書 を起票し、当該業績に関する書誌情報等を 予め埋めた上で、研究者に公開の可否、成 果物の提出について申請させる Web サイトへ の案内をする。例えば、研究者データベー スについては、国立研究開発法人科学技術 振興機構が提供している次世代研究基盤リ サーチマップ(researchmap)[15]によって、

各種データベースと連携し、各種研究補助 金の書類や評価データの提出フォーマット をダウンロード可能なサービスが提供され ている。また、researchmap のデータベース からデータを入手する Web サービスも提供さ れている。この Web サービスを利用して複数 の研究者に関する情報を XML 形式で一括して 入手可能とされている。この XML データから 研究機関が使用しているリポジトリサービ スに登録するためのメタデータの雛形を自 動生成する仕組みを開発することで、デー タ公開に関する業務効率化が期待される。

論文データベースは DBLP、PubMed、ORCID、

Web of Science 等多数あるが、researchmap に注目する理由は、複数の論文データベー スや書誌情報と連携して業績を取り込める こと、科研費や業績報告など、我が国に関 する研究者の各業務を支援する機能が提供 されている等、研究者にとっても機関にと っても業績の管理をワンストップで提供す るプラットフォームであると考えている。

C.3.4 TODO

・来年度以降、データポリシーにもとづ いた運用を開始する以前に、研究データの 管理にかかわる情報システムの管理規程等 の確認・整備が必要である。

・Jairo Cloud 等、外部のリポジトリサー ビスを利用してリポジトリを運用する場合 は、保有データの外部組織への管理委託に 関する規程の確認が必要である。

・researchmap の研究データベースから入

手できる情報とリポジトリに登録するメタ データについての調査とコンバートプログ ラムの開発

研究データに対するメタデータ、識別 子の付与、フォーマットについて

・ 研究データに対するメタデータ及び識 別子付与についての方針を記述する。ま た、研究データの特性に応じた標準的な フォーマットが存在する場合 は、それも 併せて記述する。

C.4.1 取り扱うメタデータの規格

国際的なデータ公開、再利用を推進する ために、研究データに対するメタデータ、

識別子は国際的に普及している規格を優先 的に採用するものとする。

我が国では、機関リポジトリの標準的 なメタデータスキーマとして junii2[16]が 流通しており、リポジトリ登録に使用され ている。しかしながら、研究データの記述 や OA 状況をモニタリングするために必要な 要素、各種識別子を記述するための要素を 十分に備えていないとされる[17]。国際的 に は 研 究 デ ー タ の メ タ デ ー タ と し て DataCite のメタデータスキーマ[18]が標準 的なものとして定着しており、junii2 も DataCite のメタデータとのハーモナイズが 検討されていた[17]。この流れをうけて、

junii2 に代わるメタデータスキーマとして

2017 年 10 月に JPCOAR スキーマ ver 1.0、そ

して 2018 年 8 月に現時点で最新版となる

ver1.0.1 が リ リ ー ス さ れ て い る [19] 。

Confederation of Open access

Repositories (COAR)や DataCite で利用され

ている統制語彙を当面必要とする用途に絞

って採用し、研究データ等の新しいコンテ

ンツへの対応、OA の状態(OA かどうか、エ

ンバーゴ終了日など)、公的研究助成に関す

る管理情報、多様な論文の種類を網羅する

など、JPCOAR コアスキーマは学術情報の国

(10)

際的な流通性を高め、かつオープンサイエ ンスに対応可能なメタデータの設計がなさ れている[20]。我々は国際的な研究機関と も協調して事業にあたることが期待されて いるから、このような国際的な流通性に配 慮したメタデータを積極的に採用すべきで あると考える。また、共用リポジトリサー ビスの JAIRO Cloud では 2019 年度に JPCOAR スキーマに対応した JAIRO Cloud を運用開始 予定であるとのことである[20]。

TODO:[17]によれば、現在の機関リポジト リは研究データの DOI 付与には対応していな いとのこと。現在の機関リポジトリの実装 について状況確認。NII 等の共同研究を検討 し、機関リポジトリに必要な要件の確認と 機能の開発に協力する。

TODO:JPCOAR メタデータ規格について検討 し、研究者の保有データ調査の為の基礎資 料とする。(分類手法など)

C.4.2 研究者の識別子

著者を管理する ID スキームは複数提案 されている。研究者の負担軽減のために、

シェアの大きい ID スキームの採用を検討す る。日本における研究助成申請時に使われ る科研費研究者番号をベースとした NRID と、

国際的な研究者識別子付与活動をリードし ている ORCID [21] (Open Researcher and Contributor ID)を中軸として利用すること が望ましいのではないか。また、科学研究 助成事業データベース上で NRID から ORCID のリンケージが可能となっている[22]。研 究機関全体の取り組みとして、着任時の研 究者向け研修(図書館、論文データベース の操作研修等)等の機会を利用して、ORCID の取得、そして NRID と ORCID のリンケージ 設定を推奨するのがよいのではないか。

メモ:

・NRID: 科研研究者番号 KAKEN データ ベース等で使用

・e-Rad: 府省共通研究開発システムで 使われる研究者用 ID

・ORCID 世界中で研究者を一意に特定す る た め の 研 究 者 用 ID 非 営 利 団 体 ORCID,Inc によって運用されている。

C.4.3 組織の識別子

科研費電子申請システムで利用されてい る機関番号[23]と世界の研究機関データベ ー ス GRID ( Global Research Identifier Database)[24]を採用するものとする。ま た、2019 年 2 月に CrossRef から GRID をベー スとした Research Online Registry(RoR)が 発表されており、こちらの動向も注目して いきたい。

例 ) 国 立 保 健 医 療 科 学 院 の GRID は grid.415776.6

RoR は https://ror.org/0024aa414

なお、識別子については採用するメタデ ータ規格の入力ガイドライン等で推奨され ているものが存在する可能性があるので、

メタデータ規格の検討時に識別子について もあらためて検討することとする。

C.4.4 データフォーマットについて 標準形式への研究データの準拠につい ては、データを生成した部局において個別 に判断するものとする。既存フォーマット を標準規格に準拠した別のフォーマットに 変換することは追加のコストや労力がかか る可能性があり、利用者側のニーズ(何の データをどのような形式で利用したいか等)

が把握出来ていない現状では優先度は低く、

まずはデータの存在について周知していく 取り組みについて優先度を割り振るべきで あると思われる。

但し、再利用性が高い状態で公開する

ことを要請されているため、ポリシーでは

原則としてスター・スキーム[25]の 3 段階目

(11)

以上の標準的形式での公開を目指すことに したい。

例えば、国立保健医療科学院は公衆衛 生分野を主に担当するが、公衆衛生分野で は、近年の国境を越えた人や資源の移動に ともなう自然環境、感染症などについて対 策がボーダレス化しつつある今、データの 迅速な公開、共有にむけて標準規格の準拠 についての重要性が認識されつつある。し かし、分野によってはデータの構造につい てコンセンサスが得られている標準規格は 殆ど存在しない。各分野においてのデータ の標準化に関するベストプラクティスが蓄 積され、相互運用性の確保の努力が行われ ることを期待し、現時点では「当研究分野 において標準化された規格があれば、可及 的にそれに準拠したデータ形式で公開する こと」と述べるのに留めるのが望ましいと 考える。

なお、Resource Definition Framework (RDF) [26]及び、RDF によって記述された Semantic Network か ら デ ー タ を 抽 出 す る SPARQL クエリ言語がオープンかつ標準的な データとして公開する手法として知られて いるが、結局のところ当該研究ドメインに 関するリソースの表現を統一するための語 彙定義がなされていることが前提であり、

先述したように公衆衛生分野では発展途上 である。所謂「標準規格に準拠したデータ」

のありかたについては、理想と実利のバラ ンスをとりつつ、下記の取り組みを並行し て進めるのが望ましいと思われる。なお、

前述した「スター・スキームの 3 段階目以上 の標準的形式」に関しては、以下の条件を 基準に選定することが望ましいと思われる。

・長期的な互換性を確保することを努力 しているソフトウェアで使われている形式 であること。

全てのデータはデータアクセスに関わ るハードウェアおよびソフトウェア環境が

2 https://www.gnu.org/software/pspp/pspp-

dev/html_node/Portable-File-Format.html#Portable-File- Format

旧式化するというリスクにさらされている [11]。そのため、過去のバージョンで作成 されたデータをインポートする下位互換性 を確保し、長期的なデータアクセスを保証 することをサポートしているソフトウェア があるならば、そのソフトウェアが利用し ている形式を優先して採用することを検討 する。

例えば PDF 形式文書はスター・スキーム で推奨されているフォーマットではないが、

やむをえず利用する場合は 長期保存のため の国際規格 ISO 19005-1(PDF/A)に準拠した PDF 形式で保存する等の配慮が必要である。

これは長期にわたって保存しても表示され る内容,色等が変化しないで再生できる PDF 文書を提供することを目標として策定され た規格である。

・データ形式に関する仕様が公開されて いること。

ソフトウェアがオープンソースのもので あればソフトウェアの開発が停止してもソ ースコード等からデータ形式の仕様を確認 し他のデータ形式に移植する可能性が残さ れている。しかし、商用ソフトウェアでは サポート中止後、仕様が開示されずブラッ クスボックス化し、データへのアクセスが 困難になることが考えられる。現時点でデ ータ形式に関する仕様が容易に入手できる ものを選択することが望ましい。但し、こ れは商用ソフトウェアの仕様を排除するも のではない。例えば、統計処理ソフトウェ ア SPSS では公式の公開仕様は存在しないが、

GNU PSPP プロジェクトより SPSS Portable Format(.por)

2

、SPSS System file(.sav)

3

の 仕様が公開されており、オープンソースの 統計処理ソフトウェア R[27]の foreign パッ ケージや機械学習等に多用されている開発 言語 python の pyreadstat ライブラリでサポ ートされている。同様に統計処理ソフト SAS、

Stata、地理情報空間システムに使われる地

3 https://www.gnu.org/software/pspp/pspp-

dev/html_node/System-File-Format.html

(12)

理空間データ ESRI シェイプファイル等、プ ロプライエタリなフォーマットであるが仕 様が公開されており、多数の汎用的なツー ルでサポートしているものは受け容れても 良いと思われる。

Excel や OpenOffice のスプレッドシー トソフトウェアも Open Document Format for Office Applications (ODF)フォーマットで 汎用的なかたちでデータを記述できるよう になっているが、Excel は表現力・自由度が 高く表や罫線、セルの加工が容易に出来る ため、結果としてデータの二次利用に適さ ないかたちでの公開につながる可能性が大 きく[28]、データの二次利用性向上にむけ たガイドラインを定義することも困難なこ とから極力使用しないことが望ましいと思 われる。

(i)当座のデータ公開にむけて

最終的には Semantic Web のフレームワー クの文脈に従ってデータを公開することが 望ましいとされている。そのため、現時点 では Semantic Web に則って公開できなくて も、現在どのレベルにあるのかを自覚的に 認識し、進歩の方向性を見定めることは有 用である。オープンデータとして公開する ときに、ティム・バーナーズ・リーはスタ ー・スキーム(star scheme)として 5 段階の 構 造 化 レ ベ ル を 考 慮 し 、 最 終 段 階 で あ る Link of Data (LOD)を意識していくことを提 案した[29]。

★ Available on the web (whatever format) but with an open license, to be Open Data

★★ Available as machine-readable structured data (e.g. excel instead of image scan of a table)

★★★ as (2) plus non-proprietary format (e.g. CSV instead of excel)

★★★★ All the above plus, Use open standards from W3C (RDF and SPARQL) to identify things, so that

4 https://www.w3.org/DesignIssues/LinkedData.html

people can point at your stuff

★★★★★ All the above, plus: Link your data to other people’s data to provide context

図 Five Star Scheme Linked Data - Is your Linked Open Data 5 Star?より引用

4

それによれば、一つ星はどのような形態 であれ、オープンライセンスで公開されて いること、二つ星は機械可読な構造化デー タとして利用可能(Excel 等が例示されてい る)にすること、三つ星は二つ星に加えて 非独自フォーマット、すなわち特定のベン ダー製品の使用を要求しない(CSV 等)もの にすること、四つ星はさらに W3C の標準規格 である RDF と SPARQL を使用して記述するこ と、五つ星は、これらのデータが他のデー タとリンクされる状態で公開されている状 態である。オープンサイエンスに資する観 点からは、データの再利用の障壁を下げる 一方で研究者に負担がかからないような運 用が望ましく、最低三つ星の水準を満たす かたちでの公開を求められれば十分であろ う。公開データ形式選択にあたっての基準 と事例については前項で考察している。

ただ、スタースキームでは機械可読可

能なフォーマットに加えて非独自フォーマ

ット、すなわちベンダー製品の使用を要求

しないものを、より上質なデータとして位

置づけている。このような論理では商用統

計処理ソフトよりベンダー非依存の CSV 形式

の方がよいという判断になる。しかしなが

ら、3 つの理由から必ずしもそのような選択

が最善とは限らないと思われる。一つ目は

先述したとおりプロプライエタリーのもの

であっても仕様が公開され多くのツールか

ら利用可能な状態であり、長期に渡って情

報資産として活用できるものであれば容認

しうると考える。もう一つの理由はより積

極的なものであり、データそのもの以外に

データ構造、欠損値定義、ラベル、コメン

ト等のメタデータがある場合、CSV に変換す

(13)

ることによってそれらの一部が失われる可 能性があることである。そして最後の理由 は、CSV はデータ構造が固定的であり、構造 の変化に弱く長期に渡るデータの互換性を 確保することが困難であることから、長期 間にわたるプロジェクトやデータ構造の要 件変更が発生するようなものには向いてい ない可能性がある。最終的なセマンティッ クスベースでのデータ処理に対応できるよ う、大元のデータおよびメタデータの形態 が最大限に保存され、なおかつ長期的にア クセスが保証されている形式を選択するこ とが望ましいと思われる。

(ii)データ構造の標準化にむけて

公衆衛生分野でのデータの標準化は 2 つの 方向性が考えられる。

一つは規制当局や国の事業のための情報 収集を用途とし、二次利用性を高めるため に内容の標準化をはかることである。CDISC がそのような用途の為の標準化をすすめて おり、この CDISC の SDTM において公衆衛生 分野の語彙を開発、導入することに寄与し ていくことが考えられる[30]。

もう一つは、LOD/RDF の文脈にあわせて統 計データとして公開するためのしくみとし て、SDMX(Statistical Data and Metadata eXchange)[31]をベースとした RDF データキ ューブ[32]の形態での公開を目指すことで ある[33]。

いずれにしても、公衆衛生分野は LOD の事 例は立ち後れている分野なので、研究デー タを保有している研究者と協業し、公衆衛 生分野の LOD を構築する研究プロジェクトと 予算獲得にむけた画策は必要であろう。

5 https://www.data.go.jp/

研究データの帰属、知的財産の取 り扱いについて

・ 研究データの帰属及び知的財産の取 り扱いについて、国研の関係規程を踏 まえた上で、研究データの利活用の方 針に応じて記述する。この記述は、 保 管に際して遵守すべきルールとして規 定するとともに、同ルールと研究デー タ利活用のルールと整合を取る。

・ 研究データに係る作成者、管理者等 の免責事項について記述する。

公的な研究資金にもとづいた研究活動、

あるいは機構の施設・設備等を利用した研 究、業務の過程で取得されたデータは、当 該研究者との特別な取り決めがない限り、

機構に帰属するものとされている。

C.5.1 データを公開する際のライセンスに ついて

データを公開するにあたり、基本的に は FAIR の原則にもっとも適うライセンス形 態として推奨されているクリエイティブコ モンズの CC BY 4.0 に準拠して公開するこ とが望ましいと考えられる。これは、オリ ジナルから改変された派生物が共有される ことと、商用利用を許容するものである。

日本政府は各省庁が保有しているデー タ を オ ー プ ン デ ー タ と し て 公 開 す べ く 、 DATA GO.JP というデータカタログサイト

5

を 提供しており、その利用規約では CC BY 4.0 国際でのライセンスが指定されている。

いわゆる「オープン」なライセンスに はオープンソースのライセンス群が知られ ているが、こちらは主にプログラム、ソー スコードに適用されるものであり(もちろ ん、研究の過程で作成されたアルゴリズム、

プログラムを公表するのであれば、オープ

ンソースでの適用となろう)、データや論文

にはそぐわないものである。

(14)

データに関して「オープン」なライセ ンスには同じくクリエイティブコモンズの CC0

6

、オープンデータ・コモンズの ODC-BY

7

が知られている。但し、CC0 は所謂著作権を 放棄する Public Domain であり、我が国では 著作権の放棄に関する明文の規定は存在せ ず、国立研究開発法人が適用するライセン スとしては不適切であると思われる。

ただ、メタデータに関する検討でも議論 したように、機微な情報を含むデータを扱 うこともあり、ただちにオープンできるデ ータのみではなく、個別に検討する必要が ある。そのため、データポリシーにおいて は一律のライセンスを指定するのではなく、

FAIR の原則に則したライセンスを優先的に 採用することを記述するにとどめることが 望ましいと考える。

C.5.2 商業利用への提供について

独立行政法人海洋研究開発機構のデー タポリシー[34]では、産業利用については 原則として有償として、適切な対価を徴収 することが記載されている。本稿での検討 の対象となっている国立研究開発法人にお いては、民間より何らかの対価を徴収する ような運用についての検討に乏しいところ がある。文部科学省の「研究開発成果とし ての有体物の取扱いに関するガイドライン

8

」 において、成果有体物については商業利用 を目的とした者への提供の場合は、「提供を 要請する者と各機関との間において、成果 有体物の取扱に関する必要な条件を明記し た譲渡又は貸付契約を締結し、有償で提供 する。」とあるとおり、有償での提供が一般 的な扱いとなっている。一方、厚生労働省 においてはそのようなガイドラインは現存 せず、なおかつ法人化された国公立大学と も 異 な り 、 国 の 試 験 研 究 機 関 は 現 在 で も

6 https://creativecommons.org/publicdomain/zero/1.0/

7 https://opendatacommons.org/licenses/by/summary/

http://www.mext.go.jp/a_menu/shinkou/sangaku/sangaku8 c/020901.htm

「国」扱いのため、個別の検討が必要であ る。データポリシー策定と並行して、職務 発明規程や就業規則の修正・追補を検討し たい。

ただ、商用利用に関する制約を入れるこ とは、CC における「オープン」の定義[35]

に反する可能性がある

9

ため、先に推奨ライ センスとして提案した CC BY 4.0 と衝突しう ることも念頭におかなければならない。

研究データの公開、非公開及び猶予期 間並びに引用について

・研究データの公開について、機関の 研究データの利活用の方針に応じてデー タ公開までの猶予期間を適切に設定し、

そ れ に 基 づ く 公 開 時 期 に つ い て 記 述 す る。

・ 公開データの利用に際しては、利用 者 に 対 し て 適 切 な 引 用 を 求 め る 。 そ の 際、識別子を用いた引用情報の記載ルー ルを設けるなど、他のユーザーが引用元 のデータを参照できるよう配慮する。

研究データは出版社や研究者自身によ って設定されたエンバーゴ期間を過ぎれ ば、一般公開に支障がない限り遅滞なく 公開するものとする。一部の出版社や学 協 会 で は 出 版 後 一 定 期 間 が 経 過 す る ま で、Green OA で同一論文を公開すること を認めない(embargo:公開猶予期間)が 存在することがある。また研究者によっ て合理的かつ公益を損ねない範囲での研 究の競争上の優位性を保つための公開ま での猶予期間の指定がある場合は、その 猶予期間の指定後にデータを公開するも のとする。研究者のモチベーション維持 のために、公益を損ねない範囲での研究 者の利益を擁護することは必要である。

9 2.1.9

料金領収の禁止 ライセンス は、その条件の一

部としていかなる料金支払いの取り決めや、ロイヤリティ、

あるいはその他の補償行為あるいは金銭的代償を 規定

してはならない。

(15)

公開データの利用に際しては、利用者 に 対 し て 適 切 な 引 用 を 求 め る こ と と す る。但し、リポジトリによるデータ識別 子の永続的な管理体制とデータ引用の標 準様式が普及していないため、当面は学 術論文の投稿規程等で定められた様式で 引用することを要求するところから始め るものとする。リポジトリを構築し、デ ータに対して安定した識別子が付与され るようになれれば、識別子を用いた引用 情報の記載ルールを設けることとする。

D. 参考文献

1. 国際的動向を踏まえたオープンサイエン スの推進に関する検討会. 国立研究開発 法人におけるデータポリシー策定のため のガイドライン . 2018; Available from:

https://www8.cao.go.jp/cstp/stsonota /datapolicy/datapolicy.pdf.

2. 内閣府 政策統括官(科学技術・イノベー ション担当). 国立研究開発法人におけ るデータポリシー策定のためのガイドラ イ ン ~ 解 説 資 料 ~ . 2019; Available from:

https://www8.cao.go.jp/cstp/stsonota /datapolicy/dpguideline.pdf.

3. Weibel, S., et al., Dublin core metadata for resource discovery.

Internet Engineering Task Force RFC, 1998. 2413(222): p. 132.

4. Guides, A. Publishing and sharing sensitive data . 2018; Available from:

http://www.ands.org.au/__data/assets /pdf_file/0010/489187/Sensitive- Data-Guide-2018.pdf.

5. Initiative, B.O.A., Read the Budapest open access initiative. Budapest Open Access Initiative, 2002.

6. Harnad, S., Fast-forward on the green road to open access: the case against

mixing up green and gold. arXiv preprint cs/0503021, 2005.

7. 東京大学附属図書館, オープンアクセス ハンドブック 第 2 版. 2017.

8. 課題領域:オープンサイエス(SCPJ)班, 機. 国内学協会のオープンサイエンス対 応状況調査(報告) . 2016; Available from:

http://id.nii.ac.jp/1280/00000199/.

9. オープンアクセスリポジトリ推進協会.

2019; Available from:

https://jpcoar.repo.nii.ac.jp/.

10. JPCOAR, JPCOAR オープンアクセスリ ポジトリ戦略 2019~2021 年度. 2019.

11. Van den Eynden, V., Managing and sharing data: Best practice for researchers . 2011: UK Data Archive.

12. Foster, E.D. and A. Deardorff, Open science framework (OSF). Journal of the Medical Library Association:

JMLA, 2017. 105(2): p. 203.

13. 込山悠介, 研究データ管理サービス:

GakuNin RDM. 2019.

14. 国立情報学研究所オープンサイエン ス基盤研究センター. GakuNin RDM(研究 デ ー タ 管 理 基 盤 ) . 2017; Available from:

https://rcos.nii.ac.jp/service/rdm/.

15. 坪井, 彩. and 治. 大須賀, JST サー ビ ス 紹 介 国 内 最 大 級 の 研 究 者 総 覧 researchmap. 情報管理, 2018. 60(12):

p. 906-909.

16. 学術機関リポジトリ構築連携支援事 業. メタデータ・フォーマット junii2

(バージョン 3.1 ) . 2014; Available from:

https://www.nii.ac.jp/irp/archive/sy stem/junii2.html.

17. 大園, 隼., サンメディアソリューシ ョンセミナー オープンサイエンスの最新 情報 : メタデータの相互運用性を中心に.

薬学図書館 = Pharmaceutical library

bulletin, 2017. 62(1): p. 40-47.

(16)

18. Group, D.M.W. DataCite Metadata Schema 4.2 . 2019; Available from:

https://schema.datacite.org/meta/ker nel-4.2/doc/DataCite-

MetadataKernel_v4.2.pdf.

19. オープンアクセスリポジトリ推進協 会. JPCOAR スキーマガイドライン Ver 1.0.1 . 2018; Available from:

https://schema.irdb.nii.ac.jp/ja.

20. 大園 隼彦, et al., JPCOAR スキーマ の策定:日本の学術成果の円滑な国際的 流 通 を 目 指 し て . 情 報 管 理 , 2018.

60(10): p. 719-729.

21. 蔵川, 圭. and 英. 武田, 研究者識 別子 ORCID の取り組み. 情報管理, 2012.

54(10): p. 622-631.

22. Kurakawa, K., et al., Researcher Name Resolver: identifier management system for Japanese researchers.

International Journal on Digital Libraries, 2014. 14(1-2): p. 39-58.

23. 独立行政法人日本学術振興会. 機関 番 号 一 覧 . 2019; Available from:

https://www-

shinsei.jsps.go.jp/kaken/topkakenhi/

codelist-ka.html.

24. Science, D. GRID Global Research Identifier Database . 2019; Available from: https://www.grid.ac/.

25. Berners-Lee, T., Five star open data . 2009.

26. Lassila, O. and R.R. Swick, Resource description framework (RDF) model and syntax specification. 1998.

27. R Core Team. R: A Language and Environment for Statistical Computing . 2019; Available from: https://www.R- project.org/.

28. 奥村 晴彦, 「ネ申 Excel」問題. 情 報教育シンポジウム 2013 論文集, 2013.

2013(2): p. 93-98.

29. Tim Berners-Lee. Linked Data . 2010; Available from:

https://www.w3.org/DesignIssues/Link edData.html.

30. 木村 映善 and 上野 悟, 公衆衛生分 野でのデータ利活用に貢献する標準医療 情報規格と CDISC 標準. 保健医療科学, 2019. 68(3): p. 212-218.

31. SDMX, S., Statistical Data and Metadata Exchange. URL: http://sdmx.

org, 2011.

32. W3C. The RDF Data Cube Vocabulary . 2014; Available from:

https://www.w3.org/TR/vocab-data- cube/.

33. 西村, 正., Linked Open Data(LOD)

による統計データの提供:政府統計デー タ ( e-Stat ) の 新 し い 形 . 情 報 管 理 , 2017. 59(12): p. 812-821.

34. 独立行政法人海洋研究開発機構, デ ータ・サンプルの取り扱いに関する基本 方針(データポリシー). 2007.

35. Foundation, O.K. Open Definition 2.1 . Available from:

http://opendefinition.org/od/2.1/ja/.

参照

関連したドキュメント

ImproV allows the users to mix multiple videos and to combine multiple video effects on VJing arbitrary by data flow editor. We employ a unified data type, we call, Video Type which

REC DATA MASTER L to SD CARD REC DATA MASTER R to SD CARD VOLUME SOUND

These results can be used to assess the difference between two chronologically or physically separated massive data sets, making one quick pass over each data set, without buffering

Aiming to introduce a general framework, which encompasses most multiscale representation systems developed within the area of applied harmonic analysis, we start by reviewing some

Data are thus submitted to exploratory data analysis, to recover as much synthesized information as possible, in order to reveal any existing data structure and, in particular, to

This paper presents a data adaptive approach for the analysis of climate variability using bivariate empirical mode decomposition BEMD.. The time series of climate factors:

The calibration problem for the Black-Scholes model was solved based on the S&P500 data, and the S&P 500 call and put option price data were interpreted in the framework

SMALL SPILL: Absorb with an inert material and put the spilled material in an appropriate waste disposal.. LARGE SPILL: Absorb with an inert material and put spilled material in