研究論文
機関リポジトリによるオープンアクセス進捗率の因果分析
A Causal Analysis of the Progress of Open Access
Using Institutional Repositories
河合将志
1*,尾城孝一
1,前田隼
2,西澤正己
1,山地一禎
1Masashi KAWAI
1*, Koichi OJIRO
1, Jun MAEDA
2Masaki NISHIZAWA
1, Kazutsuna YAMAJI
11 国立情報学研究所
National Institute of Informatics
〒101-8430 東京都千代田区一ツ橋2丁目1番地2号 2 北海道大学附属図書館
Hokkaido University Library
〒060-0808 北海道札幌市北区北8条西5丁目 *連絡先著者 Corresponding Author 日本では800以上の機関リポジトリが運用されているが,学術雑誌論文の登録に積極的な機関は 一部に限られている.本研究では,機関リポジトリコミュニティに指針を与えることを目的として,学術 雑誌論文件数と図書館員によるオープンアクセス推進活動の因果関係を分析した.国内87機関の データを計量分析した結果,研究者へ直接アプローチする「学術雑誌論文提供依頼」の実施は,学 術雑誌論文件数の増加に特に効果的である一方で,「オープンアクセス方針」の策定や「セルフア ーカイブ」の実施は,それほど効果的ではないことがわかった.因果関係の詳細を把握するために, 「学術雑誌論文提供依頼」に関して追加で収集した4機関のデータからは,その年間成功率の平均 は36.32%であり,最も効果的に実施できている機関の平均と最高値は,それぞれ55.82%と73.20%に も及ぶことが明らかになった.
More than 800 institutional repositories exist in Japan, but only a few institutions are active in registering journal articles. In this study, we analyzed the causal relation between the number of journal articles and librarians’ open access promotion activities to provide good practice guidelines to the institutional repository community. Quantitative analysis results using data from 87 domestic institutions showed “request for journal articles”, a direct approach to researchers, was estimated particularly influential in increasing the number of journal articles. On the other hand, activities, for instance, in developing an “open access policy” or implementing “self-archiving” were found less influential. Additional collected data from 4 institutions regarding the “request for journal articles” to understand the details of the causal relation revealed an annual success rate averaged 36.32%. Furthermore, the data showed the annual success rate of an institution implementing it most effectively averaged 55.82%, reaching a peak of 73.20%.
キーワード: オープンアクセス, オープンサイエンス, グリーンオープンアクセス, 機関リポジトリ Open Access, Open Science, Green Open Access, Institutional Repository
1 はじめに
学術雑誌論文のオープンアクセス(Open Access:OA)化に向けた取組みが,近年の オープンサイエンス推進の潮流と相まっ て,世界的に広まっている[1].OAを実現す る 方 法 は , 著 者 が 支 払 う 論 文 処 理 費 用 (Article Processing Charge: APC)等により OA論文として出版する方法(ゴールドOA) と,学術雑誌のOAポリシーに従い学術雑誌 論文をリポジトリに登録する方法(グリー ンOA)に大別される[2].両者のうち近年で は,ゴールドOAへの転換を大規模に進めよ うとするOA2020のようなイニシャティブ に基づいた動きが活発化している[3].しか しながら,その転換を実現する上では,APC の値上がりや[4],過去に出版された学術雑 誌をOA化できないという問題[5],ゴール ドOA雑誌からサブスクリプションモデル への転換の頻発など[6],克服すべき課題が 多く残されている.こうした混沌とした状 況のなかで,オープンサイエンスの一翼を 担うOAを着実に進展させるためには,グリ ーンOAが依然として重要な意味をもつ. グリーンOAを実現する上で不可欠とな るOAリポジトリには,大学等の機関が設置 す る 機 関 リ ポ ジ ト リ ( Institutional Repository:IR)と,PMC(PubMed Central) に代表される複数あるいは個別の研究分 野 ご と に 運 用 さ れ る 分 野 リ ポ ジ ト リ (disciplinary repository)が主としてある [7][8].最近では,分野リポジトリに分類さ れるarXivやSSRN(Social Science Research Network)などのプレプリントサーバが急 速に増えており[9],研究成果の早期普及を 可能にしているが,費用負担を含めた持続 的な運用モデルの確立には至っていない 場合が多い[10].一方で,大学や研究機関の 図書館が主体となって運用するIRは,長期 的な運用という点において優位性がある. 日本におけるIR設置数は853(2020年3月 現在,構築中を含む)にも及び,世界でも 有数のIR保有国となっている[11].この優 れた基盤の整備状況のなかで,コンテンツ として最も登録されているのは紀要であ る[12].これは,IR設置機関内の部局等によ って査読・発行され,自ずと機関内に集積 される紀要については,IRへの集中的な登 録が容易なことに起因する[13].一方,学会 によって査読・発行され,機関外に散在す る学術雑誌論文については,集中的な登録 が難しく,グリーンOAに積極的に取り組ん でいる機関は一部に限られている.こうし た状況を改善し,グリーンOAを推進してい くためには,先行機関の活動のうち,学術 雑誌論文の取得に特に効果的な活動を特 定し,それを他の機関に波及させていく必 要がある. これまでに報告されているグリーン OA に関する研究は,(1)普及率についての研 究[14][15],(2)注目度(被引用件数・閲覧 件数)についての研究[15][16],(3)アーカ イビングポリシーについての研究[17][18], (4)研究者のプラクティスについての研 究[19],(5)研究者の理解度についての研究 [20]に類型され,学術雑誌論文の取得に効 果的な活動を明らかにした研究はない.そ こで本研究では,グリーンOA の推進に取 り組む日本の IR コミュニティに指針を与 えることを目的に,IR による OA 進捗率と 図書館員によるOA 推進活動の因果関係を 分析し,学術雑誌論文を取得する上で,ど の活動がどの程度の効果をもたらしてい るのかを定量的に評価した.2 方法
2.1 分析の概要
本研究では,2.2で述べるアルゴリズムを用 いた判別タスクを通して,IRによるOA進捗 率(目的変数)と図書館員によるOA推進活 動(説明変数)の因果関係の明確化を試み た.IR設置機関(個体)のなかから進捗率の 高い機関を判別する上で,正の影響力が強 い説明変数が進捗率の高い機関に固有の活 動であり,それをグリーンOAを推進していく上 で効果的な活動として位置づけた.特に効果 的な活動については,その具体的な影響力 を調べることにより,因果関係の詳細を明 らかにした. 目的変数であるIRによるOA進捗率は,所 属研究者による学術雑誌論文が,コンテン ツとしてIRに登録されている割合に該当 する.国立大学については規模別(学部数 別)の進捗率が報告されているが[12],機関 ごとの情報は公開されていない.本研究で は,県立大学や私立大学も含めた機関ごと の進捗率を得るために,2.3で述べる方法で データを取得した. 説明変数である図書館員によるOA推進 活動については,各機関が独自に実施する 悉皆的な把握が難しいものであり,関連す る研究もないため,国立大学図書館協会の 報告書[12][21]やJPCOAR(Japan Consortium for Open Access Repositories)のウェブサイ ト[22]を参照した.これらで言及されてい る活動の各機関における実施状況を把握 するためには,ウェブ質問紙調査が必要に なるが,多岐に及ぶ活動全てについての質 問項目を設ければ,高い回答率を得ること が難しくなる.そこで,相互に強く関連す る活動については,いずれかの活動に着目 した.例えば,「事業計画の立案」は「OA 委員会」が担っているため,後者を取り上 げた.このようにして選定したのが,表1左 の15の活動である.各活動の実施状況の把 握には,同表右の質問項目を用いた.ウェ ブ質問紙調査による具体的なデータの取 得方法については,2.4で述べる. 表 1 図書館員による OA 推進活動とその実施状況に関する質問項目2.2 アルゴリズム
判別タスクを行うためのアルゴリズムと しては,決定木を弱学習器にもつ判別器で あるランダムフォレストを用いた[23].弱 学習器である決定木は,空間分割前と分割 後の不純度(進捗率の高い機関と低い機関 の混在の程度)の減少量を最大化する説明 変数とその値の再帰的な決定により判別 を行う.決定木の数と同数が必要になる行 列(目的・説明変数と個体から成るデータ のセット)は,ブートストラップサンプリ ングにより量産される.決定木の集合体で あるランダムフォレストは,各決定木によ る判別の多数決をとることにより判別を 行う.このように機能するランダムフォレ ストは,ディープラーニングやサポートベ クターマシンとは異なり,不純度の平均減 少量を説明変数の影響力として算出でき, 説明性という点において本研究に適して いる.この特徴は決定木に由来するもので あるが,複数の決定木から成るランダムフ ォレストは,一般的に,決定木単体よりも 高い判別精度をもつ. ランダムフォレストが算出できるのは, 説明変数の影響力の大小までであり,それが 正あるいは負のどちらの影響力をもつのかを 確認するため,部分従属(partial dependence) プロットも用いた[24].部分従属プロット により,生成したランダムフォレストを用 いたシミュレーションの結果を示すこと ができる.具体的には,着目する活動を各 機関が実施している状況と,実施していな い状況が,他の活動の実施状況は現実のま まに固定された上で作られ,各々の状況に おける判別結果が部分従属度としてプロ ットされる.なお,「IR担当職員数」のよう な二値以上の値をとる活動に着目する場 合も,一人の状況,二人の状況,三人の状 況といった各々の状況における部分従属 度がプロットされる.実施している(数が 多い)状況の方が,進捗率の高い機関であ ると判別される傾向が強ければ,その活動 は正の影響力をもつことになる.2.3 IRによるOA進捗率
目的変数となるIRによるOA進捗率は,式 (1)により求めた.機関間での学術雑誌論文 件数の差を加味するために,分子そのもの を目的変数とするのではなく,分母を設け て正規化した指標を用いた. ! IRに登録された 所属研究者による 学術雑誌論文件数 $ %所属研究者による 学術雑誌論文件数& × 100 [%] (1) 分母は,所属研究者による学術雑誌論文 件数として,2012年から2014年に出版され た学術雑誌論文を採録したWoS(Web of Science)2016年版の情報のうちの,英語学 術雑誌論文のメタデータ148,521件を参照 した.日本語学術雑誌論文までも網羅した 抄録・引用文献データベースはないため, WoSに採録されている,一定の評価を受け た学術雑誌に掲載された論文を学術雑誌 論文と見做し,その件数を分母に置いた. 分子は,IRに登録された所属研究者によ る学術雑誌論文件数として,国立情報学研 究 所 が 運 用 す る IRDB ( Institutional Repositories DataBase)サービスの2019年2 月にハーベストされた情報を参照した. IRDBは,各IRに登録されたコンテンツのメ タデータを,junii2と呼ばれるメタデータ形 式で収集している[25].junii2で表現された メタデータでは,資源タイプJournal Articleから学術雑誌論文の識別が可能であり,そ の件数から分子を求めた.ただし,IRDBか ら得られるメタデータはIRを運用する図 書館によって付与されたものであり,目視 したところ,学術雑誌論文として登録され ている相当数の紀要論文があった.これを 除去するために,まず,IRDBから得られる 本文が登録された英語学術雑誌論文のメ タデータ73,633件のうち,DOIが付与され ていない30,871件について,出版社のウェ ブサイトなどを確認し,12,136件にDOIを 付与した.次に,2012年から2014年に出版 された学術雑誌論文を採録したWoSのデー タとDOIによるマッチングを行い,適合し た学術雑誌論文のみを式(1)の分子の値と して用いた.WoSの情報よりも近年にまで 及ぶIRDBの情報を参照したのは,過去に出 版された学術雑誌論文を登録する場合や, エンバーゴ(公開猶予期間)が設けられて いる場合における,出版から登録までの時 差を考慮してのことである.なお,IRには ゴールドOA論文が一部登録されている可 能性もあるが,それらを区別することが, 登録された学術雑誌論文を悉皆調査する 作業コストに見合うものとは言い難いた め,双方を含むものとして進捗率を算出し た. 図1は,式(1)によって求めた各機関(横軸) の進捗率(縦軸)であり,進捗率の高い機 関は一部に限られていることがわかる.判 別タスクを行うためには,具体的にどの機 関までを進捗率の高い機関と見なすのか を決める必要があり,非階層型クラスタリ ングの手法であるk-meansを試行した.クラ スタ数を2として機関を二分した結果,11 機関のみが進捗率の高い機関となった.こ の機関数は,判別精度の高いランダムフォ レストを生成するためのデータ量として は十分ではない.機関数を人為的に増やす オーバーサンプリングを適用する場合に も,それがデータの学習を必要とすること から,機関数は多い方が望ましい.そこで, 進捗率が全体の平均(5.47%)を上回る20機 関を進捗率の高い機関とした.この20機関 の進捗率の累積を全体の累積で除した相 対累積進捗率は87.10%に及ぶ.
2.4 図書館員によるOA推進活動
説明変数となる図書館員によるOA推進 活動についてのデータは,IRDB登録機関の IR担当者に対するウェブ質問紙調査によ って取得した.ウェブ質問紙調査では,表 1右に示した質問項目を設けた.数値以外 図 1 IR による OA 進捗率の回答に対しては,実施していれば1,して いなければ0とするダミーコーディングを 施した.ただし,JAIRO Cloudの利用の有無 についてのデータは,JPCOARのウェブサ イトを参照した[26].以下はウェブ質問紙 調査の概要である. 期間:2018年7月9日〜2018年7月27日 対象機関:IRDB登録667機関 回答機関:527機関 回答率:79.01%
2.5 対象機関と均衡化処理
個体とできるのは,目的変数と説明変数 についてのデータが取得可能な図1に示し た機関に限られる.具体的には,WoSや IRDBに所属研究者の学術雑誌論文の情報 があり,ウェブ質問紙調査にも回答した, 87機関のみが対象となった. 個体となる機関の数には,判別精度を保 つための処理を施した.機関数の内訳は, 「進捗率の高い機関20:低い機関67」であ り,このような不均衡データから生成され た判別器は,前者を数が多い後者として誤 判別する傾向がある.そこで,少数派のオ ーバーサンプリングと多数派のアンダー サンプリングによって不均衡を是正する SMOTE ( Synthetic Minority Over-sampling TEchnique)を適用し,「進捗率の高い機関 40:低い機関40」へと均衡化した[27].3 分析結果
表2は,不純度,分割時の説明変数試行数, 決定木の数をそれぞれ,ジニ不純度,7, 10,000として生成したランダムフォレスト の判別精度を確認するための,交差検証に 相当するテストの結果である.これより, 正答(33,34)が誤答(7,6)を大きく上 回っていることがわかる. 図2は,判別への影響力をあらわす不純度 の平均減少量(横軸)を示したものである. 図には,「学術雑誌論文提供依頼」,「ダ ウンロード件数通知」,「IR担当職員数」 の影響力が強く,「OAウィークイベント」 から「セルフアーカイブ」までの影響力が 弱いことが示されている. 図3は,影響力の強い「学術雑誌論文提供 依頼」,「ダウンロード件数通知」,「IR 担当職員数」の実施状況(横軸)に対する, 進捗率の高い機関についての部分従属度 (縦軸)のプロットである.「学術雑誌論 文提供依頼」と「ダウンロード件数通知」 のプロットにおける横軸の0は活動を実施 していない状況を,1は実施している状況 を意味する.これら二つの活動が現実に取 り得る値は0か1のみであるが,それら以外 の値も取っているのは,いくつかの個体が SMOTEによって人工的に生成されている ことによる.なお,「IR担当職員数」のプ 表 2 判別精度 図 2 OA 推進活動の影響力ロットにおける横軸は職員数をあらわし ている.いずれのプロットも右肩上がりに なっていることから,「学術雑誌論文提供 依頼」や「ダウンロード件数通知」を実施 している機関や,「IR担当職員数」の多い 機関は進捗率の高い機関である可能性が 高く,その逆ではないことが確認された. 影響力が強い活動のうち,「学術雑誌論 文提供依頼」は,一般的に再配布が許可さ れているゴールドOA論文には適用されな いため,グリーンOAとの関連が深く,特に 影響力が強い.ただし,不純度の平均減少 量からは,「学術雑誌論文提供依頼」の影 響力が相対的に強いことはわかっても,そ れが学術雑誌論文の取得にどの程度つな がっているのかという因果関係の詳細ま ではわからない.そこで,この点を具体的 に示す成功率についても調べた. 図4は進捗率の高い機関のうち,4機関(国 立総合大学)における各年度(横軸)の学 術雑誌論文提供依頼の成功率(縦軸)を示 したものである.データについては,IR担 当者に直接依頼することにより,ゴールド OA論文を区別できるものを集計可能な年 度分取得した.対象機関が4機関なのは,こ のようなデータの集計が可能であった機 関が限られることによる.複数年度分のデ ータを取得したのは,単年度分のデータか らは,得られた成功率が例外的なものなの か,平均的なものなのかの判断ができない からである.図中の成功率は,ゴールドOA 論文を除いた上で,入手できた学術雑誌論 文件数を学術雑誌論文提供依頼件数で比 率化することにより求めた.成功率の全体 平均は,36.32%であり,成功率が低い機関 Dを除くと,45.09%まで上昇する.機関Aが 取り組みを始めた2014年の成功率が最も 高く,73.20%であった.その後も機関Aの 成功率は,ほぼ定常的に50%を超えており, 平均は55.82%にも及ぶ.
4 考察
本研究では,グリーンOAの推進に取り組 む日本のIRコミュニティに指針を与える ことを目的に,IRによるOA進捗率と図書館 員による活動の因果関係を分析した.その 結果,学術雑誌論文を取得する上で,「学 術雑誌論文提供依頼」,「ダウンロード件 数通知」,「IR担当職員数」が効果的であ ることが明らかになった.さらに,因果関 図 3 OA 進捗率と OA 推進活動の関係性 0.0 0.2 0.4 0.6 0.8 1.0 -0.8 -0.4 0.0 0.4 学術雑誌論文提供依頼 部分従属度 0.0 0.2 0.4 0.6 0.8 1.0 -0.4 -0.2 0.0 0.2 0.4 ダウンロード件数通知 部分従属度 0 5 10 15 20 -0.10 -0.05 0.00 IR担当職員数 部分従属度係の詳細を把握するために,4機関に対し て行った「学術雑誌論文提供依頼」につい ての追加調査からは,成功率が50%を超え る機関もあることがわかった.「学術雑誌 論文提供依頼」に関する活動は古くから提 案されているものであるが[28],その効果 を定量的に示したのは本研究が初めてで ある. 分析結果から,「学術雑誌論文提供依頼」 を特に注力すべき活動として位置づける ことができるが,計量分析と追加調査にお ける対象機関はそれぞれ,87機関と4機関 に限られるだけではなく,機関間で成功率 に差が見られることから,分析結果から得 られる知見の一般化には留意を要する.例 えば,「学術雑誌論文提供依頼」の普及に あたっては,成功率を高めるための工夫が 各機関に求められる. 本研究により,「学術雑誌論文提供依頼」 が効果的であることが定量的に示された が,その実践には複雑な作業を必要とする. 具体的には,(1)所属研究者による学術雑誌 論文の把握,(2)アーカイビングポリシーの 確認,(3)メールの作成,(4)メタデータの入 力などである.これら一連の作業からなる 「学術雑誌論文提供依頼」を普及していく ためには,ITによる省力化が鍵となる.従 来は人手によって行われてきた(1)〜(4)を システムが代行することで,より多くの機 関が「学術雑誌論文提供依頼」を実践でき るようになることが期待される.通常は, 新機能のシステム開発は各機関にとって 負担となるが,日本にはJAIRO Cloudがある ことが,普及にあたっての大きなアドバン テージとなる. 本研究の課題としては,進捗率と残る活 動の因果関係の詳細の明確化が挙げられ る.進捗率や活動の実施状況を二値で表現 したデータに基づく本研究の分析結果か らは,活動が学術雑誌論文の取得にどの程 度つながっているのかという因果関係の 詳細までを把握することはできない.それ が故に,「学術雑誌論文提供依頼」の成功 率を調べたのであったが,効果的であるこ とが確認された残る活動についても,同様 の調査が望まれる.例えば,「ダウンロー ド件数通知」を受けている研究者に対する 「学術雑誌論文提供依頼」の成功率が特に 図 4 学術雑誌論文提供依頼の成功率
高いことが確認されれば,両活動の組み合 わせによる実施が効果的であることを提 言できる. 加えて,日本語学術雑誌論文についての データの構築も課題といえる.本研究では 英語学術雑誌論文を採録したWoSの情報 を基準に進捗率を算出したため,分析結果 には日本語学術雑誌論文の情報は反映さ れていない.その情報も含んだ進捗率を算 出するためには,CiNiiのAPIを利用するな どして,日本語学術雑誌論文についてのデ ータを構築する必要がある.こうしたデー タの拡張により,WoS採録学術雑誌論文を 産出していない機関を対象とした分析も 可能になることから,言語だけではなく, 機関数という点にもおいても汎用的な知 見の獲得が期待できる. 将来における展開としては,「学術雑誌 論文提供依頼」に焦点を絞った分析が考え られる.例えば,成功率の差や,それに協 力的な研究者とそうでない研究者の違い などを説明することができれば,より発展 的な指針の提示が可能になる.こうした取 り組みを通じて,日本のIRを活用したグリ ーンOAの推進に貢献していきたいと考え ている.
謝辞
本研究に協力いただいた全国の図書館員 の皆様とJPCOAR に深謝致します。 本研究は,日本学術振興会科学研究費助 成事業20K20139 の助成を受けたものです。参考文献
[1] OECD: “Making Open Science a Reality”, OECD Science, Technology and Industry
Policy Papers, No.25, OECD Publishing, 108p., 2015.
[2] Guédon, Jean Claude: “The ‘Green’ and ‘Gold’ Roads to Open Access: The Case for Mixing and Matching”, Serials Review, Vol.30, No.4, pp.315–28, 2004.
[3] Samberg, Rachael; Schneider, A. Richard: “What’s behind OA2020?”, College & Research Libraries News, Vol.79, No.2, pp.85– 88, 2018.
[4] Khoo, Shaun Yon Seng: “Article Processing Charge Hyperinflation and Price Insensitivity: An Open Access Sequel to the Serials Crisis”, LIBER Quarterly, Vol.29, No.1, pp.1–18, 2019. [5] 小陳左和子;矢野恵子:「ジャーナル購 読からオープンアクセス出版への転換に 向けて —欧米の大学および大学図書館コ ンソーシアム連合(JUSTICE)における取 り組み—」,大学図書館研究,No.109, pp.2015-1–2015-15,2018.
[6] Matthias, Lisa; Jahn, Najko; Laakso, Mikael: “The Two-Way Street of Open Access Journal Publishing: Flip It and Reverse It”, Publications, Vol.7, No.2, pp.1–29., 2019. [7] 尾城孝一;市古みどり:「オープンアク
セスの現在地とその先にあるもの」,大学 図書館研究,No.109,pp.2014-1–2014-13, 2018.
[8] Herb, Ulrich; Müller, Matthias: “The Long and Winding Road: Institutional and Disciplinary Repository at Saarland University and State Library”, OCLC Systems & Services: International Digital Library Perspectives, Vol.24, No.1, pp.22–29, 2008.
[9] Chiarelli, Andrea; Johnson, Rob; Pinfield, Stephen; Richens, Emma: “Preprints and Scholarly Communication: An Exploratory
Qualitative Study of Adoption, Practices, Drivers and Barriers”, F1000Research, No.8, Vol.971, pp.1–74, 2019.
[10] Mallapaty, Smriti: “Popular Preprint Servers Face Closure Because of Money Troubles”, Nature, Vol.578, No.7795, p.349, 2020. [11] 国立情報学研究所:「機関リポジトリ公 開数とコンテンツ数の推移」,https://www. nii.ac.jp/irp/archive/statistic/ [12] 国立大学図書館協会:“「オープンアク セスへの取り組み状況に関する実態調査」 報告書”,113p.,2017. [13] 国立大学図書館協会:“「学術機関リポ ジトリに関する調査」報告書”,11p.,2010. [14] Björk, Bo Christer; Welling, Patrik;
Laakso, Mikael; Majlender, Peter; Hedlund, Turid; Gudnason, Gudni: “Open Access To The Scientific Journal Literature: Situation 2009”, PLoS ONE, Vol.5, No.6, pp.1–9, 2010.
[15] Piwowar, Heather; Priem, Jason; Larivière, Vincent; Alperin, Juan Pablo; Matthias, Lisa; Norlander, Bree; Farley, Ashley; West, Jevin; Haustein, Stefanie: “The State of OA: A Large-Scale Analysis of the Prevalence and Impact of Open Access Articles”, PeerJ, Vol.2018, No.2, pp.1–23, 2018.
[16] Miguel, Sandra; Chinchilla-Rodriguez, Zaida; de Moya-Anegón, Félix: “Open access and Scopus: A New Approach to Scientific Visibility from the Standpoint of Access”, Journal of the American Society for Information Science and Technology, Vol.62, No.6, pp.1130–1145, 2011.
[17] Laakso, Mikael: “Green Open Access Policies of Scholarly Journal Publishers: A Study of What, When, and Where
Self-Archiving Is Allowed”, Scientometrics, Vol.99, No.2, pp.475–94, 2014.
[18] Gadd, Elizabeth; Troll Covey, Denise: “What Does “Green” Open Access Mean? Tracking Twelve Years of Changes to Journal Publisher Self-Archiving Policies”, Journal of Librarianship and Information Science, Vol.51, No.1, pp.106–122, 2016.
[19] Spezi, Valérie; Fry, Jenny; Creaser, Claire; Probets, Steve; White, Sonya: “Researchers’ Green Open Access Practice: A Cross-Disciplinary Analysis”, Journal of Documentation, Vol.69, No.3, pp.334–359, 2013.
[20] Morris, Sally: “Journal Authors’ Right s: Perception and Reality”, PRC Summary Paper 5, 2009, https://web.archive.org/web/2 0110413142355/http://www.publishingresearc h.net/documents/JournalAuthorsRights.pdf [21] 国立大学図書館協会:“電子図書館機能 の高次化に向けて:3 —学術情報デジタル 化時代の大学図書館—”,2007. [22] JPCOAR:「oaw2019 機関リポジトリ担 当者インタビュー」,https://jpcoar.repo.nii.a c.jp/index.php?page_id=131
[23] Breiman, Leo: “Random Forests”, Machine Learning, Vol.45, pp.5–23, 2001. [24] Friedman, Jerome: “Greedy Function
Approximation: A Gradient Boosting Machine”, The Annals of Statistics, Vol.29, No.5, pp.1189–1232, 2001. [25] 国立情報学研究所:「メタデータ・フ ォーマットjunii2」,https://www.nii.ac.jp/irp /archive/system/junii2.html [26] JPCOAR:「参加機関」,https://jpcoar.r epo.nii.ac.jp/?page_id=40
[27] Chawla, Nitesh; Bowyer, Kevin; Hall, Lawrence; Kegelmeyer, Philip: “SMOTE: Synthetic Minority Over-sampling Technique”, Journal of Artificial Intelligence Research, Vol.16, pp.321–357, 2002. [28] 国立大学図書館協会:“電子図書館機能 の高次化に向けて —学術情報デジタル化 時代の大学図書館の新たな役割—”,33p., 2005. (2020年 6月30日 受付) (2021年 1月 8日 採択)