• 検索結果がありません。

Wikipedia上の学術文献の参照記述の追加に関する時系列分析

N/A
N/A
Protected

Academic year: 2021

シェア "Wikipedia上の学術文献の参照記述の追加に関する時系列分析"

Copied!
17
0
0

読み込み中.... (全文を見る)

全文

(1)

研究論文

Wikipedia

上の学術文献の参照記述の追加に関する時系列分析

Time-series Analyses of the Editors and Their Edits for Adding

Bibliographic References on Wikipedia

吉川 次郎

1

,高久 雅生

2

,芳鐘 冬樹

2

Jiro KIKKAWA

1

, Masao TAKAKU

2

, Fuyuki YOSHIKANE

2

1 筑波大学大学院 図書館情報メディア研究科

Graduate School of Library, Information and Media Studies, University of Tsukuba

〒 305-8550 城県つくば市春日 1-2

E-mail: [email protected]

2 筑波大学 図書館情報メディア系

Faculty of Library, Information and Media Science, University of Tsukuba

〒 305-8550 城県つくば市春日 1-2

E-mail: [email protected], [email protected]

連絡先著者 Corresponding Author Wikipedia 上の学術文献の参照記述の追加における持続可能性を明らかにするために時系列分析を行っ た.英語版全体での編集と参照記述の追加を比較した結果,両者は推移の特徴が異なり,参照記述の追加に は伸び悩みが見られず近年においても一定の規模である.参照記述を追加する編集者は,2011 年以降は毎 年 4 月と 11 月に多い点で周期的な特徴がある.参照記述を初めて追加した編集者 (新規参加者) の過半数 は,多くの年で 1ヶ月のみ関与し,近年になるにつれてその傾向が強まっているが,近年でも一定の規模を 維持している.周期的な特徴や新規参加者の規模の維持については,大学の授業を通じた Wiki Education 参加者による影響が挙げられ,今後もこの活動が継続するとすれば,持続可能性は高いと考えられる.

We conducted a time-series analysis to clarify the sustainability for adding scholarly bibliographic references to English Wikipedia (enwiki). The results are summarized as follows: The characteristics of the trends between the edits in enwiki as a whole and the adding the references are different in the point that the latter keeps a certain scale at recent years. The number of editors adding the references has seasonal growth trends in April and November every year since 2011. The majority of new editors for adding the references contribute for single month only, but the scale of the editors remains flat in recent years. These characteristics in the editors adding the references seem to be affected by the participants of Wiki Education, so adding the references would be sustainable as long as these activities continue. キーワード: Wikipedia,学術情報流通,時系列分析

Keywords: Wikipedia, Scholarly Communication, Time-series Analysis

1.

はじめに

学術情報流通の電子化を背景に,ウェブ上で学 術文献が大規模に参照され,流通している.ウェブ を通じた学術情報基盤が整備され,普及すること により,従来の利用者である研究者や専門家など に限らず,様々な人々やコミュニティによる学術文 献の利活用が生じると考えられる.たとえば,DOI (Digital Object Identifier,デジタルオブジェクト識 別子) の世界最大規模の登録機関である Crossref の 2015 年時点での報告 [1] によると,Web of Science や Scopus などの学術文献データベースに次いで 5 番目にアクセスの多い参照元は Wikipedia であり, 1 日に 2.5 万から 3 万件のアクセスがある. Wikipedia は誰でも編集できるフリーのオンライ ン百科事典であり,学術的な内容を含む様々なペー ジが存在する.最大規模の言語版である英語版には 2018 年 12 月時点で約 570 万件のページが存在し, 1ヶ月あたり約 74 億件のアクセスがある [2].また,

(2)

Alexa Internet によると世界で 5 番目にアクセスの 多いウェブサイトである [3].しかし,不特定多数 の協働を通じて編纂される百科事典という性質上, その内容がどれくらい正確で信頼できるかに関して は設立初期から多くの批判や議論が存在する [4, 5]. さらに,コンテンツの継続的な発展には編集者の 貢献が不可欠であるが,編集者や編集回数の規模は 2007 年にピークに達した後は伸び悩んでいる点や, 新規参加者が定着しないことによるコミュニティの 高齢化が指摘されている [6–8].これらの詳細は 2.2 節で示すが,ページの新規作成や加筆修正の停滞に 繋がる点で持続可能性に関する深刻な問題である. より良質な百科事典を目指すために,Wikipedia では内容に関する三大方針として,「検証可能性」, 「中立的な観点」,「独自研究は載せない」がある. 学術文献が出典や情報源として示されるのは,これ らの方針と相性が良く,コンテンツの質を間接的に 担保・向上しうるためである.実際に,最初期の研 究 [9] はコンテンツの質に関する問題意識から行わ れた.その後,参照記述の件数が増加すると,計量 書誌学分野を中心に研究が行われている [5]. しかし,先行研究は参照されている学術文献自体 に着目しており,編集や編集者の分析は かである. その要因として,参照記述に不完全な要素や誤りが 含まれる [10] ため,任意のページに新規追加された 時点 (以下,「初出時点」) の特定が難しいことが挙 げられる.このことから,参照記述がコンテンツの 質を間接的に担保・向上しうる点を踏まえると継続 的な追加が行われることが望ましいが,実態は明ら かにされておらず,(1) 追加件数や編集者数の推移, (2) 新規参加と継続の状況は不明である.(1) に関 しては,Wikipedia 全体と同様の伸び悩みが見られ る場合,追加の停滞が危惧される.(2) に関しても, 新規参加者の減少,過去に追加した者が関与しなく なっている,長期的に追加する者が かであるなど の状況が見られる場合,同様の問題が危惧される. 以上の背景のもと,これまでに筆者らは任意の観 察時点において残存する参照記述の初出時点を特 定する手法を提案した [11].また,2017 年 3 月 1 日時点の英語版における 93 万件の参照記述を DOI リンクを用いて取得したうえで,同手法の適用によ りデータセット (以下,「参照記述の初出時点デー タセット」) を構築した.さらに,同データセット での初出時点の特定精度が 93.3%であることを示し た [11].したがって,分析対象の特定に関する問題 は概ね解消し,参照記述の追加を対象とした分析を 実現できる. 本研究の目的は,筆者らの参照記述の初出時点 データセットを用いた時系列分析を通じて参照記述 の追加における持続可能性を明らかにすることで ある.具体的には,次の Research Question (以下, 「RQ」) を設定する. 1. 時系列推移とその特徴 RQ1 参照記述の追加件数,編集者の異なり数は, どのように推移しているのか? RQ2 参照記述の追加における編集者数の推移に は,Wikipedia 全体と同様の伸び悩みが見 られるのか? もし,見られない場合,どの ような要因が考えられるか? 2. 新規参加状況および関与月数とその特徴 RQ3 参照記述の追加における新規参加者数は,ど のように推移しているのか? また,Wikipedia 全体と比較した場合,特徴は異なるのか? RQ4 長期的に参照記述の追加を行う者が多いの か? それとも,短期的に行う者が多いのか? また,Wikipedia 全体の編集と比較した場 合,特徴は異なるのか? RQ5 新規参加者の関与月数は,新規参加の時期に より異なるのか? また,参照記述の追加と Wikipedia 全体の編集で特徴は異なるのか? なお,RQ1 の編集者の異なり数は同一編集者の 重複を除外したうえでの人数を指す.また,RQ2 の 編集者数,RQ3 の新規参加者数に関しても,それ ぞれの条件に該当する編集者の異なり数を指す.

2.

関連研究

2.1

学術文献の参照記述の分析

Wikipedia 上の学術文献の参照記述は様々な観点 から分析されており,インパクトファクターと参照 状況の関係 [9, 12],オープンアクセスと参照状況の 関係 [10, 12, 13],研究評価への応用 [14, 15],参照 記述を含むページの特徴 [10, 15],特定の識別子の 参照状況 [16, 17],特定の分野での参照状況 [10, 18] などがある.これらの研究の詳細は筆者ら [19] の 内容と重複するため,本論文では省略する.

情報知識学会誌 2021 Vol. 31, No. 1

(3)

Figure 2. The English Wikipedia’s editor decline.

The number of active, registered editors (≥5 edits per month) is plotted over time.

Figure 3. Reverts of desirable newcomer contributions over time.

The proportion of good (“good faith” and “golden” combined) newcomers with at least one reverted first-session edit is plotted over time.

time between the first semester of 2006 and the first semester of 2007 (during transi-tion from growth to decline). We observed a shift of 6.1% to 18.2% desirable newcom-ers who experienced rejection in the form of a revert.

Figure 4 shows that the increasing rate of reverted desirable newcomers corre-sponds closely with a decline in the survival rate for desirable newcomers. Again, we found the most substantial shift to occur during the time span that Wikipedia’s editing community transitioned from growth to decline. In the first semester of 2006, 25.6% 図 1: Halfaker ら [7] による英語版のログイン編集者数 (編集回数/月≧ 5) の時系列推移 先行研究の大部分は,ある観察時点での参照記述 を取得するものであり,それぞれの初出時点を特定 するものではない.その理由として,Pooladian & Borrego [10] が指摘するように,論文タイトルと出 版者ウェブサイトのフルテキストへのリンクしか記 述されていない,雑誌名が書かれていない,雑誌名 は書かれているものの略称表記のみである,DOI リ ンクが書かれていないなど,参照記述には不完全な 要素や誤りが含まれることが挙げられる. 初出時点の特定方法として,(1) 識別子,(2) 識別 子または文献タイトルが初めて追加された版を検出 する方法が提案されている.(1) には Halfaker [20] と吉川ら [19],(2) には吉川ら [11] が該当する. まず,Halfaker は全編集履歴を含むデータセット を用いて,各ページの過去のすべての版における本 文記述から DOI,PubMed,ISBN,arXiv,ISSN を 抽出するツールである mwcites [20] を開発し,英語 版とオランダ語版での各識別子の参照状況を調査し た [17].ただし,同ツールの特定精度は不明である. 次に,吉川ら [19] は,研究分野が特定可能な学術 文献の参照記述として,ある観察時点における DOI リンクを取得し,過去のすべての版の外部リンクか ら当該 DOI リンクを検出することで初出時点を特 定する手法を提案した.同手法を 2017 年 3 月 1 日 時点の英語版に適用して約 93 万件の DOI リンクの 初出時点を特定したデータセット (以下,「DOI リン クの初出時点データセット」) を構築し,各分野か らサンプルを無作為抽出したうえで直前の版との比 較を行った.結果,既存の参照記述に後から DOI リ ンクを付加する編集が大規模かつ機械的に行われて おり,DOI リンクと参照記述自体の初出時点が同一 である割合は,高い分野でも約 4 割から 7 割弱,低 い分野では 1 割弱から約 3 割と推計され,参照記述 の初出時点を高い精度で特定可能な手法ではない. 最後に,吉川ら [11] は,識別子と文献タイトル を手がかりとする方法論を提案した.具体的には, 次の 3 つの手順から構成される.(a) 参照記述の参 照先を判定し,ページ情報,文献タイトル,識別子 の取得を行う.(b) 対象ページの全編集履歴および ページ本文に対して識別子または文献タイトルを用 いた 3 つの手法を適用し,複数の初出時点候補を取 得する.(c) 初出時点候補から編集日時が最古のも のを選択することにより,参照記述の初出時点デー タセットを構築する.DOI リンクの初出時点データ セットを基に評価実験を行った結果,精度は全体で 93.3%,22 分野中 20 分野で 90%以上であり,研究 分野を問わず概ね高い精度で参照記述の初出時点を 特定できる. 以上に示したとおり,参照記述の初出時点の特定 に関する問題は概ね解消済みである.ただし,実際 の編集や編集者の分析には至っていないことから, 本研究では吉川ら [11] の構築した参照記述の初出 時点データセットを用いた分析を行う.

2.2

Wikipedia の持続可能性

Wikipedia は不特定多数の協働を通じて編纂され る百科事典であることから,コンテンツの継続的な 発展には編集者の貢献が不可欠である.そのため, Wikipedia の持続可能性に関する研究や調査として, 編集や編集者の動向分析,編集者を対象とした質問 紙調査などが行われている. Halfaker ら [7] は英語版の編集者数の推移を調査 し,1ヶ月間の編集回数が 5 回以上の編集者の規模は 2007 年 3 月にピークに達した後は減少または横ば い傾向であることを示した.さらに,2004 年以前を 「Early」,2004 年から 2007 年 3 月までを「Growth」, 2007 年 4 月以降を「Decline」に分類した (図 1).そ

(4)

のうえで,2007 年 4 月以降の伸び悩みの原因とし て,荒らし行為を検出して自動的に差し戻す Bot や ツールの導入による影響を挙げている.また,これ らの仕組みによって新規参加者の編集が差し戻され る割合が高まっている点や,新規参加者の定着率が 低下している点を示している.なお,荒らしや悪質 な編集に対処するための機械的な仕組みの導入背景 には,2005 年に,あるジャーナリストがジョン・F・ ケネディやロバート・ケネディの暗殺に関与したと いうデマが書き込まれた事件 [21, 22] がある.この 事件による検閲体制への批判を受け,Wikipedia の 共同創始者であるジミー・ウェールズは 2006 年に 量から質への転換を目指すと述べており [23],その 実現のために導入された仕組みと言える. Suh ら [8] は英語版の編集回数および編集者数の 推移を分析し,成長が鈍化していると指摘した.具 体的には,1ヶ月あたりの編集回数の規模は 2007 年 初旬にピークを迎え,それ以降は停滞している.ま た,月に 1 回以上の編集を行う者の人数に関しても 同様の推移である.さらに,1ヶ月あたりの編集回数 ごとに編集者を複数のグループに分けたうえで,編 集の差し戻しに関する推移を調査した結果,いずれ のグループも編集が差し戻される割合が年々高まっ ていることを示している.加えて,編集回数が少な いグループでは編集が差し戻される割合が高く,編 集回数が多いグループではその割合が低いことを明 らかにした. 編集の差し戻しによる編集行動への影響について, Halfaker ら [6] は,他者によって自身の編集が差し 戻された場合,編集のモチベーションが著しく失わ れる一方で,良質な編集を行わせる効果があること を示している.ただし,経験豊富な編集者によって 自身の編集が差し戻されることが新規参加者にはダ メージとなるため,新規参加者が定着しにくい問題 に繋がる要素であることを指摘している.

Wikimedia 財団は Editor Trends Study [24] を 2010 年に実施し,次のことを明らかにした.(1) 編 集経験が 1 年未満の者が占める割合は 2006 年以降 に急激に低下しており,コミュニティの高齢化が進 んでいる.(2) 新規参加者の定着率は 2005 年半ばか ら 2007 年初旬に著しく低下して以降,低調である. (3) 3 年以上に渡り編集を行う者の定着率は高い.

Wikimedia 財団は,Wikipedia Editor Study [25, 26] として大規模な質問紙調査を 2011 年に実施し た.主な結果として,まず,編集活動をはじめた理 由では,知識の共有,間違いの修正,十分にカバー されていない主題への貢献などの回答が多い.次に, 編集活動を継続する理由として,知識の共有,誰も が自由に利用可能な情報の提供,詳しく知っている 主題への貢献,編集活動自体が楽しいなどの回答が 多い.他方で,編集活動をやめる理由として,時間 がない,他の活動に時間を使いたい,編集者と揉め た,Wikipedia のルールやガイドラインが複雑すぎ る,自身の専門性の不足などがある.なお,5,073 名の回答者のうち,博士号取得者は 8%,修士号取 得者は 18%,学士・準学士取得者は 35%,中等教育 経験ありは 30%,初等教育経験ありは 9%である. 以上に示したとおり,英語版全体での編集者数や 編集回数の推移には伸び悩みが見られる.また,新 規参加者が定着しにくく,コミュニティが高齢化し ている.ただし,参照記述の追加においても同様の 傾向が見られるか否かは不明であるため,本研究で は時系列分析を行うことでその実態を明らかにする.

2.3

専門家の参加,高等教育との関わり

Wikipedia に学術文献の参照記述を追加するには, ある研究分野に関する一定の専門的な知識が必要と 考えられる.たとえば,医師による医学分野の参照 記述の追加や,大学で特定分野の専門知識を身に着 けた学生による当該分野の参照記述の追加が挙げら れる.このことから,本節では専門家の参加や高等 教育との関わりについて述べる.より具体的には, (1) 特定分野の専門家などによる編集状況の調査, (2) 専門家による参加の障壁となる要素,(3) 大学 の授業などを通じた編集の実践について紹介する.

Heilman & West [27] は,医学・医療分野の専門 家を含むメンバーで構成され,同分野のページの調 査や編集を行なうコミュニティである WikiProject Medicine [28] に紐付けられた医学分野のページの 編集動向を調査した.結果,編集者の規模は,編集 回数が年に 1 回以上,250 回以上の者ともに 2008 年から 2013 年までに年々減少し,英語版では 5 年 間で 40%減である.また,半数以上は医療専門家ま たは同分野の学生であり,それ以外は,ページ内の 文法や書式の修正を行う者,同分野の専門家ではな い者,他分野 (生化学) の博士号取得者などである. Taraborelli ら [29] は,専門家の認識や,編集へ の参加の障壁となる要素を明らかにするために,博 士後期課程学生,ポスドク,研究者などを対象に質

情報知識学会誌 2021 Vol. 31, No. 1

(5)

問紙調査を行なった.結果,自身の専門分野に関す る Wikipedia のページが「研究用途として信頼でき る情報源か」の設問では,いずれの属性でも否定の 回答が多い一方,「教育用途として信頼できる情報源 か」の設問では肯定の回答が多い点に加え,労力や 時間の消費が参加の障壁となる点を明らかにした. 高等教育機関との連携による大規模な編集活動と して,Wiki Education 財団 [30] の学生プログラム では 2010 年以降,3,600 の授業を通じて 7 万人以上 の学生が 9 万件のページを編集している [31].同プ ログラムはアメリカとカナダの 500 以上の大学での 授業を支援しており,受講学生は編集方法や出典の 示し方などの基礎を学ぶとともに,担当を割り与え られたページを編集することで Wikipedia への理解 や執筆スキル,批判的思考,情報リテラシなどの向 上を図る.さらに,それぞれの専門知識をページの 内容に反映させ,コンテンツの質の向上を促進する 狙いがある.このプログラムの参加者への調査は複 数行われており [32–34],編集の過程で主題に関す る知識が増加する,Wikipedia の信頼性に対する認 識が向上する,従来のレポート課題と比較して一般 の人々に向けたライティングスキルの向上に資する などの効果があることが報告されている.ただし, 授業期間以降に編集を継続する予定や意欲はないと する回答が多いこと [33] も明らかになっている. その他,日本国内では,大学の授業を通じた編 集 [35–39],専門知識の発信による社会貢献を目的 とした学協会による編集の試み [40] があるものの, いずれも個別の事例報告に留まっている.また,Wiki Education のような組織的な基盤は存在せず,長期 間に渡って継続されている活動は見当たらない. 以上に示したように,特定分野の専門家や大学生 が Wikipedia の編集に参加しており,特に大規模な 活動としては Wiki Education がある.これらの要 素が参照記述の追加における持続可能性に影響を与 えている可能性が考えられることから,本研究では Wiki Education の影響についても扱う.

3.

対象・方法

3.1

分析対象

分析対象は,(1) 参照記述を追加する編集および その編集者,(2) 英語版全体における編集およびそ の編集者である.以下,これらの分析を行うための データセットの構築について述べる. 3.1.1 データセットの構築 まず,(1) 参照記述を追加する編集およびその編集 者は筆者ら [11] の参照記述の初出時点データセット を用いて取得し,本研究の分析対象とする.同デー タセットは,2017 年 3 月 1 日時点での英語版で百科 事典記事を意味する標準名前空間における 180,795 件のページ上の 923,894 件の参照記述の初出時点を 93.3%の精度で特定したものである.なお,本研究 では 1ヶ月単位での分析を行うが,2017 年 3 月は データが 1 日分のみであるため除外した.したがっ て,2017 年 2 月までの 923,765 件の編集およびそ の編集者が対象である. 次に,(2) 英語版全体における編集 (参照記述の 追加も含む) およびその編集者は,Wikipedia のダ ンプデータ [41] のうち,英語版のすべての編集履歴 を格納した XML 形式データ群を用いて取得した. 具体的には,標準名前空間のページにおけるデータ として,編集日時,編集者,ページの情報を抽出し た.そのうえで,(1) と条件を えるために,2017 年 2 月までに行われた 503,861,317 件の編集および その編集者を取得した. 3.1.2 編集者の種別の判定 参照記述を追加する編集者,英語版全体の編集 者に対して,編集者の種別を判定する.具体的には, ログイン編集者のうち人間を「User」,人間以外を 「Bot」,非ログイン編集者を「IP」としたうえで判 定を行う. 筆者ら [19] の手法を参照し,本研究では以下の いずれかの条件に該当する者を Bot と判定する. 条件A Botのグループに属する編集者である 条件B All Wikipedia bots [42]のカテゴリに属する

編集者である 条件C 編集者名に「Bot」を含み,かつ,利用者ページ にBotである旨の記述がある 条件D 大規模な編集を行っており,かつ,利用者ページ にBotである旨の記述がある 条件 A は,「API:Users [43]」を用いて確認する. 条件 C は,大文字・小文字を区別せず,編集者名

(6)

表 1: 編集者の種別ごとの基礎データ 参照記述の追加 英語版全体 編集者 編集者の 参照記述の 割合 編集者の 編集回数の 割合 の種別 異なり数 延べ数 (%) 異なり数 延べ数 (%) User 74,446 738,369 79.9 6,432,691 311,863,204 61.9 Bot 63 108,370 11.7 961 48,225,363 9.6 IP 37,742 77,026 8.3 37,795,840 143,772,750 28.5 合計 - 923,765 100.0 - 503,861,317 100.0 に「Bot」の文字列を含むすべての者を対象に利用 者ページの記述を確認する.条件 D は,標準名前 空間のページにおける 2017 年 2 月までのアクティ ビティに基づき,(1) に関しては追加件数が 500 以 上,(2) に関しては編集回数が 10,000 以上の者を個 別に確認する.条件 C,D での利用者ページの確認 は,筆頭著者が目視により行う. 編集者の種別ごとの基礎データを表 1に示す.参 照記述に関しては,74,446 名の User によって全体 の約 8 割に相当する 738,369 件が追加されている. 英語版全体では,6,432,691 名の User によって全体 の約 6 割に相当する 311,863,204 回の編集が行われ ている.Bot が占める割合は,参照記述の追加,英 語版全体での編集ともに 1 割程度である.IP が占 める割合は,参照記述の追加では 1 割弱,英語版全 体での編集では 3 割弱である. 本研究の分析では,人間の編集による参照記述の 追加を捉える狙いから,Bot は対象から除外する. ただし,人間の編集者のうち,IP に関しては同一 人物の識別が困難であるため対象から除外する.し たがって,本研究では User を対象とした分析結果 を示す.また,条件を えるために,英語版全体の 編集に関しても User のみを分析対象とする. 3.1.3 Wiki Education 参加者の特定 大学の授業を通じて参照記述を追加する編集者を 分析するために,Wiki Education による大学での 授業を通じた編集者 (以下,「Wiki Education 参加 者」) を特定する.具体的には,受講学生,教員,メ ンター,レビュワーが該当する.2020 年 3 月時点 で,以下のいずれかの条件を満たす者を特定した. 条件1 Wiki Education Dashboard Campaigns [44]

記載されている

条件2 United States and Canada Wikipedia

Educa-tion Program [45]からリンクされている授業の ページに記載されている

条件3 Wiki EducationのStudent Training Modules [46]

を完了した編集者である

条件 1 に加えて条件 2,3 を設定した理由は,Wiki Education Dashboard Campaigns には 2014 年以降 の情報が記載されており,それ以前に開催された授 業に関する追加取得が必要なためである. 条件 2 では,アメリカおよびカナダの大学で開催 された 2010 年秋から 2014 年春までの授業の関係者 を特定した.条件 3 では,Wikipedia の基本的な方 針や各種機能の使い方などに関するトレーニングを 完了した受講生として,Training feedback [47] お よびそのアーカイブページに記載されている編集者 を取得した.なお,2012 年の第 3 四半期以降の編 集者が記録されている. 以上の条件に基づき,86,037 名の Wiki Education 参加者を特定した.そのうち,2017 年 2 月までに 参照記述を追加した者は 4,874 名 (5.7%) である.

3.2

分析方法

3.2.1 時系列推移とその特徴 まず,(1) 参照記述を追加する編集およびその編 集者,(2) 英語版全体における編集およびその編集 者に関して,1ヶ月ごとの追加件数/編集回数,編集 者数を集計し,時系列推移を可視化する.これによ り,(1) と (2) を比較し,分布がどのように異なるか を観察する.その際,特に,Halfaker ら [7] による 英語版全体の推移 (図 1) における Early,Growth, Decline と同様の時期区分が当てはまるか否かに着 目する.ただし,年間の推移に顕著な起伏が見られ るなど,1ヶ月ごとの分析結果による解釈が難しい

情報知識学会誌 2021 Vol. 31, No. 1

(7)

場合は,1 年ごとの集計を追加で行い,その結果に 基づく解釈を示す. 次に,(1) に関しては,1ヶ月ごとの追加件数によ る条件別の時系列推移を可視化する.具体的には, 1ヶ月ごとの追加件数が 1 件,2 件から 4 件,5 件以 上の 3 つの条件を設定する.(2) に関しても,英語 版全体での編集回数が 1 回,2 回から 4 回,5 回以上 の条件を設定する.そのうえで,参照記述の追加と 英語版全体での編集について条件間での比較を行う. また,参照記述の追加に関しては Wiki Education 参加者の人数の推移との比較を併せて行う. 以上により,参照記述の追加と英語版全体での編 集の推移を明らかにするとともに,参照記述の追加 における Wiki Education 参加者の動向を観察する. 3.2.2 新規参加状況および関与月数とその特徴 まず,参照記述の追加,英語版全体での編集にお ける新たな編集者 (以下,「新規参加者」) の参加状 況を観察する.具体的には,参照記述の追加に関し ては,それぞれの編集者が初めての追加を行った時 点を取得し,その年の新規参加者とする.そのうえ で,1 年ごとの新規参加者の異なり数およびその割 合の推移を分析する.また,英語版全体での編集に 関しても,それぞれの編集者が初めての編集を行っ た時点に基づき,同様の分析を行う. 次に,編集者がどれだけの期間に渡って関与して いるかを分析するために,それぞれの編集者が何年 何月に関わったかに基づく関与月数を取得する.た とえば,ある編集者が 2010 年の 1 月,2 月,3 月に 参照記述の追加を行った場合,その編集者の参照記 述の追加における関与月数は 3 である.同様に,英 語版において,ある編集者が 2010 年の 1 月,3 月 に編集を行った場合,その編集者の英語版全体での 編集における関与月数は 2 である.この値が大きい ほど長期的,小さいほど短期的に関与する者と言え る.そのうえで,参照記述の追加,英語版全体での 編集のそれぞれについて関与月数ごとの編集者の集 計を行い,集計結果の比較により両者の特徴を示す. なお,大学での授業・講義の影響を捉えるために, 参照記述の追加に関しては Wiki Education 参加者 のみに限定した状態での集計を併せて行う. 最後に,初めての追加または編集の時点に基づく 関与月数の分布として,次の 2 種類の方法での集計 を行う.すなわち,まず,参照記述を追加する各編 集者に対して,(1) 初めての追加から 2017 年 2 月 まで (全期間) の関与月数,(2) 初めての追加から 12ヶ月間 (1 年間) での関与月数を取得する.その うえで,(1),(2) について新規参加の時点ごとの関 与月数の集計を行い,分布を観察する.英語版全体 での各編集者に対しても同様に,(1) 初めての編集 から 2017 年 2 月まで (全期間) の関与月数,(2) 初 めての編集から 12ヶ月間 (1 年間) での関与月数を 取得のうえ,同様の分析を行い,分布を観察する. (1) に加えて (2) の集計を行う理由は,前者では初 めての追加/編集の時点から 2017 年 2 月までの月 数の差異を考慮しないため,結果の比較や解釈が難 しいことによる.たとえば,初めての追加/編集が 2010 年 3 月の場合は 84ヶ月,2016 年 3 月の場合は 12ヶ月であるため,両者において関与月数ごとの分 布が異なる場合に,その要因が 2017 年 2 月までの 月数の違いによるものか,それとも編集者の振る舞 いの違いによるものかの解釈が難しい.そのため, 後者の集計では初めての追加/編集の時点から 12ヶ 月間に固定した状態での集計を行う.なお,初めて の追加/編集の時点が 2016 年 4 月以降の場合は月数 が 12 未満であるため,これに該当する編集者につ いては後者の分析対象からは除外する.

4.

分析結果

4.1

時系列推移とその特徴

まず,参照記述の追加と英語版全体の編集におけ る 1ヶ月ごとの推移を図 2に示す.図の上段は参照記 述の追加,下段は英語版全体の編集であり,Halfaker ら [7] の時期区分とともに示している.先行研究 [7,8] と同様に,英語版全体では編集回数,編集者の異な り数ともに 2007 年 3 月に最大値を取り (図 2の○),1 翌月以降は減少または横ばいである. 図 2より,第一に,参照記述の追加件数と編集者 の異なり数は,Early では低い値で推移し,Growth では大きく伸びており,これらは英語版全体と同様 の推移と言える.なお,初めて追加件数が 1,000 件 を上回る時点は 2005 年 12 月である (1,221 件). 第二に,2007 年 4 月以降に関しては,英語版全 体は減少または横ばいであるが,参照記述の追加で は異なる特徴が見られる.具体的には,編集者の異 なり数は 2010 年までは概ね横ばいである.さらに, その後,2011 年以降は年間の推移に顕著な起伏が見

(8)

2020/4/10 trend_general.html file:///Users/corgies/Dropbox/github/paper_3rd/figs/html/ _v2/trend_general.html 1/1 2020/4/10 trend_general.html file:///Users/corgies/Dropbox/github/paper_3rd/figs/html/ _v2/trend_general.html 1/1 参照記述の追加件数 編集回数 編集者の異なり数 編集者の異なり数 16,000 12,000 8,000 4,000 0 2,000 1,500 1,000 500 0 追加件数 編集者の異なり数 ② ④ 3,200,000 2,400,000 1,600,000 800,000 0 200,000 150,000 100,000 50,000 0 編集回数 編集者の異なり数

Early GrowthDecline

③ 図 2: 参照記述の追加と英語版全体の編集における 1ヶ月ごとの推移 られる (図 2の○).また,2015 年 4 月に最大値を取4 る (図 2の○,1,829 名).追加件数は,2009 年 7 月3 と 2007 年 11 月 (図 2の○,12,701 件と 10,425 件)2 に高い値を取るものの,編集者の異なり数と同様に 2010 年までは概ね横ばいである.その後,2011 年 以降は年間の推移に起伏が見られる.2007 年以降 の動向を捉えるために,2007 年から 2016 年までの 年単位での集計結果を表 2に示す. 年単位で見ると,英語版全体では編集者の異なり 数,編集回数ともに減少または横ばいであるのに対 し,参照記述の追加に関しては編集者の異なり数, 表 2: 参照記述の追加と英語版全体の編集における 1 年ごとの推移 (2007 年から 2016 年のみ) 対象 参照記述の追加 英語版全体の編集 編集者の 編集者の 異なり数 追加件数 異なり数 編集回数 2007 6,631 58,868 947,673 31,204,706 2008 7,133 57,983 899,381 29,896,319 2009 7,781 68,269 869,853 28,567,649 2010 7,782 63,954 810,673 27,124,003 2011 9,877 65,963 814,360 25,368,343 2012 10,114 72,358 719,090 24,979,607 2013 10,463 75,352 719,409 24,109,119 2014 9,953 64,912 778,539 23,340,556 2015 10,688 80,250 749,874 25,411,422 2016 10,612 82,055 708,477 26,431,905 ※下線は前年よりも値が低いことを示す. 追加件数ともに 2012 年まで概ね漸増した後,規模 を維持している. 次に,1ヶ月間の追加件数/編集回数による条件別 の推移を図 3に示す.図の上段は参照記述の追加,下 段は英語版全体の編集であり, 3.2.1 項で述べた条 件別での結果である.また,上段は Wiki Education 参加者の推移を併せて示している. 図 3より,英語版全体の編集者数は,いずれの条 件でも 2007 年 3 月に最大値を取り (図 3の○),翌5 月以降は減少または横ばいである.他方で,参照記 述の追加における編集者数は,いずれの条件も 2011 年以降に最大値を取る (図 3の○) ことに加え,図 26 の○と同様に年間での推移に顕著な起伏が見られる.4 最後に,2011 年 1 月以降における条件別の編集 者数の推移を図 4に示す.図中の縦線は,各年の 4 月 (破線) と 11 月 (実線) である. 図 4より,2011 年以降は毎年 4 月と 11 月に編集 者が多くなる傾向が読み取れる.ただし,条件ごと に最大値を取る時点は異なり,追加件数/月が 1 で は 2015 年 4 月,2 から 4 では 2016 年 11 月,5 以上 では 2013 年 11 月 (それぞれ,図 4の○,8 ○,9 ○)7 である.また,Wiki Education 参加者に関しては, 2012 年までは少数であり,2013 年から変動が大き くなると同時に毎年 4 月と 11 月に高い値を取る.最 大値を取る時点は 2016 年 11 月 (図 4の○) である.9 これらの結果から,(1) 編集者が多い時期には周期 性が見られ,いずれの条件でも 4 月または 11 月に 集中している.また,(2) Wiki Education 参加者に

情報知識学会誌 2021 Vol. 31, No. 1

(9)

file:///Users/corgies/Dropbox/github/paper_3rd/figs/html/ _v2/trend_by_groups.html 1/1 2020/4/10 trend_by_groups.html file:///Users/corgies/Dropbox/github/paper_3rd/figs/html/ _v2/trend_by_groups.html 1/1 編集者の異なり数 編集者の異なり数 1,000 750 500 250 0 60,000 50,000 40,000 30,000 20,000 10,000 0

Early Growth Decline

⑥ ⑤ A B C D A 追加件数/月 = 1 B 2 追加件数/月 4 C 5 追加件数/月 D Wiki Education参加者 E F G E 編集回数/月 = 1 F 2 編集回数/月 4 G 5 編集回数/月 図 3: 追加件数/月または編集回数/月による条件別の編集者数の推移 (全期間) 関しても,2013 年以降は (1) と同様の傾向が見ら れる.なお,(2) の要因として,Wiki Education に よる大学での授業が春や秋に開講される場合が多い ことが挙げられる. 2020/4/15 _user_from_2011.html file:///Users/corgies/Dropbox/github/paper_3rd/figs/code/ /_user_from_2011.html 1/1 編集者の異なり数 A 追加件数/月 = 1 B 2 追加件数/月 4 C 5 追加件数/月 D Wiki Education参加者 ⑨ ⑧ ⑦ A B C D 図 4: 追加件数/月による条件別の編集者数の推移 (2011 年 1 月以降) 表 3: 新規参加年ごとの編集者の集計 対象 参照記述の追加 英語版全体の編集 編集者の 割合 編集者の 割合 異なり数 (%) 異なり数 (%) 2001 134 0.18 3,473 0.05 2002 103 0.14 2,687 0.04 2003 254 0.34 7,561 0.12 2004 604 0.81 34,028 0.53 2005 1,448 1.95 131,084 2.04 2006 3,943 5.30 562,439 8.74 2007 5,270 7.08 749,269 11.65 2008 5,260 7.07 655,975 10.20 2009 5,663 7.61 612,853 9.53 2010 5,441 7.31 551,279 8.57 2011 7,377 9.91 551,954 8.58 2012 7,492 10.06 469,153 7.29 2013 7,660 10.29 472,760 7.35 2014 7,142 9.59 546,794 8.50 2015 7,907 10.62 517,233 8.04 2016 7,762 10.43 476,653 7.41 2017 986 1.32 87,496 1.36 合計 74,446 100.0 6,432,691 100.0 ※網掛けは編集者の異なり数,割合の 3 位までを示す.

(10)

4.2

新規参加者数の推移とその特徴

新規参加者数の推移とその特徴として,新規参加 年ごとの編集者の集計を表 3に示す.ここでは「参 照記述の追加」として,各編集者が初めて参照記述 を追加した時期を年単位で集計した.同様に「英語 版全体の編集」として,各編集者の初めての編集の 時期を年単位で集計した.網掛けは値が高い上位 3 件を指す.なお,2017 年のみ 2ヶ月間の集計である. 表 3より,参照記述の追加では 2015 年,英語版 全体の編集では 2007 年の新規参加者が最も多い. 両者における割合の推移に着目すると,2001 年か ら 2007 年まで単調増加である点や,2005 年から 2007 年までの伸びが比較的大きい点は共通である が,2008 年以降の推移が大きく異なる.具体的に は,英語版全体の編集では 2008 年から 2010 年まで 単調減少し,2011 年以降は減少または横ばいであ る.他方で,参照記述の追加では 2008 年から 2010 年までは 5,000 名規模,2011 年以降は概ね 7,000 名 規模で安定しており,近年においても新規参加者の 規模を拡大または維持している.

4.3

関与月数ごとの編集者の分布

参照記述の追加,英語版全体での編集について, 関与月数ごとの編集者の集計結果を表 4に示す.表 4 の左側は参照記述の追加,右側は英語版全体の編集 を示し,さらに,参照記述の追加では,すべての編 集者と,Wiki Education 参加者のみを対象とした 結果を示す.関与月数は 1,2,3,4 から 6,7 から 12,13 から 48,49 から 84,85 から 144,145 から 187 で区切った.ここでは大まかな目安として,毎 月連続で関与した場合の換算期間として,それぞれ, 1ヶ月,2ヶ月,3ヶ月,4ヶ月から半年,7ヶ月から 1 年,13ヶ月から 4 年,49ヶ月から 7 年,85ヶ月から 12 年,それ以上に渡って関与していることを示す. まず,参照記述の追加における編集者ごとの関与 月数の最大値は 144,Wiki Education 参加者に限 定した場合は 135 である.関与月数が 144 の編集者 は Jfdwolff であり,利用者ページ [48] の記述から, 医師であると同時に,医学・医療分野の専門家を含 むメンバーで構成される WikiProject Medicine の 創始者である.また,Wiki Education 参加者のう ち,上位 2 名はそれぞれ Shyamal,Boghog である (それぞれ,関与月数は 135 と 121).ただし,これ らの編集者は Wiki Education の授業におけるメン ター [49] であり,受講学生ではない.以上から,最 短でも 11 年,12 年以上に渡って参照記述の追加を 行う者が存在する.他方で,英語版全体での最大値 は 187 であり,最短でも 15 年以上に渡って編集を 行っている. 次に,編集者の割合に着目すると,いずれも関与 月数が 1 の者が全体の 4 分の 3 程度を占めることに 加え,関与月数の値が大きくなるほど割合が低くな る.また,参照記述の追加および英語版全体の編集 におけるすべての編集者のうち,関与月数が 3 以下 の者が約 9 割を占めるため,両者に共通の特徴とし て,短期的に関与する者が大部分を占める.なお, 表 4: 関与月数ごとの編集者の集計結果 対象 参照記述の追加における 英語版全体における すべての編集者 Wiki Education 参加者のみ すべての編集者 関与月数 異なり数 割合 (%) 異なり数 割合 (%) 異なり数 割合 (%) 1 56,401 75.76 3,577 73.39 4,734,041 73.59 2 8,781 11.80 858 17.60 740,148 11.51 3 3,128 4.20 274 5.62 279,938 4.35 4-6 3,112 4.18 91 1.87 311,901 4.85 7-12 1,581 2.12 20 0.41 179,115 2.78 13-48 1,267 1.70 43 0.88 155,257 2.41 49-84 136 0.18 8 0.16 21,868 0.34 85-144 40 0.05 3 0.06 9,991 0.16 145-187 - - - - 432 0.01 全体 74,446 100.0 4,874 100.0 6,432,691 100.0

情報知識学会誌 2021 Vol. 31, No. 1

(11)

参照記述の追加における Wiki Education 参加者は, 関与月数が 2 以下の者が 9 割を占めることから,よ り短期的に関与する者の割合が高い.

4.4

新規参加年ごとの関与月数

新規参加年および関与月数ごとの編集者の集計結 果を表 5に示す.表 5では参照記述の追加および英 語版全体の編集について,各編集者の新規参加の時 点を年単位で整理したうえで,編集者の異なり数と 関与月数ごとの内訳を示している.たとえば,参照 記述を追加した者のうち,最初の追加を 2001 年に 行った者は 134 名である.その内訳として,65.7% (88 名) は関与月数が 1,12.7% (17 名) は 2,5.2% (7 名) は 3,9.0% (12 名) は 4 から 6,2.2% (3 名) は 7 から 12,5.2% (7 名) は 13 以上である. 表 5より,まず,参照記述の追加における関与月 数ごとの編集者の割合の推移について述べる.第一 に,関与月数が 1 の編集者は多くの年で過半数を占 める.ただし,2003 年と 2004 年は 50%未満である ため,初期にはやや低い値を取る年がある.また, 2003 年以降は割合が単調増加する点に加え,割合が 最も高いのは後期 (2016 年) である.第二に,関与 月数が複数の編集者に関しては,比較的初期 (2002 年から 2004 年) の割合が最も高い. 次に,英語版全体の編集における関与月数ごとの 編集者の割合の推移について述べる.第一に,関与 月数が 1 の編集者は多くの年で過半数を占める.た だし,2003 年から 2005 年は 50%未満であるため, 初期にはやや低い値を取る年がある.また,2004 年 以降は割合が概ね単調増加する点に加え,割合が最 も高いのは後期 (2016 年) である.第二に,関与月 数が複数の編集者に関しては,比較的初期 (2003 年 から 2006 年) の割合が最も高い. これらの結果から,新規参加の時点および関与月 数ごとの編集者の分布は,参照記述の追加と英語 版全体の編集で共通する点が多く,両者は特徴が似 ていると言える.ただし,この分析では初めての追 加/編集の時点ごとに 2017 年 2 月までの月数が異な るため,以下では初めての追加/編集の時点から一 定期間での集計結果に基づく分析を行う. 初めての追加/編集から 12ヶ月間 (1 年間) におけ 表 5: 新規参加年および関与月数ごとの編集者の集計結果 対象 参照記述の追加 英語版全体の編集 新規 編集者の 関与月数ごとの割合 (%) 編集者の 関与月数ごとの割合 (%) 参加年 異なり数 1 2 3 4-6 7-12 13以上 異なり数 1 2 3 4-6 7-12 13以上 2001 134 65.7 12.7 5.2 9.0 2.2 5.2 3,473 71.5 11.0 4.7 5.3 1.9 5.6 2002 103 52.4 12.6 12.6 11.7 3.9 6.8 2,687 54.7 9.6 3.6 6.2 5.7 20.1 2003 254 46.5 15.4 8.7 13.4 7.5 8.7 7,561 39.6 9.0 5.6 8.5 8.3 29.1 2004 604 48.3 14.7 8.8 10.1 7.0 11.1 34,028 35.4 10.7 5.7 10.2 10.0 28.0 2005 1,448 53.5 11.7 7.0 10.1 7.3 10.5 131,084 43.0 11.9 6.4 10.4 9.5 18.9 2006 3,943 58.4 13.8 7.1 8.8 5.6 6.3 562,439 57.2 13.7 6.4 8.7 6.2 7.7 2007 5,270 65.7 12.4 6.0 7.1 4.3 4.5 749,269 67.6 13.4 5.4 6.3 3.6 3.7 2008 5,260 69.4 12.7 5.2 6.2 3.6 2.9 655,975 72.0 12.4 4.6 5.2 2.9 2.9 2009 5,663 72.7 12.5 4.7 5.6 2.3 2.2 612,853 73.3 12.0 4.5 5.0 2.7 2.5 2010 5,441 73.7 12.0 4.6 5.1 2.5 2.1 551,279 74.7 11.8 4.3 4.6 2.5 2.2 2011 7,377 77.8 12.1 3.7 3.5 1.7 1.2 551,954 75.9 11.6 4.2 4.3 2.2 1.8 2012 7,492 78.2 11.5 4.2 3.5 1.6 1.1 469,153 75.5 11.9 4.3 4.5 2.2 1.6 2013 7,660 78.3 12.6 3.7 3.2 1.4 0.9 472,760 78.6 10.5 3.8 3.8 1.9 1.4 2014 7,142 80.4 11.6 3.6 2.5 1.3 0.5 546,794 81.1 9.8 3.3 3.3 1.6 1.0 2015 7,907 82.9 10.4 3.4 2.2 0.7 0.3 517,233 81.6 9.9 3.3 3.1 1.4 0.7 2016 7,762 86.2 10.6 2.0 1.1 0.2 0.0 476,653 84.7 9.3 3.0 2.3 0.7 0.0 2017 986 96.2 3.8 - - - - 87,496 95.2 4.8 - - - -※下線は関与月数が 1 かつ割合が 50%未満を示す.網掛けは,それぞれの関与月数の割合の 1 位を示す.ただし,2017 年は 2ヶ 月分の集計結果であるため除外している.

(12)

る関与月数ごとの編集者の集計結果を表 6に示す. なお,最初の追加/編集を行った時期が 2016 年 4 月 以降の場合は月数が 12 未満であるため,該当する 編集者として,参照記述の追加では 6,689 名,英語 版全体の編集では 429,564 名を除外した. 表 6より,まず,参照記述の追加における関与月 数ごとの編集者の割合について述べる.第一に,す べての年において関与月数が 1 の者が過半数を占め る.さらに,その割合は 2003 年から 2008 年にかけ て単調増加して 80.5%に達し,その後も 80%以上で ある.また,割合が最も高いのは後期 (2015 年) で ある.第二に,関与月数が複数の群では,比較的初 期 (2002 年,2003 年,2005 年) の割合が最も高い ことに加え,関与月数が 2 の者が占める割合は多く の年で 1 割ほどである.また,関与月数が 3,4 以 上の者が占める割合は後年になるにつれて減少また は横ばいの傾向が見られる. 次に,英語版全体における関与月数ごとの編集者 の割合について述べる.第一に,2004 年を除くと, いずれの年も関与月数が 1 の者が過半数を占める. さらに,その割合は 2004 年から 2010 年にかけて 単調増加して 80.5%に達し,その後も 80%以上で推 移している.また,割合が最も高いのは後期 (2014 年) である.第二に,関与月数が複数の群では,比 較的初期 (2004 年,2006 年) の割合が最も高いこと に加え,関与月数が 2 の者が占める割合は多くの年 で 1 割ほどである.また,関与月数が 3,4 以上の 者が占める割合は後年になるにつれて減少または横 ばいの傾向が見られる. 以上の結果から,新規参加の時点および関与月数 ごとの編集者の分布において,参照記述の追加と英 語版全体の編集における共通点として次の 2 つが 挙げられる.すなわち,(1) ほとんどの年において, 新規参加者の過半数は単一の時点のみ関与し,それ 以外は一切関与せず,その傾向は近年になるにつれ て強まっている.また,単一の時点のみ関与する者 の割合が最も高いのは後期である.他方で,(2) 関 与月数が複数の編集者に関しては,いずれも比較的 初期 (2002 年から 2006 年) における割合が最も高 い.また,関与月数が 3 以上の比較的長期間に渡っ て関与する群の割合は,経年的に減少または横ばい の傾向が見られる. 表 6: 初めての追加/編集から 12ヶ月間における関与月数ごとの編集者の集計結果 対象 参照記述の追加 英語版全体の編集 新規 編集者の 関与月数ごとの割合 (%) 編集者の 関与月数ごとの割合 (%) 参加年 異なり数 1 2 3 4以上 異なり数 1 2 3 4以上 2001 134 73.9 11.9 6.0 8.2 3,473 76.0 11.0 4.9 8.1 2002 103 66.0 14.6 9.7 9.7 2,687 66.7 12.6 4.3 16.4 2003 254 63.0 19.3 8.7 9.1 7,561 54.8 13.0 6.9 25.3 2004 604 66.6 16.2 8.1 9.1 34,028 49.4 14.7 7.9 28.0 2005 1,448 68.5 13.4 7.3 10.8 131,084 54.0 14.7 7.6 23.7 2006 3,943 72.1 14.0 5.5 8.4 562,439 65.2 15.0 6.4 13.4 2007 5,270 77.0 11.8 5.1 6.2 749,269 74.7 13.5 4.7 7.0 2008 5,260 80.5 11.0 3.5 5.1 655,975 78.3 12.1 3.9 5.7 2009 5,663 82.6 10.7 3.2 3.4 612,853 79.4 11.6 3.8 5.2 2010 5,441 82.7 10.4 3.3 3.6 551,279 80.5 11.3 3.6 4.7 2011 7,377 84.2 10.5 2.8 2.5 551,954 81.0 11.1 3.4 4.5 2012 7,492 83.7 10.2 3.3 2.8 469,153 80.0 11.3 3.7 4.9 2013 7,660 83.0 11.3 2.8 3.0 472,760 82.5 10.0 3.2 4.2 2014 7,142 84.0 10.7 3.0 2.4 546,794 83.8 9.4 3.0 3.9 2015 7,907 84.7 10.0 2.8 2.5 517,233 83.2 9.7 3.1 4.0 2016 2,059 80.0 14.5 3.6 1.8 134,585 83.0 9.6 3.3 4.1 ※下線は関与月数が 1 かつ割合が 50%未満を示す.網掛けは,それぞれの関与月数の割合の 1 位を示す.

情報知識学会誌 2021 Vol. 31, No. 1

(13)

5.

考察

5.1

時系列推移とその特徴

RQ1 参照記述の追加件数,編集者の異なり数は,ど のように推移しているのか? RQ2 参照記述の追加における編集者数の推移には, Wikipedia 全体と同様の伸び悩みが見られる のか? もし,見られない場合,どのような要 因が考えられるか? まず,参照記述の追加件数と編集者の異なり数は 同様の推移を示しており,1ヶ月ごとに見ると,2001 年から 2003 年 12 月までは低い値で推移し,2004 年 1 月から 2007 年 3 月にかけて大きく伸びている. その後,2010 年までは横ばいであり,2011 年以降 は年間の推移に起伏が見られる.さらに,2007 年 以降の推移を年単位で見ると,2012 年まで漸増後, 2013 年以降も一定の規模を維持し続けている.この ことから,増加傾向が続いた後,一定の規模を維持 し続けており,衰退には転じていないと考えられる. 次に,英語版全体での編集者の異なり数は 2007 年 3 月にピークに達し,それ以降は減少または横ば いであるため伸び悩みが見られる.他方で,参照記 述の追加における編集者の異なり数は前述の推移に 加え,2015 年 4 月に最大値を取る.また,1ヶ月間 の追加件数によるいずれの条件においても 2011 年 以降は毎年 4 月と 11 月に値が高くなる点に加え, 2011 年以降に最大値を取る.これらの点から,英 語版全体と同様の伸び悩みは見られない. 最後に,英語版全体と同様の伸び悩みが見られな い点の要因として,(1) 2007 年 4 月以降も編集者 の規模を維持していること,(2) 特に,2011 年以降 は毎年 4 月と 11 月に多くの編集者が参加している ことが挙げられる.(1) に関しては,次節で述べる ように,近年においても新規編集者の規模を維持し ていることによる影響と考えられる.(2) に関して は,図 4より,Wiki Education 参加者の 2013 年以 降の推移にも同様の傾向が見られることから,大学 での授業を通じて参加する編集者が周期的かつ継続 的に生じた結果として解釈できる.ただし,実際に は 2011 年と 2012 年に関しても Wiki Education 参 加者による影響であると考えられる. その理由として,Wiki Education は 2010 年に設 立され,当時から活動していたことが挙げられる.こ の点に関しては,設立初期の活動に関する網羅的な データが公開されておらず,Wiki Education 参加者 の特定に漏れがあると考えられる.したがって,2011 年と 2012 年には,さらに多くの Wiki Education 参 加者が関わっていることが考えられる.また,追加 件数/月が 1 の条件で最大値 (918 名) を取る 2015 年 4 月における編集者を調査した結果,編集者名 の末尾にカリフォルニア大学デービス校の略称であ る「ucdavis」や「ucd」を含む者が 34 名おり,これ らは Wiki Education 参加者に該当する者であるこ とが示唆される.したがって,さらに多くの Wiki Education 参加者が 2011 年以降に関与している可 能性が高く,より強い影響を与えている要因である と考えられる.なお,参照記述を追加した 74,446 名の編集者全員を対象に利用者ページの調査を行っ た結果,そもそも何らかの記述がある者は 32,693 名 (43.9%) に留まるため,利用者ページから素性 を明らかにするには厳しい制約があることが分かっ た.これらは本研究の分析の限界点であり,Wiki Education 参加者のほかにどのような要因が影響を 与えているかを解明することは今後の課題である.

5.2

新規参加状況および関与月数とその

特徴

RQ3 参照記述の追加における新規参加者数は,ど のように推移しているのか? また,Wikipedia 全体と比較した場合,特徴は異なるのか? 参照記述の追加における新規参加者は,2001 年 から 2004 年までは数百名規模で緩やかに増加後, 2005 年に 1,000 名を上回り,2006 年には約 4,000 名に達している.その後,2008 年から 2010 年まで は 5,000 名規模,2011 年以降は概ね 7,000 名規模 での安定した推移であり,近年においても規模を維 持している.他方で,英語版全体では 2001 年から 2007 年までは単調増加,2008 年から 2010 年までは 単調減少,2011 年以降は減少または横ばいである. 以上のことから,両者は特徴が異なる.特に,参照 記述の追加では 2011 年以降も新規参加者の規模を保 っており,この点についても前述の Wiki Education 参加者の影響であると考えられる. RQ4 長期的に参照記述の追加を行う者が多いのか? それとも,短期的に行う者が多いのか? また, Wikipedia 全体の編集と比較した場合,特徴 は異なるのか?

(14)

まず,参照記述の追加において,すべての編集者, Wiki Education 参加者ともに全体の 4 分の 3 程度を 関与月数が 1 の者が占めることに加え,関与月数の 値が大きくなるほど割合が低くなる.また,すべての 編集者では関与月数が 3 以下の者,Wiki Education 参加者では 2 以下の者が約 9 割を占めるため,短期 的な追加を行う者が多い. 次に,英語版全体でのすべての編集者のうち,4 分の 3 は関与月数が 1 であることに加え,関与月数 が大きくなるほど割合が低くなる. 以上から,参照記述の追加,英語版全体の編集と もに,短期的に関与する者が多く,長期的に関与す る者が少ない点で両者の特徴に違いは見られない. RQ5 新規参加者の関与月数は,新規参加の時期に より異なるのか? また,参照記述の追加と Wikipedia 全体の編集で特徴は異なるのか? 新規参加年ごとの関与月数,初めての追加/編集 から 12ヶ月間における関与月数ごとの編集者の集 計結果から,まず,参照記述の追加,英語版全体で の編集ともに,多くの年で新規参加者の過半数は関 与月数が 1 であるため,新規参加の時期を問わず, 単一の時点のみ関与する者が多い.ただし,この傾 向が近年になるにつれてさらに強まっている点につ いては,時期ごとに特徴がやや異なると言える. 次に,関与月数が複数の編集者に関しては,参照 記述の追加,英語版全体での編集ともに比較的初期 の時点での割合が最も高い.また,関与月数が 3 以 上の比較的長期間に渡って関与する群の割合は,い ずれも経年的に減少または横ばいの傾向が見られる. これらの点は時期ごとに特徴が異なると言える. 以上の点に関して,参照記述の追加と英語版全体 での編集において特徴の違いは見られない.

6.

結論と今後の課題

本研究では,Wikipedia 上での参照記述の追加に おける持続可能性を明らかにすることを目的に,参 照記述の初出時点データセットを用いた時系列分析 を通じて,(1) 時系列推移とその特徴,(2) 新規参 加状況および関与月数とその特徴を明らかにした. 結論として,本研究の貢献を総括する.第一に, 英語版全体では編集者の異なり数,編集回数ともに 2007 年 3 月にピークに達し,その後は伸び悩みが 見られる一方で,参照記述の追加においては編集者 の異なり数,追加件数ともに伸び悩みは見られない ことを明らかにした.具体的には,2007 年 3 月まで は英語版全体と同様の推移であるが,2007 年 4 月 以降の編集者の異なり数は 2010 年までは横ばいで あり,2011 年以降も規模を維持していることから, 衰退には転じていないことを明らかにした. 第二に,参照記述を追加する編集者数の推移とし て,2011 年以降は毎年 4 月と 11 月に編集者が多 くなる点で周期的な特徴が見られることを示した うえで,その要因として大学の授業を通じた Wiki Education 参加者の影響が挙げられることを指摘し た.さらに,新規参加者に関しても,英語版全体で は 2007 年に最大値を取った後は減少または横ばい である一方で,参照記述の追加では近年も一定の規 模を保っており,この点についても Wiki Education 参加者の影響であると考えられることを示した. 第三に,関与月数に基づく分析を通じて,参照記 述の追加,英語版全体での編集ともに,多くの年で 新規参加者の過半数は単一の時点のみ関与しており, この傾向は近年になるにつれてさらに強まっている ことを明らかにした.したがって,新規参加者が定 着しにくい点や,長期的な活動を行わない者が多い 傾向に関しては,参照記述の追加と英語版全体での 編集に共通の問題である. 以上のことから,参照記述の追加では新たな編集 者の参加がコンスタントに生じ続けている点が英語 版全体での編集者における傾向とは大きく異なり, 伸び悩みが生じていない要因として解釈できる.ま た,Wiki Education の活動が今後も継続するとす れば,この傾向は長期的に持続する可能性が高いと 予想されるため,参照記述の追加における持続可能 性は高いと考えられる. 最後に,今後の課題について述べる.第一に,本 研究では 2017 年 2 月までの期間を対象とした時系 列分析を行い,その結果に基づく知見を示したが, 将来の推移の予測が課題である.このような予測が できれば,参照記述の追加における持続可能性のさ らに詳細な把握に繋がると考える.第二に, 5.1 節 で述べたように,利用者ページの記述を用いて編集 者の素性や属性を把握するには大きな制約があり, このことが分析の限界点に繋がるため,何らかの手 がかりを用いて編集者の素性や属性を取得する手法 に関する検討が課題である.第三に,英語版以外の 言語版への手法の適用が挙げられる.たとえば,本 研究の手法を日本語版に適用することにより,参照

情報知識学会誌 2021 Vol. 31, No. 1

(15)

記述の追加における編集者の異なり数や追加件数の 推移や,関与月数に基づく特徴の把握などが実現で きると考える.その際,前述した第一,第二の課題 が日本語版をはじめとする他言語版への適用時にも 課題となるため,これらの検討を行う必要がある.

謝辞

本研究の一部は,科学研究費補助金基盤研究 (C) (課題番号: 17K00449) 「ブラウジング型探索タスク の解明とその支援手法に関する研究」,同基盤研究 (C) (課題番号: 17K00448) 「サイエンスリンケージ の分野横断性に着目した論文・特許間引用の分析」 の助成によって行われたものである.

参考文献

[1] Bilder, Geoffrey: “Geoffrey Bilder: Strate-gic Initiatives Update #crossref15”, 2015. https://www.slideshare.net/CrossRef/ geoffrey-bilder-crossref15 (2018 年 9 月 1 日参照).

[2] Wikimedia Foundation: “Wikimedia project

at a glance”. https://stats.wikimedia.

org/EN/SummaryEN.htm (2019 年 12 月 31 日 参照).

[3] Alexa Internet, Inc.: “Alexa Top 500 Global

Sites”. https://www.alexa.com/topsites (2019 年 7 月 1 日参照). [4] 日下九八: 「ウィキペディア:その信頼性と 社会的役割」, 情報管理, Vol. 55, No. 1, pp. 2–12, 2012. https://doi.org/10.1241/ johokanri.55.2.

[5] Mesgari, Mostafa; Okoli, Chitu; Mehdi, Mo-hamad; Nielsen, Finn ˚Arup; Lanam¨aki, Arto: ““The sum of all human knowledge”: A sys-tematic review of scholarly research on the content of Wikipedia”, Journal of the As-sociation for Information Science and Tech-nology, Vol. 66, No. 2, pp. 219–245, 2014. https://doi.org/10.1002/asi.23172. [6] Halfaker, Aaron; Kittur, Aniket; Riedl, John:

“Don’t Bite the Newbies: How Reverts Af-fect the Quantity and Quality of Wikipedia Work”, Proceedings of the 7th International Symposium on Wikis and Open Collaboration,

WikiSym ’11, pp. 163–172, 2011. https:

//doi.org/10.1145/2038558.2038585. [7] Halfaker, Aaron; Geiger, R. Stuart;

Mor-gan, Jonathan T.; Riedl, John: “The Rise and Decline of an Open Collaboration

Sys-tem: How Wikipedia’s Reaction to

Pop-ularity Is Causing Its Decline”, American Behavioral Scientist, Vol. 57, No. 5, pp.

664–688, 2013. https://doi.org/10.1177/ 0002764212469365.

[8] Suh, Bongwon; Convertino, Gregorio;

Chi, Ed H.; Pirolli, Peter: “The

Singu-larity is Not near: Slowing Growth of

Wikipedia”, Proceedings of the 5th Inter-national Symposium on Wikis and Open Collaboration, WikiSym ’09, 2009. https: //doi.org/10.1145/1641309.1641322. [9] Nielsen, Finn ˚Arup: “Scientific citations

in Wikipedia”, First Monday, Vol. 12,

No. 8, 2007. https://doi.org/10.5210/fm. v12i8.1997.

[10] Pooladian, Aida; Borrego, ´Angel: “Method-ological issues in measuring citations in Wikipedia: a case study in Library and In-formation Science”, Scientometrics, Vol. 113, No. 1, pp. 455–464, 2017. https://doi.org/ 10.1007/s11192-017-2474-z. [11] 吉川次郎; 高久雅生; 芳鐘冬樹: 「Wikipedia に学術文献の参照記述を追加する編集の特定 手法」, 情報知識学会誌, Vol. 30, No. 3, 2020. https://doi.org/10.2964/jsik_2020_033. [12] Teplitskiy, Misha; Lu, Grace; Duede, Ea-mon: “Amplifying the impact of open ac-cess: Wikipedia and the diffusion of sci-ence”, Journal of the Association for In-formation Science and Technology, Vol. 68, No. 9, pp. 2116–2127, 2016. https://doi. org/10.1002/asi.23687.

[13] Lin, Jennifer; Fenner, Martin: “An analysis of Wikipedia references across PLOS publi-cations”, 2014. https://doi.org/10.6084/ m9.figshare.1048991.v3 (2018 年 9 月 1 日 参照).

[14] Kousha, Kayvan; Thelwall, Mike: “Are

wikipedia citations important evidence of the impact of scholarly articles and books?”, Journal of the Association for Information Science and Technology, Vol. 68, No. 3, pp. 762–779, 2017. https://doi.org/10.1002/ asi.23694. [15] 佐藤翔; 吉田光男; 逸村裕: 「Wikipedia 日本 語版からの学術論文の引用状況」, 日本図書館 情報学会春季研究集会発表論文集, pp. 81–84, 2013.

[16] Kikkawa, Jiro; Takaku, Masao;

Yoshikane, Fuyuki: “DOI Links on

Wikipedia”, Proceedings of the 18th

In-ternational Conference on Asia-Pacific

Digital Libraries (ICADL 2016), pp. 369–

380, 2016. https://doi.org/10.1007/

978-3-319-49304-6_40.

[17] Halfaker, Aaron; Taraborelli, Dario: “Re-search:Scholarly article citations in Wikipedia

- Meta”. https://meta.wikimedia.org/

wiki/Research:Scholarly_article_ citations_in_Wikipedia (2018 年 10 月 30 日参照).

[18] Thelwall, Mike: “Does Astronomy research become too dated for the public? Wikipedia

(16)

citations to Astronomy and Astrophysics journal articles 1996-2014”, El Profesional de la Informaci´on, Vol. 25, No. 6, pp. 893– 900, 2016. https://doi.org/10.3145/epi. 2016.nov.06. [19] 吉川次郎; 高久雅生; 芳鐘冬樹: 「DOI リン クに基づく Wikipedia 上の参照記述における 編集者の分析」, 情報知識学会誌, Vol. 30, No. 1, pp. 21–41, 2020. https://doi.org/ 10.2964/jsik_2020_004.

[20] Halfaker, Aaron: 「mwcites · PyPI」. https: //pypi.org/project/mwcites/ (2019 年 12 月 31 日参照).

[21] “Wikipedia Seigenthaler biography incident

- Wikipedia”. https://en.wikipedia.

org/wiki/Wikipedia_Seigenthaler_ biography_incident (2020 年 3 月 3 日参照).

[22] “USATODAY.com - A false Wikipedia

‘biography’”, 2005. http://usatoday30.

usatoday.com/news/opinion/editorials/

2005-11-29-wikipedia-edit_x.htm (2020

年 3 月 3 日参照).

[23] “Day 1 report of Wikimania 2006

- Wikinews, the free news source”.

https://en.wikinews.org/wiki/Day_ 1_report_of_Wikimania_2006 (2020 年 3 月 3 日参照).

[24] Wikimedia Foundation: “Editor Trends

Study/Results - Strategic Planning”.

https://strategy.wikimedia.org/wiki/ Editor_Trends_Study/Results (2019 年 12 月 31 日参照).

[25] “Research:Wikipedia Editors Survey 2011

- Meta”. https://meta.wikimedia.

org/wiki/Research:Wikipedia_Editors_ Survey_2011 (2020 年 3 月 3 日参照).

[26] “Wikipedia Editors Study: Results from

the editor survey, April 2011”. https:

//commons.wikimedia.org/wiki/File: Editor_Survey_Report_-_April_2011.pdf (2020 年 3 月 3 日参照).

[27] Heilman, James M; West, Andrew G:

“Wikipedia and Medicine: Quantifying Read-ership, Editors, and the Significance of Nat-ural Language”, Journal of Medical Inter-net Research, Vol. 17, No. 3, p. e62, 2015. https://doi.org/10.2196/jmir.4069.

[28] “Wikipedia:WikiProject Medicine

-Wikipedia”. https://en.wikipedia.org/

wiki/Wikipedia:WikiProject_Medicine (2020 年 3 月 3 日参照).

[29] Taraborelli, Dario; Mietchen, Daniel; Alevi-zou, Panagiota; Gill, Alastair: “Expert par-ticipation on Wikipedia: barriers and op-portunities”, Wikimania 2011, 2011. http: //oro.open.ac.uk/32619/.

[30] Wiki Education Foundation: 「Wiki

Ed-ucation – Connecting Higher Ed and

Wikipedia」. https://wikiedu.org/ (2020 年 3 月 1 日参照).

[31] Wiki Education Foundation: “Wiki

Edu-cation Dashboard”. https://dashboard.

wikiedu.org/ (2020 年 6 月 1 日参照). [32] Joshi, Mihir; Verduzco, Rafael; Yogi, Sara;

Garcia, Maite; Saxena, Sanskriti; Tack-ett, Sean; Dexter, Nadine; Dempsey, Angela; Whitaker, Evans; Azzam, Amin: “Wikipedia Editing Courses at Three US Medical Schools in the 2017-2018 Academic Year”, MedEd-Publish, Vol. 8, No. 2, 2019. https://doi. org/10.15694/mep.2019.000146.1.

[33] Kingsland, Emily S.; Isuster, Marcela Y.:

“A Different Ball Game: Physical

Edu-cation Students’ Experiences in Librarian-led Wikipedia Assignments”, The Journal of Academic Librarianship, Vol. 46, No. 1, p.

102089, 2020. https://doi.org/10.1016/

j.acalib.2019.102089.

[34] Vetter, Matthew A.; McDowell, Zachary J.; Stewart, Mahala: “From Opportunities to

Outcomes: The Wikipedia-Based Writing

Assignment”, Computers and Composition, Vol. 52, pp. 53–64, 2019. https://doi.org/ 10.1016/j.compcom.2019.01.008. [35] 「 利 用 者:さ え ぼ ー/英 日 翻 訳 ウィキ ペ ディア ン 養 成 セ ミ ナ ー - Wikipedia」. https://ja.wikipedia.org/wiki/利 用 者:さ え ぼー/英日翻訳ウィキペディアン養成セミナー (2020 年 6 月 5 日参照). [36] 時実象一: 「ウィキペディア教育の経験」, 情報 知識学会誌, Vol. 23, No. 2, pp. 185–192, 2013. https://doi.org/10.2964/jsik.23_185. [37] 桂まに子: 「ウィキペディアタウン東山 : 京 都女子大学図書館司書課程におけるアクティ ブ・ラーニング実践」, 京都女子大学図書館情 報学研究紀要, No. 5, pp. 1–12, 2018. http: //hdl.handle.net/11173/2618. [38] 河本大地: 「大学初年次における「身近な地域」 の調査とウィキペディア編集―奈良のならまち での実践からみた有効性と課題―」, E-journal GEO, Vol. 13, No. 2, pp. 534–548, 2018. https://doi.org/10.4157/ejgeo.13.534. [39] 尾澤重知; 森裕生; 江木啓訓: 「Wikipedia の 編集を取り入れた授業における学習者の投稿 行動の特徴と学習効果の検討」, 日本教育工学 会論文誌, Vol. 36, pp. 41–44, 2012. https: //doi.org/10.15077/jjet.KJ00008609772. [40] 山川優樹; 柴田俊文; 中井健太郎: 「専門知識の 発信による学会の社会貢献 土木学会応用力学 委員会のウィキペディアプロジェクト」, 情報管 理, Vol. 55, No. 11, pp. 819–825, 2013. https: //doi.org/10.1241/johokanri.55.819. [41] Wikimedia Foundation: “Wikimedia

Down-loads”. https://dumps.wikimedia.org/

backup-index.html (2018 年 9 月 1 日参照).

Figure 2. The English Wikipedia’s editor decline.
表 1: 編集者の種別ごとの基礎データ 参照記述の追加 英語版全体 編集者 編集者の 参照記述の 割合 編集者の 編集回数の 割合 の種別 異なり数 延べ数 (%) 異なり数 延べ数 (%) User 74,446 738,369 79.9 6,432,691 311,863,204 61.9 Bot 63 108,370 11.7 961 48,225,363 9.6 IP 37,742 77,026 8.3 37,795,840 143,772,750 28.5 合計 - 923,765 100.0 -

参照

関連したドキュメント

図2 縄文時代の編物資料(図版出典は各発掘報告) 図2 縄文時代の編物資料(図版出典は各発掘報告)... 図3

    

存する当時の文献表から,この書がCremonaのGerardus(1187段)によってスペインの

ベクトル計算と解析幾何 移動,移動の加法 移動と実数との乗法 ベクトル空間の概念 平面における基底と座標系

[r]

CIとDIは共通の指標を採用しており、採用系列数は先行指数 11、一致指数 10、遅行指数9 の 30 系列である(2017

[r]

 活動回数は毎年増加傾向にあるが,今年度も同じ大学 の他の学科からの依頼が増え,同じ大学に 2 回, 3 回と 通うことが多くなっている (表 1 ・図 1