• 検索結果がありません。

オープンデータによるオープンサイエンスの推進(<特集>人工知能研究のベンチマークとは-標準問題・データセット・評価手法-)

N/A
N/A
Protected

Academic year: 2021

シェア "オープンデータによるオープンサイエンスの推進(<特集>人工知能研究のベンチマークとは-標準問題・データセット・評価手法-)"

Copied!
7
0
0

読み込み中.... (全文を見る)

全文

(1)

1.は じ め に

本稿では,オープンサイエンス,オープンデータの概 要と動向を紹介し,人工知能研究への有用性と,人工知 能研究がそれらにもたらすと思われるインパクトについ て述べる. 社会と科学が距離を縮め,人工知能に対しても実用へ の期待と需要が高まる中で,科学界において提案される 各種の技術や手法がビジネスや行政に関わる実際的な問 題を解くことができるか,もしくは解くための支援ができ るか,といったことも重要な評価指標の一つとなっている. ここで機械学習を中心とした場合の人工知能では,技 術や手法そのものもさることながら,(一定以上の質と量 を備えた)データも欠くことのできない重要な要素であ る [石塚 14, 西田 12].しかしながら,産業の実問題に密 接に関わるデータが公開されていることは“まれ”であ る.例えば POS(Point of Sales)データなどを用いた 解析例などは,報告はされている [小柴 13, Nishino 14] ものの,POS データそのものが実際に容易に入手可能 な形で公開されているケースは見られない.このように 産業に関わるデータは各所でそれぞれに収集・保管され ているものの,多くの場合一般には公開されていない. したがって,多くの研究者が開発技術の実用上の有用性 などを,多様な実データのもとで気軽に評価できる形に はなっていない. 一方,行政の世界では国際的なオープン(ガバメント) データの動きに従って,データ公開を進めている [浅野 15, 内府 OS 15, 大向 13a].地方行政などでは,これら のデータを用いた地域活性のためのハッカソンが開催さ れるなど活用の動きもある [新井 15, 浅野 15, 大向 13a] が,特に国家行政に目を向けると,データ公開の有用性 を行政官が直接享受したり,積極活用されるには至って いないように見受けられる. 本稿ではこれらの背景に基づいて,「人工知能のベン チマーキングに際して,データにオープン(ガバメント) データを積極利用すること」をオープンサイエンスの文 脈から提案する. 以下では,オープンサイエンスやオープンデータその ものについて説明したうえで,関連するいくつかの事例 について紹介しながら,これらの提案について説明する. なお,意見・提言などに相当する部分は個人の見解で ある.

2.オープンサイエンスとオープンデータ

2・1 オープンサイエンス オープンサイエンスの定義はいまだ明確には定まって いない [林 15c] が,内閣府の報告書 [内府 OS 15] によれ ばオープンサイエンスとは,“公的研究資金を用いた研 究成果(論文,生成された研究データなど)について, 科学界はもとより産業界および社会一般から広く容易な アクセス・利用を可能にし,知の創出に新たな道を開く とともに,効果的に科学技術研究を推進することでイノ ベーションの創出につなげることを目指した新たなサイ エンスの進め方を意味する.”として位置付けられている. オープンサイエンスは平成 27 年 11 月 2 日に公開さ れた総合科学技術・イノベーション会議の“「第 5 期科 学技術基本計画」答申素案”[内府総科 15] においても イノベーションの源泉として言及されている.ここでは “オープンサイエンスとは,オープンアクセスと研究デー タのオープン化(オープンデータ)を含む概念である. オープンアクセスが進むことにより,学界,産業界,一 般市民などあらゆるユーザが研究成果を広く利用可能と なり,その結果,研究者の所属機関,専門分野,国境を 超えた新たな協働による知の創出を加速し,新たな価値 を生み出していくことが可能となる.また,オープンデー タが進むことで,社会に対する研究プロセスの透明化が

オープンデータによるオープンサイエンスの推進

Open Data for Open Science

小柴  等

文部科学省科学技術・学術政策研究所

Hitoshi Koshiba National Institute of Science and Technology Policy(NISTEP).

[email protected], http://researchmap.jp/hkoshiba/

林  和弘

(同   上)

Kazuhiro Hayashi [email protected], http://orcid.org/0000-0003-1996-4259

Keywords:

open data, open science, collaborative data infrastructure.

(2)

図られ,また,こうした協働に一般市民の参画を促す効 果も見込まれる.”と説明されている. オープンサイエンスの概念を単純化すれば,「オープ ンイノベーションの加速と研究プロセスの透明化を目的 に,研究成果を広く社会にまで公開するもの」といえる. 2・2 オープンデータ 上述したオープンサイエンスの定義に登場するオープ ンデータとは,一般に「誰でも自由に取得,再利用が再 配布ができるようなデータ」といえる.機械による処理 の容易さや,利用・再利用・再配布などに関わるライセン スの許容度などにより,いくつかの区分も存在する.こ れらの詳細については他稿 [浅野 15, 内府 OS 15] に譲る. 政府がオープンデータと記載する際には,基本的に 2013年の G8 サミットで批准したオープンデータ憲章 を意識しているため,オープンデータの内容もオープン・ ガバメントに関連したものであることが多い.そこで先 にもあげたオープンサイエンスに関する内閣府の報告書 [内府総科 15] では,オープンデータについて(1)オー プン・ガバメントとも呼ばれる,政府が保有する行政デー タなどの公開活動(本稿では「オープンガバメントデー タ」と呼ぶ)と,(2)研究データのオープン化(本稿で は「オープンリサーチデータ」と呼ぶ)という,二つの 系統があり,オープンサイエンスの文脈では主に後者の オープンリサーチデータを対象とすること,として整理 している.オープンアクセスについては“論文のオープ ンアクセス”として,オープンリサーチデータに含まれ ていると理解される. オープンサイエンスの観点からこれらの関係を図示す ると図 1 のようになる.

§ 1 オープンデータと Linked Open Data(LOD) ところで,本誌 2015 年 9 月号(人工知能,Vol. 30, No. 5) でも特集が組まれた,Linked Data とオープンデータの 間にも密接な関係がある.単純には Linked Data のうち オープンデータ化したものが Linked Open Data(LOD) といえる *1.これらの関係を図 2 に示す. § 2 政府におけるオープンデータの取組み これまでに国は図 3 に示したような各種の取組みを 行っており,オープンデータを推進する意義やその方針, ライセンスに関する条項やそのための技術などを整理し ている.これを受けて地方公共団体などでもガイドライ ンの策定などが行われている.さらにこれとは独立に, もしくは関連して民間でもライセンスや技術に関する取

*1 通常,LOD はオープンデータのレベルに関する 5 Star Open Dataの観点から語られる.またオープンデータと LOD の関係 についてはさまざまな議論がある [大向 13b] ため,ここでは詳 細を割愛する. 図 3 政府におけるオープンデータの取組み (文献 [ 内官情戦 15] の図を元に著者改変) 図 1 オープンサイエンスと構成要素の関係 図 2 オープンデータと Linked Data の関係

(3)

組みが行われている. これらの資料からも明らかに,オープンガバメント データについては,(1)どのような種類のデータを,ど のような形式で,どのようなタイミングや手続きで公開 するか,といったフレームは明確に定まっていること, (2)それに基づいて,保有データの公開(オープン化) が進展しつつあること,が理解できる.

3.オープンサイエンス,オープンデータと人工知能

3・1 人工知能(機械学習)におけるデータの問題 各所で指摘があるとおり,昨今の(特に機械学習を中 心とした)人工知能研究の隆盛には,その背景の一部に Webを通じた電子情報の大量流通が存在する [石塚 14, 西田 12]. ここで,ネット上でサービスを提供している事業者は 当該サービスを通じて自然とデータを得ることができ, そのデータを機械学習などに用いることができる.また, それによりさらなる技術開発を進めることができる.そ の一方で,これらのデータの多くは当該事業者の重要な 資産であってオープンにする予定がないと想定される. またデータをオープンにする意思があっても設計時に オープンにすることを想定していない場合は公開に際し てさまざまなコストがかかる.こういった背景もあり, 多くの場合において事業者のサービスデータは一般に流 通していない.我が国において,多くの研究者が利用可 能で,ある程度の量をもち,一定の品質担保もなされた 実サービス関連のデータとしては,ヤフー,楽天,クッ クパッドなどいくつかの企業が,国立情報学研究所(NII) の情報学研究データリポジトリ*2を通じて提供している ものが見られる程度といえる.この情報学研究データリ ポジトリの活動に見られるように,今後,一部のサービ スデータについては事業者からの提供が進んでいくこと が期待される.しかしながら現状では,大学に所属する 研究者らは多くの場合モデルを作成するにあたって,自 ら公開されているデータを収集する,もしくは事業者と 提携してデータをもらってくる,といった作業が必要と なり,結果として(データセットが異なるので)提案手 法とさまざまな既存手法を比較するうえで余計なコスト を有する,といった課題が生じていると推察される. 3・2 オープンガバメントデータの有用性 ところで,我が国においてもオープンガバメントデー タの取組みは進展しており,内閣官房情報通信技術(IT) 総合戦略室が中心となってデータカタログサイト*3に情 報をとりまとめている.また,データの活用という面で も内閣官房まち・ひと・しごと創生本部が地域経済分析 システム(RESAS(リーサス))*4の公開・運用に見ら れるような活動を行っている. オープンガバメントデータは,サービス事業者が日々 収集するデータなどに比べるとデータ量が少なかった り,現状ではマシンリーダブルでないものも多く含まれ ているものの,オープンデータ憲章に従って今後も継続 的に多様な種類のデータが提供されていくこと,公的 データであるためデータの質は比較的高いと考えられる こと,などの面から人工知能研究などに利用するデータ としてもある程度有用と考えられる.さらに,行政やオー プンサイエンスと人工知能研究は互恵的な関係を築ける 可能性が高い. § 1 学会側から見た有用性 学会側から見たオープンガバメントデータの直接的な 有用性は,ある程度の量があり,ものによってはタグ付 けされたオープンなデータとして,利用可能という点に ある.さらに現在タグ付けされていないデータについて も,有用性が示されれば行政側がタグ付けを行ってくれ る可能性もあり,学会側の協力は必須であるもののすべ てを自前で処理しなくてもよい可能性が高い. 人工知能の枠を超えて「学界全体」としては,オー プンリサーチデータ以外も含めたオープンデータ一般を 用いたオープンサイエンスの推進に結びつく可能性があ る.オープンサイエンスについては前述したとおり,第 5期科学技術基本計画の答申素案 [内府総科 15] におい てもイノベーションの源泉として言及されている概念 で,重点的に取り組むべき課題といえる.そのために“国 は,資金配分機関,大学・研究機関,研究者らの関係者 と連携し,オープンサイエンスの推進体制を構築する. (中略)また,国は,国内外からのアクセス機会の増大 を通じて,科学研究活動の効率化と生産性の向上を目 指し,オープンサイエンスの推進のルールに基づいた研 究成果・データ共有プラットフォームを構築する.”と, 記載している.ただし,具体的なオープンサイエンスの 在り方については模索状態であり,各種委員会など*5 おいて議論が始まっている段階である. ここで,人工知能研究や人工知能研究におけるベンチ マーキングの取組みは,「具体的なオープンサイエンス の在り方」を考えるロールモデルになる可能性が高い. すでに(人工知能を含む)情報学はオープンサイエンス に大きく寄与するという指摘がある [林 15d] が,実際に 人工知能研究におけるベンチマーキングを考えるうえで も,(1)人工知能ベンチマーキングに用いるデータセッ トを,誰がどのように運用するか,(2)ベンチマーク を行う人工知能のソースコードを第三者が検証できるよ *2 http://www.nii.ac.jp/dsc/idr/ *3 http://www.data.go.jp/ *4 https://resas.go.jp/ *5 内閣府総合科学技術・イノベーション会議,内閣府「国際的 動向を踏まえたオープンサイエンスに関する検討会」,文部科学 省「第 8 期学術情報委員会」,日本学術会議「オープンサイエン スの取組に関する検討委員会」など.

(4)

う,どのように管理・公開するか,など,オープンサイ エンスが現在直面する実務的な問題を取り扱うことにな ると想定される.すなわち,人工知能のベンチマーキン グ問題作成作業はオープンサイエンスの在り方と密接に 関連しているし,これを解決できる可能性を有している. 今後の我が国の科学技術・学術政策の方向性からしても, オープンサイエンスに関連させて整備しておくべきとい える. さらに現在「ニコニコ学会」*6など,シチズンサイエ ンス *7の動きが見られるが,オープンサイエンスが進む につれて一部分野では職業研究者と一般の人々との境界 は曖昧になると見られる.特に人工知能をはじめ情報学 系の学問は,計算機と知識さえあれば参入自体は比較的 容易な箇所もあるため,シチズンサイエンスの登竜門と しての間口は広い.3D プリンタの活用など他の分野に おいても今後シチズンサイエンスが広まりつつあると見 られるが,まずは情報系の学問分野であり,オープンデー タの利活用やシチズンサイエンスとも関連の強い人工知 能分野において,これらオープンサイエンスとシチズン サイエンスなどに関するさまざまな問題を観察・整理・ 解決しておくことは,今後の我が国の科学技術・学術の 在り方を考えるうえでも,有用と思われる. 先に示した図 1 に,これら人工知能のベンチマーキン グがもたらすと思われる関係や要素を追加すると,図 4 のように表せる.オープンガバメントデータを用いた人 工知能のベンチマーキングは,研究者以外の参加者も巻 き込みながら,オープンガバメントデータとオープンリ サーチデータの循環を生み出して,オープンサイエンス の推進に寄与できる可能性が高い. § 2 行政側から見た有用性 行政にとっては,オープンガバメントデータの活用例 を得ることができる. 2013年の G8 サミットで批准されたオープンデータ 憲章に基づきオープンガバメントデータ化は促進され, 地方自治体などではいくつかの活用事例も出てきつつあ る [新井 15, 浅野 15, 大向 13a] ものの,数としては多く ない.また国家行政については活用事例もほとんど見ら れていない.実際に内閣府の電子行政オープンデータ実 務者会議でも,“データ公開面では一定の成果をあげつ つあるものの,今後は利活用面にも焦点を当てる必要あ り”と指摘し,新たなオープンデータの展開に向けた課 題として,利活用の促進を意識した対応の必要性をあげ ている [内官 OD 15]. 国家行政での利活用が進まない要因については,(1) 国家行政は地方行政と比べて一般生活と距離があるた め,一般市民が自身のためにデータを利活用しづらく, 結果としてユーザが行政官に限定されやすいこと,(2) そもそもデータサイエンスのリテラシーを有する行政官 が多くはないため何ができるかわかっていないこと,も しくは,わかっていても手を動かす時間がないので分析 できないこと,(3)活用事例が少ないので,積極的にデー タを整備・公開するモチベーションにつながらないこと, などが考えられる. 前述した RESAS の登場によってこういった背景が多 少緩和され,データ活用の有用性が示されるとともに行 政官による(省庁横断型などの新しい)データ分析事例 も増加していくことが期待される.ただし,RESAS も 現状では「データの可視化」機能が主体となっているた め,今後,分析機能の拡充に期待が寄せられている. 人工知能のベンチマーキングを行ううえで,オープン ガバメントデータを用いると,(1)人工知能の具体的な 有用性・活用方法を理解するあるいは示すことができ, (2)行政側が新たなデータや,正解データなどがタグ付 けされたデータを積極的に提供するモチベーションにつ ながり,データ整備と活用の好循環につながる可能性が 高い,といえる. 3・3 オープンデータとオープンジャーナル・ 協働データインフラ § 1 データジャーナル データそのものと,それを共有することにより生じる 価値に着目した動きとして,データジャーナルといった 動きもある. データジャーナルとは,データそのものを論文のよう に出版するものである [林 15a].一般のジャーナル同様 に,データの生成手順や品質に対する査読を行うことで, データに対する品質を一定程度保証するもの,と見るこ とができる.データジャーナルは特に(質の良い・ある 程度構造化された・メタ情報のある)大量データを要 する人工知能分野の研究には有用性が高いと思われる. データジャーナルに関して,データの生成・登録とデー タと論文の出版の関係を図 5 に示す. データジャーナルの浸透によって,ソースコードな どを含む各種のリサーチデータが研究成果として認めら れ,その貢献を引用などで測ることが可能になると期待 される.人工知能など情報系の研究分野においては,現 *6 http://niconicogakkai.jp/ *7 職業研究者や研究機関ではなく,一般の人々が行う研究活動 [林 15b] 図 4 オープンサイエンスと人工知能のベンチマーキング

(5)

状でも自身の開発したアルゴリズムなどを GitHub*8 どで公開する研究者が少なくなく,GitHub であれば Forkや Star の数である種の評価も提供されているが, これらも研究成果・評価として正式に認めようといった 動きがあると説明できる. § 2 協働データインフラ 類似のオープンリサーチデータの共有・品質保証 の枠組みとして,Collaborative Data Infrastructure (CDI:以下,協働データインフラ)の開発プロジェク ト EUDAT(European Data Infrastructure)などもあ げられる [野村 15].

データジャーナルは基本的に従来の論文誌と同じく, 主として出版社など特定の団体・私企業などが運営を行 うが,EUDAT は欧州連合の EU Seventh Framework Programme(FP7)e-Infrastructure Call 9(WP11)の ファンドによって開始された公的なプログラムである. 上述した,情報学研究データリポジトリや政府のデー タカタログサイトは,データジャーナルよりもこの協働 データインフラの位置付けに近い.ただし,EUDAT に は 1,630 万ユーロの予算が投下されており,組織として も 13 か国 26 機関が参画する大規模な枠組みである.人 工知能ベンチマーキングだけを念頭に類似の枠組みを作 成することは不可能と思われるが,人工知能ベンチマー キングに関わるデータ整備・運用を行う際の,他学会な どとの連携も見据えたルールづくりなどには有用な事例 と考えられる. この観点から我々の主張を見直すと,人工知能のベン チマーキングとデータには深い関係がある一方,現状で は運営方針などを含め協働データインフラが十分に整備 されていない.そこで,「人工知能のベンチマーキング」 という目的だけでなく,協働データインフラのプロトタ イピングも念頭に設計し,オープンガバメントデータを 積極的に活用していくと,人工知能のベンチマーキング に関する活動が我が国のオープンサイエンス推進のコア として転用でき,学界と行政の双方にとって長期的にも 有用なのではないか,と言い換えることができる.

4.オープンデータ利活用の取組み

オープンガバメントデータに関する我が国の取組みな どについては,本誌 2015 年 9 月号(人工知能,Vol. 30, No. 5)の記事 [浅野 15] に詳しい. そこで本稿では政府における最近の取組みを中心に紹 介する. 4・1 政府における取組み オープンデータ利活用に関わる政府における取組みと しては,内閣官房まち・ひと・しごと創生本部の地域経 済分析システム(RESAS(リーサス),図 6,図 7 参照) があげられる.RESAS は人口動態や特許,取引先など のデータを可視化するようなシステムで,自治体の特徴 を理解したり,自治体間の比較・関係性の理解を促進し たりすることができる. RESASには大きく,(1)自治体職員向けに企業など の一部詳細データまで表示できるものと,(2)それらの 情報を削除した一般向けのものとの 2 種類が存在する. 一般向けの RESAS で表示されるデータの多くは csv で のダウンロードも可能になっている. 現状は API の公開などは行われていないが,今後 APIの整備なども計画されており,RESAS 上に独自の *8 https://github.com/ 図 5 データの生成・登録とデータと論文の出版の関係 (出典:[ 林 15a])

(6)

データを可視化したり,RESAS で提供されるデータや その他のデータを分析し,その結果を再び RESAS 上に 可視化することも可能になると期待される.データ分析 について著者らが行政側の利用者らへヒアリングを行っ たところでは,類似パターンや共起ルールの検出,外れ 値の検出などの機能に関する要望が寄せられており,人 工知能関連技術が寄与できる可能性が高い. 2015年 11 月 現 在, 地 域 の 現 状・ 課 題 に つ い て, RESASを使って分析し,そのうえで解決策となるよう な政策アイディアを提案する「地方創生☆政策アイディ アコンテスト 2015」が開催されているが,上述した分 析機能の要望などを考えると,今後,科学技術振興機構 (JST)のデータサイエンス・アドベンチャー杯 [ 伊藤 14]のように,政策提言とは別に人工知能技術を用いた 分析例のコンペティションが行われる可能性もある. また前述したとおり,地方自治体を中心にオープンガ バメントデータを用いたアイディアソン・ハッカソンな どの取組みが盛んに行われている [新井 15].RESAS は 国が提供するオープンガバメントデータの中では自治体 との関連が強く,その意味では行政官のみならず一般 ユーザの関心も高いデータといえる. 人工知能のベンチマーキングを考える際にこういった システムとの協調・協働も考えることで,社会実装を促 進できる可能性が高い. 4・2 文部科学省関連の取組み ここまで主にオープンガバメントデータに関して記載 してきたが,文部科学省に関連する機関に目を向けると オープンガバメントデータだけでなく,オープンリサー チデータの蓄積も進んでいる. 例えば,第 3 期科学技術基本計画における国家基幹技 術「海洋地球観測探査システム」の一翼を担うプロジェ クトとして 2006 年に開始され,2011 年からは「地球 環境情報統融合プログラム」としてさらなる高度化・拡 張を進めている「データ統合・解析システム(DIAS: Data Integration and Analysis System)」では,宇宙・ 気象・海洋などの種々のデータを収集・公開している*9 DIASのデータはセンサ系のまとまったものとして有用 性が高いほか,防災減災は我が国をはじめ,OECD(経 済開発協力機構)など多国間連携を行ううえでも重要性 が高く,行政的にも関心の高い領域である [内府総科 15, NISTEP 15].こういった背景からも,ベンチマーキ ングなどに用いるデータとしての価値が高いといえる.

5.オープンデータの評価に関する取組み

現状,オープンデータの評価については先に触れた 5 Star Open Data など,オープン化の度合いで語られ ていることが多い.一方で,データの質など「内容」に ついての決定的・支配的な評価尺度は見当たらない. ここで論文の世界に目を向けてみると,これまでに主 に被引用回数に基づく評価がなされてきた.3・1 節で述 べたデータジャーナルのような動きを勘案すると,オー プンデータについても論文同様に引用に基づく評価手法 が適用される可能性は高く,実際に検討も進んでいる*10 さらに近年,論文をはじめとする研究成果の評価につ いて Altmetrics(オルトメトリクス)と呼ばれる新たな 指標も登場してきた.Altmetrics について明確な定義は 定まっていないが,まずは,論文の閲覧回数や SNS で の言及回数などをベースとした,社会的影響力と考える と理解しやすい [板東 12].3・1 節で述べた,github で の Fork や star の回数は Altmetrics の一つといえる.オー プンガバメントデータを用いた社会実装などにおいて は,学術面ではもちろんのこと,社会的影響力は重要な 要素になり得る.一方,その評価の手法は定まっていな いため,Altmetrics の積極的な導入などを行って,デー タの多様な評価手法が開発されていくことが期待される [林 13]. ところで,第 5 期科学技術基本計画では新たな試みと して,評価指標や目標値設定の検討が行われている [小 笠原 15].今後第 5 期科学技術基本計画で示される指標 やその指標作成プロセスなども,人工知能のベンチマー キングを検討する際に有用と考えられる. 図 6 RESAS トップページ 図 7 RESAS 産業輸出入花火図 *9 http://www.diasjp.net/about/data/dias-datasetlist/ *10 https://www.datacite.org/

(7)

[小柴 13] 小柴 等,石垣 司,竹中 毅,櫻井暎一,本村陽一:行動 履歴データとライフスタイル調査にもとづく顧客モデル構築技 術,電学論(C),電子・情報・システム部門誌,Vol. 133, No. 9, pp. 1787-1795(2013)

[西田 12] 西田豊明:人工知能研究半世紀の歩みと今後の課題,情 報管理,Vol. 55, No. 7, pp. 461-471, DOI: 10.1241/johokanri. 55.461(2012)

[Nishino 14] Nishino, N., Takenaka, T., Koshiba, H. and Kodama, K.: Customer preference based optimization in selecting product/service variety, CIRP Annals-Manufacturing

Technology, Vol. 63, Issue 1, pp. 421-424(2014)

[NISTEP 15] 文部科学省科学技術・学術政策研究所:第 10 回 科学技術予測調査 国際的視点からのシナリオプランニン グ,NISTEP REPORT, Vol. 164, http://hdl.handle. net/11035/3079(2015) [内府 OS 15] 内閣府国際的動向を踏まえたオープンサイエンスに 関する検討会:(報告書)我が国におけるオープンサイエンス推 進のあり方について(2015 年 3 月 31 日) [内府総科 15] 内閣府総合科学技術・イノベーション会議:(答申素 案)科学技術基本計画について(2015 年 10 月 29 日) [内官 OD 15] 内閣官房高度情報通信ネットワーク社会推進戦略本 部:新たなオープンデータの展開に向けて(2015 年 6 月 30 日) [内官情戦 15] 内閣官房情報通信技術(IT)総合戦略室:オープンデー タをはじめよう∼ 地方公共団体のための最初の手引書∼(2015 年 8 月 3 日改定版) [野村 15] 野村 稔:オープンサイエンスをめぐる新しい潮流(その 4) 研究コミュニティに向けた協働データインフラの開発動向─欧 州の EUDAT の取組から─,科学技術動向,No. 149, pp. 11-18 (2015) [小笠原 15] 小笠原敦:総合科学技術・イノベーション会議 原 山優子議員インタビュー,STI Horizon, Vol. 1, No. 1, pp. 3-5, DOI:10.15108/stih.00002(2015)

[大向 13a] 大向一輝:日本におけるオープンデータの進展と展望, 情報管理,Vol. 56, No. 7, pp. 440-447, DOI: 10.1241/johokanri. 56.440(2013)

[大向 13b] 大向一輝:オープンデータ活用:1. オープンデータと Linked Open Data, 情報処理,Vol. 54, No. 12, pp. 1204-1210 (2013) 2015年 12 月 28 日 受理

6.ま  と  め

本稿では,まず第 5 期科学技術基本計画(答申素案) などでも取り上げられている,オープンサイエンス・オー プンデータの概念や最近の動向について紹介した.その うえで,「人工知能のベンチマーキングに際して,デー タにオープン(ガバメント)データを積極利用すること」 の有用性についても述べた.つまり,産業界に比べても ともとデータを提供しやすい・提供しなければならない 立場にあるオープン(ガバメント)データを活用いただ くことで,実問題に対する有用性の評価を実現するとと もに,行政官に対しては高度分析の例など有用性を示し, 社会貢献も実現する.これによって,オープンデータ化 の推進,ひいてはオープンサイエンスの推進も行えるの ではないかという提案を行った. データマイニングをはじめ人工知能やその関連技術は 行政の世界においても有用性が高く,さらにオープンサ イエンスなど科学と社会の新しい関係にも関与する.よ り一層の学官連携に向けてご協力を賜れれば幸いである. 謝 辞 本原稿執筆にあたり,内閣官房まち・ひと・しごと創 生本部事務局ビッグデータチーム小西俊作参事官補佐に ご協力をいただいた.記して感謝する.

◇ 参 考 文 献 ◇

[新井 15] 新井イスマイル:ソフトウェア技術者から見たオープン データの魅力,コンピュータソフトウェア,Vol. 32, No. 3, pp. 10-22(2015) [浅野 15] 浅野 優:オープンデータ普及促進に向けた国内行政機関 の取組み,人工知能,Vol. 30, No. 5, pp. 590-597(2015) [板東 12] 坂東慶太:Altmetrics の可能性 ソーシャルメディアを 活用した研究評価指標,情報管理,Vol. 55, No. 9, pp. 638-646, DOI:10.1241/johokanri.55.638(2012) [林 13] 林 和弘:研究論文の影響度を測定する新しい動き─論文単 位で即時かつ多面的な測定を可能とする Altmetrics ─,科学技 術動向,No. 134, pp. 20-29(2013) [林 15a] 林 和弘,村山泰啓:オープンサイエンスをめぐる新しい 潮流(その 3)研究データ出版の動向と論文の根拠データの公 開促進に向けて,科学技術動向,No. 148, pp. 4-9(2015) [林 15b] 林 和弘:オープンサイエンスをめぐる新しい潮流(その 5) オープンな情報流通が促進するシチズンサイエンス(市民科学) の可能性,科学技術動向,No. 150, pp. 20-25(2015) [林 15c] 林 和弘:オープンアクセス・オープンサイエンス政策の 現状と課題,研究・技術計画学会年次学術大会講演要旨集,Vol. 30, pp. 1075-1077(2015) [林 15d] 林 和弘:(国立情報学研究所喜連川優所長インタビュー) シリーズ「オープンサイエンスの展望」の開始によせて,STI

Horizon, Vol. 1, No. 1, pp. 9-12, DOI: 10.15108/stih.00004

(2015)

[伊藤 14] 伊藤 祥:データサイエンス・アドベンチャー杯,情報管理, Vol. 57, No. 1, pp. 57-61, DOI: 10.1241/johokanri.57.57(2014) [石塚 14] 石塚 満:Web 技術から見て第五世代コンピュータを考え る,人工知能,Vol. 29, No. 2, pp. 120-126(2014)

著 者 紹 介

小柴  等(正会員) 2008年北陸先端科学技術大学院大学知識科学研究 科博士後期課程修了.博士(知識科学).国立情報 学研究所,産業技術総合研究所を経て文部科学省科 学技術・学術政策研究所.政策立案に資することを 目的とした科学技術・学術動向のマイニングに従事. 情報処理学会,サービス学会,IEEE 各会員. 林  和弘 1997年東京大学大学院理学系研究科博士課程中退. 同年,社団法人日本化学会(当時)に勤務.2012 年 より文部科学省科学技術・学術政策研究所上席研究 官.内閣府国際的動向を踏まえたオープンサイエン スに関する検討会委員などを歴任.日本化学会では 世界的にも黎明期にあった学術英文誌の電子ジャー ナル化と事業化に大学院生時代より取り組み,学術 情報流通のオープン化によるパラダイムシフトに興味をもつ.学術情報 流通,図書館情報学,オープンサイエンス,科学技術予測が専門.研究・ イノベーション学会,アメリカ化学会,日本化学会,情報科学技術協会, 学術 XML 推進協議会各会員.

参照

関連したドキュメント

重回帰分析,相関分析の結果を参考に,初期モデル

状態を指しているが、本来の意味を知り、それを重ね合わせる事に依って痛さの質が具体的に実感として理解できるのである。また、他動詞との使い方の区別を一応明確にした上で、その意味「悪事や欠点などを

状態を指しているが、本来の意味を知り、それを重ね合わせる事に依って痛さの質が具体的に実感として理解できるのである。また、他動詞との使い方の区別を一応明確にした上で、その意味「悪事や欠点などを

自ら将来の課題を探究し,その課題に対して 幅広い視野から柔軟かつ総合的に判断を下す 能力 (課題探究能力)

 介護問題研究は、介護者の負担軽減を目的とし、負担 に影響する要因やストレスを追究するが、普遍的結論を

究機関で関係者の予想を遙かに上回るスピー ドで各大学で評価が行われ,それなりの成果

 第一の方法は、不安の原因を特定した上で、それを制御しようとするもので

研究計画書(様式 2)の項目 27~29 の内容に沿って、個人情報や提供されたデータの「①利用 目的」