1.は じ め に
オープンデータは,誰でも自由に使えて,再利用がで き,再配布できるデータである.日本政府は,2012 年 より行政機関における下記の三つの目的を掲げ,オープ ンデータの取組みを推進している*1. (1)透明性・信頼性の向上 (2)国民参加・官民協働の推進 (3)経済の活性化・行政の効率化 具体的には,行政機関が保有する予算,経済,人口, 地理,気候,交通などの多種多様なデータを,プライバ シー保護に配慮したうえで積極的に公開し,官民での利 活用を促進することにより,既存業務の効率化や新規事 業の創出をめざしている. 2014年 10 月には,日本政府のデータカタログサイ ト「DATA.GO.JP*2」の本格運用を内閣官房が開始した. オープンデータ公開の取組みは自治体にも広がってお り,47 中 21 都道府県(44.6%),1 852 中 130 市区町村 (7%)が公開している*3(2015 年 5 月 21 日現在).世 界規模でのオープンデータ公開状況調査「オープンデー タインデックス 2014*4」によると,日本は 2013 年の 27位から 19 位に順位を上げた. 本稿では,国内行政機関におけるオープンデータのこ れまでの取組みと今後の課題を俯瞰する.2 章では,日 本政府におけるオープンデータの推進動向を年表ととも に紹介し,政府の工程表(ロードマップ)についても示す. オープンデータの取組みは,「公開」と「利活用」の二 つの目的に大別できる.3 章では各組織における「公開」 の取組みを紹介し,4 章では「利活用」の取組みを紹介 する.その中で各取組みを推進するうえでの課題につい ても触れる.最後に 5 章でまとめを述べる.2.日本政府による取組み
2・1 オープンデータの推進動向 表 1 は,2012 年からの日本の政府,中央省庁,自治 体によるオープンデータの推進動向をまとめた年表であ る.表内の矢印は,関連する取組みを対応付けている. 中央省庁および自治体については,3 ∼ 4 章で紹介する 取組みを明記した. 日本では,2012 年 7 月,内閣官房の高度情報通信ネッ トワーク社会推進戦略本部(IT 総合戦略本部)が中心 となり,「電子行政オープンデータ戦略*1」を決定した. その中で,オープンデータを用いた経済活性化・行政効 率化のための取組み,機械判読可能で二次利用可能な形 式でのデータ提供,官民による実務者会議の設置を実施 することを示した.同月には「日本再生戦略*5」,11 月 には「日本再生加速プログラム*6」を閣議決定し,オー プンなライセンスを付与した二次利用可能な形式での データ提供や,上記の実務者会議をただちに設置するこ とを示した.これらを受け,同年 12 月,IT 総合戦略本 部に電子行政オープンデータ実務者会議*7(以下,実務 者会議とする)が設置された.IT 総合戦略本部は,IT 活用による施策推進を目的として政府が設置した組織で あるのに対し,実務者会議は,具体的なオープンデータ 施策検討を目的とした組織である. 2013年 1 月には,オープンデータ公開の環境整備をオープンデータ普及促進に向けた
国内行政機関の取組み
Latest Activities for Promoting the Spread of Open Data in Japanese
Public Sector
浅野 優
株式会社日立製作所Yu Asano Hitachi Ltd.
Keywords:
open data, linked open data, Japanese public sector, etc. 「Linked Data とセマンティック技術」 *1 http://www.kantei.go.jp/jp/singi/it2/pdf/ 120704_siryou2.pdf *2 http://www.data.go.jp/ *3 http://fukuno.jig.jp/2014/opendatajpstat *4 http://index.okfn.org/place/japan/ *5 http://www.cas.go.jp/jp/tpp/pdf/2012/2/10. 20120918_5.pdf *6 http://www5.cao.go.jp/keizai1/keizaitaisaku/ 2012/1130_01taisaku.pdf *7 https://www.kantei.go.jp/jp/singi/it2/densi/図るための試験サイトとして,経済産業省(以下,経 産省とする)が Open DATA METI(β版)*8(以下,
Open DATA METIとする)を公開した.
2013年 6 月に閣議決定された「世界最先端 IT 国家創 造宣言*9」では,オープンデータ推進のため,次の目標 を掲げた. (1)電子行政オープンデータ戦略に基づくロードマッ プを策定・公表 (2)2013 年度から公開データの自由な二次利用を認 める利用ルールの見直しを行うとともに,機械判読 に適した国際標準データ形式での公開を拡大 (3)各府省が公開するデータの横断的検索などを可能 とするデータカタログサイトの試行版を 2013 年度 中に立ち上げ,2014 年度から本格運用を実施 また,2014 ∼ 15 年度を集中取組期間と位置付け, 2015年度末には他の先進国と同水準の公開内容を実現 することとした.同月,閣議決定した「日本再興戦略─ JAPAN is BACK─*10」でも 2015 年度中に世界最高水 準の公共データの公開内容(データセット 1 万件以上) を実現するとしている.実務者会議では,上記目標の(1) に関する「電子行政オープンデータ推進のためのロード マップ*11」と,(2)に関する「二次利用の促進のため の府省のデータ公開に関する基本的考え方*12」の検討 を進めており,同月,両者を公開した. 2013年 6 月には,日本を含める G8(主要 8 か国)が「G8 オープンデータ憲章*13」に合意し,これに伴い,日本は「日 本のオープンデータ憲章アクションプラン*14」を公開 した.その中で,統計や地理空間などに関する「価値の 高い」データの公開,活用事例の紹介,イノベータの支 援を実施することを示した.同年 12 月には,内閣官房 が DATA.GO.JP の試行版を公開した.このサイトでは, 中央省庁などの各組織が公開するオープンデータの横断 的検索が可能である. 2014年 6 月には,「二次利用の促進のための府省のデー タ公開に関する基本的考え方」が改定された*15.同時 に,各府省がホームページで公開するコンテンツの二次 利用を広く認めるための新たな利用規約として「政府標 準利用規約(第 1.0 版)*16」を決定した.同月の「世界 最先端 IT 国家創造宣言」の改定*17では,公共データの 利用促進に係る取組みを実施していくことが新たに追加 された.具体的には,データカタログサイトの掲載デー *8 http://datameti.go.jp/ *9 https://www.kantei.go.jp/jp/singi/it2/kettei/ pdf/20130614/siryou1.pdf *10 http://www.kantei.go.jp/jp/singi/ keizaisaisei/pdf/saikou_jpn.pdf *11 https://www.kantei.go.jp/jp/singi/it2/kettei/ pdf/20130614/siryou3.pdf *12 https://www.kantei.go.jp/jp/singi/it2/cio/ dai52/kihon.pdf *13 http://www.kantei.go.jp/jp/singi/it2/densi/ dai4/sankou8.pdf *14 https://www.kantei.go.jp/jp/singi/it2/cio/ dai53/plan_jp.pdf *15 http://www.kantei.go.jp/jp/singi/it2/densi/ kettei/data/gl26_honbun.pdf *16 http://www.nhds.go.jp/~zenshoen/zenshoen_gl_ betten_1.pdf *17 http://www.kantei.go.jp/jp/singi/it2/kettei/ pdf/20140624/siryou1.pdf 表 1 日本国内のオープンデータ年表
タの利用促進,各府省が公開するデータベースの API (Application Programming Interface)機能と利用方法 をまとめた API の総合カタログの提供などである.自 治体については,自治体におけるオープンデータの取組 みに関する考え方の整備をはじめ,公共データの流通・ 連携・利活用を効率的に行うための技術の開発・実証や, データを一元的にオープン化する基盤の構築などが実施 項目として追加された.この工程表については 2・2 節に 示す. 2014年 10 月には,内閣官房が DATA.GO.JP を本格 稼働させた.同月,独立行政法人情報処理推進機構(IPA) は共通語彙基盤コア語彙 2.0(検証版)*18を公開し,翌 年 2 月に正式版*19を公開した.詳細は 3・1 節 §4 に示す. 2015年 2 月には,自治体のデータ公開を支援するガ イドライン*20や手引き*21が公開された. 2・2 オープンデータ推進のための工程表 図 1 は,2014 年 6 月に改定された「世界最先端 IT 国 家創造宣言 工程表*22」の概要である.図中の灰色の項 目は,改定の際に追加された項目である.工程表には, オープンデータを推進するうえで重要になる四つの取組 みが示されている.それは,(1)二次利用を促進する利 用ルールの整備,(2)データカタログの整備,(3)デー タカタログの公開内容拡大,(4)公共データ利活用促進 である.また,重要なマイルストーンとして,2015 年 度末までに他の先進国と同水準のオープンデータの公開 と利用を実現することである.2013 年度には,データ カタログの試行版を立ち上げ,2014 年度以降に本格的 に運用していくことが明記されている.オープンデータ の取組みはこの工程表に沿って実施されており,2・1 節 で示したとおり,2014 年 10 月から DATA.GO.JP が本 格運用されている.
3.オープンデータ公開の取組み
オープンデータ公開の取組みは,中央省庁によるもの だけではない.生活により密着した豊富なデータを公開 する自治体による取組みや,オープンデータを再利用し やすい形式に変換し,公開する市民の取組みは,行政サー ビスの向上や地域経済の活性化につながることが期待さ れる.本章では,国内の中央省庁,自治体,市民によるオー プンデータ公開の取組みと今後の課題について述べる. 3・1 中央省庁による公開の取組み§ 1 経産省による Open DATA METI
経産省は,2012 ∼ 13 年度に「オープンデータ(推進) に関する調査研究」を行った [日立コンサルティング 13, 日立コンサルティング 14].その中で,同省と関連する 外局や独立行政法人が保有するデータをオープンデー タとして試験的に公開するポータルサイト Open DATA METI*8の構築とその利活用に関する調査研究を実施し た.本サイトは,国内初となる大規模な公式オープンデー タポータルサイトである.
Open DATA METIは主に二つのサイトからなる.一
つはオープンデータを探し出すためのカタログサイト*23
である.もう一つは,探し出したオープンデータを利活 用するために,データの内容を検索したり,複数のデー タを連携したりする LOD(Linked Open Data)検索サ イト*24である.前者で扱うデータは形式不問(5 star Open Data*25における一∼五つ星レベル)であるのに 対し,後者は機械判読可能な LOD(五つ星レベル)で ある. カタログサイトは,各組織が保有するオープンデータ の情報を Web 上の 1 か所にまとめて提供する.各オー プンデータの情報は,タイトル,カテゴリー,データ形 式,ライセンスの種別,Web 上のデータ提供場所(URL) などをメタデータとして収集したものである.カタログ サイトには,メタデータを使った柔軟な検索が可能な オープンソースソフトウェア CKAN*26を用いている. CKANは,英国・米国のカタログサイトでも使用されて いる.2012 年度末における公開データセット数は,白 書および統計情報を中心に 196 件であったが,2013 年 度には,G8 オープンデータ憲章における「価値の高い」 データ(地理空間や防災など)が追加され,同年度 2 月 には 2 242 件となった.また,データセットに含まれる *18 http://imi.ipa.go.jp/ns/200/ *19 http://imi.ipa.go.jp/ns/core/Core22.html *20 https://www.kantei.go.jp/jp/singi/it2/densi/ kettei/opendate_guideline.pdf *21 https://www.kantei.go.jp/jp/singi/it2/densi/ dai9/siryou2-4.pdf *22 https://www.kantei.go.jp/jp/singi/it2/kettei/ pdf/20140624/siryou3.pdf *23 http://datameti.go.jp/data/ja *24 http://datameti.go.jp/sparql *25 http://5stardata.info *26 http://ckan.org/ 図 1 オープンデータ推進のための工程表
データファイル(リソース)の総数は約 4 万件である. 後者の LOD 検索サイトは,LOD に変換したオープン データの内容を検索・連携するためのサイトである.具 体的には,まず,連携可能性の高い,工業統計調査,経 済センサス,エネルギー消費統計に含まれる六つの統計 表と,一部の企業データを約 300 万個の RDF(Resource Description Framework)*27に変換した.それらを,統 計センターが公開する都道府県・市区町村を表すコー ド*28や DBpedia Japanese*29などのコードへ対応付 けることにより,LOD 化し,それらを検索するための サイトを公開した.この取組みを通じ,実際の統計表 を LOD 化する際の課題や,LOD 化によるデータ連携 のしやすさが確認された.詳細は,[浅野 13, Asano 14, Koide 13, 小出 15, 武田 13] にて発表されている. § 2 内閣官房による DATA.GO.JP 内閣官房は,2013 年 12 月に,データカタログサイ ト DATA.GO.JP 試行版を構築し,公開した.このサイ トでは,各府省の保有データをオープンデータとして公 開し,データの横断的検索などの機能も提供している. Open DATA METIでの調査結果を参考に構築しており, カタログソフトウェアには CKAN を用いた.試行版に は主に四つの機能があった.それは,府省のデータの横 断検索機能,API 機能,関連する取組みへのリンク情 報,利用者からの意見受付け機能である.試行版公開時 に 10 366 データセットあり,「日本再興戦略─ JAPAN is BACK─* 10」で示された 2015 年度末までの成果目 標「データセット 1 万以上の公開」を 2013 年度中に実 現した.2014 年 10 月には本格版に移行し,試行版の運 用段階で寄せられた利用者からの意見などを踏まえ,三 つの機能改善が実施された.一つ目はトップページにお ける検索窓の追加や,複数の検索ワードによる検索の精 度の向上などのユーザインタフェースの改善である.二 つ目はデータの更新時に利用者に通知する機能の追加で ある.三つ目は,G8 オープンデータ憲章における「価 値の高い」データの追加である.その他,データ利活用 のための開発者向けの情報や,DATA.GO.JP の訪問者統 計情報なども公開している.今後は,データの範囲を拡 大し,データの質の向上を図るとしている. § 3 総務省による統計データの API 公開 総務省は,2013 年 6 月 10 日から,独立行政法人統計 センターが運用する「次世代統計利用システム*30」上 で,統計データに関する API 機能の試行運用を開始した. 試行運用で利用可能な統計データは,国勢調査,労働力 調査,消費者物価指数,家計調査など総務省統計局所管 統計の約 32 000 表であった.2014 年には政府統計の総 合窓口(e-stat)の機能*31として本格運用を開始した. 本格運用では,学校基本調査,農林業センサスなどを加 え,合計 57 統計,約 74 000 表とデータ量を大幅に拡大 した.また,GIS 機能の提供も「地図による小地域分析 (jSTAT MAP)*32」として 2015 年 1 月より本格運用し ている.これは,ユーザが任意に指定したエリアにおけ る統計を算出する機能である.これにより,GIS 分析シ ステムをもっていない企業や自治体でもマーケティング や防災などの目的での利活用ができるようになる.API 機能,GIS 機能とも例を用いた利用方法の説明がされて おり,利活用促進の試みがなされている. § 4 IPA による共通語彙基盤の整備 IPAは,2014 年 10 月に共通語彙基盤コア語彙 2.0(検 証版)*18を公開し,2015 年 2 月に正式版*19を公開した. これは,氏名,住所,組織など,社会生活で使用される中 核的な用語の集合である.同じ単語を違う意味で使うこ とによる誤解や,違う単語を同じ意味で使うことによる 意思疎通の不便さを解消することを目的としている.こ の語彙をデータ表現に用いることで,システム間でのデー タの交換や連携における表現の対応付けが不要になるた め,データの交換や連携を効率的に行うことができる. 3・2 自治体による公開の取組み § 1 福井県鯖江市 鯖江市は「データシティ鯖江」をスローガンに掲げ, 2012年 1 月,他の自治体に先駆けてオープンデータの 公開を開始した.例えば,公衆トイレや AED(自動体 外式除細動器)の位置,地図,コミュニティバスの位 置などの情報を公開している*33.データ形式は CSV (Comma-Separated Values)のほか,一部のデータに RDFを採用している.また,情報提供用の API も公開 している.この取組みは,地元の IT 企業による施策の 提言や公開データを利活用したアプリケーション作成な ど市と民間の協働により推進されている. § 2 神奈川県横浜市 横浜市のオープンデータの取組みは,民間の取組みに 後押しされるようにボトムアップで行われてきた点が特 徴である.2012 年にエンジニアや起業家,研究者など が集い,横浜におけるオープンデータの取組みを民間側 から進めるための NPO として「横浜オープンデータソ リューション発展委員会*34」が設立された.データを 活用して政策課題を解決することを目的としたイベント の開催や,オープンデータの技術や制度の検討提案など を継続的に行っている.この動きに触発され,市もオー *27 http://www.w3.org/RDF/ *28 http://statdb.nstac.go.jp/wp/wp-content/ uploads/2013/12/sac-spec.pdf *29 http://ja.dbpedia.org/ *30 http://statdb.nstac.go.jp/ *31 http://www.e-stat.go.jp/api/ *32 https://jstatmap.e-stat.go.jp/gis/nstac/ *33 http://data.city.sabae.lg.jp/ *34 http://yokohamaopendata.jp/
プンデータ公開に向け動き出した.これまでに,横浜市 は,オープンデータ流通環境の実現に向けた基盤整備を 推進することを目的に産官学が共同で活動しているオー プンデータ流通推進コンソーシアム*35や,政府の実務 者会議への参加をはじめ,官民の各団体の取組みに対す る支援も積極的に行っている.2013 年 5 月には,オー プンデータ推進プロジェクトを設け,2014 年 3 月には「横 浜市オープンデータの推進に関する指針*36」を策定し, 統計情報などのオープンデータ化を進めた.7月には,「よ こはまオープンデータカタログ(試行版)*37」を開設した. 統計のほかにも政策情報紙や金沢区の子育て関連情報も 公開している.民間からボトムアップにデータ公開が進 められているため,データの利活用も進んでいる. § 3 静岡県 静岡県は,オープンデータのポータルサイト「ふじの くにオープンデータカタログ*38」を 2014 年 8 月に開設 した.本取組みの特徴は,サイト構築からサーバの設定, データの整理まで,すべて県の職員だけで実施した点で ある.サイトには,県内の自治体のデータメンテナンス やユーザからのフィードバックのためのアンケート機能 の実装なども考慮し,国立情報学研究所が次世代情報共 有基盤システムとして開発した NetCommons*39を採用 している.静岡県では,大地震のリスクが高いこともあ り,すでに公開していた GIS の防災系データからオー プンデータ化を始めた.防災情報をはじめ,富士山の写 真や観光情報,公共施設情報なども公開している.デー タ形式は,CSV や XML,一部のデータに RDF を採用 している.現在では,データ公開の動きは県内の各市町 にも広がり,県のデータに加え,22 市町のデータも公 開している.県だけでなく市町も含めた公開に取り組む ことで,県や市町独自で公開する場合に比べ,多くの利 用者にデータを見てもらえる機会が増え,その効果とし てデータ利活用の展開が期待される.さらに,山梨県と 連携して,位置情報付きの富士山の投稿写真をオープン データとして公開する「富岳 3776 景*40」を開設するなど, 県内だけでなく,他県との連携も図っている. 3・3 市民による公開の取組み 行政機関が公開しているオープンデータには,機械判 読可能な形式で公開されていないものが多いが,それら を機械判読可能な形式に変換し,公開する市民や団体に よる取組みがある.例えば,横浜市金沢区の公園*41や, 北海道室蘭市の避難所*42などの情報が LOD として公開 されている. 3・4 オープンデータ公開における課題 § 1 オープンデータの定義が共有されていない オープンデータは,誰でも自由に使えて,再利用がで き,再配布できるデータとして定義されている*43.一 方で,データの利用に用途や資格などの制約が課せられ, 上記の定義を満たしていないにもかかわらず,オープン データと称している場合がある.こういった言葉の誤用 は,データ提供者が意図していないデータの使用や,デー タ利用者の混乱を招く恐れがある.このような状況を防 ぐために,オープンデータの基準を満たしていないデー タを「準オープンデータ」と呼び,オープンデータと明 確に区別していこうとする動きがある*44.明確に区別 することで,「準オープンデータ」を「オープンデータ」 にしていくことを意識できるため,オープンデータの増 加にもつながることが期待できる. § 2 オープンデータを公開していない自治体が多い 都道府県で 55.4%,市区町村で 93%がオープンデー タを公開していない*3(2015 年 5 月 21 日現在).一方 で,総務省の調査研究*45によると,都道府県と市区町 村において,オープンデータの取組みに関心があり,情 報収集段階にある自治体や,取組みを進める方向で具体 的に検討している自治体は増加している.また,このよ うな自治体では,オープンデータの取組みを進めるうえ で,「具体的な利用イメージやニーズの明確化」や「提 供側の効果・メリットの具体化」といった課題があると 報告されている.これらに対し,行政機関やその他の団 体による先進的な公開・利活用の取組みを評価し,事例 とその効果・メリットを共有していくことが重要となる. § 3 データ検索が容易ではない オープンデータ公開サイトには,カタログ機能を備え ているものと,そうでないものがある.カタログ機能と は,登録されているデータのメタデータを管理・公開す る機能と,そのメタデータを用いたデータ検索機能であ る.メタデータを用いたデータ検索は,一般的なキーワー ド検索とは異なり,特定の項目の内容を対象に検索する 「フィールド検索」が可能となる.例えば,タイトルに「白 書」が含まれているデータや,カテゴリーが「統計」で あるデータを簡単に見つけだすことができる.この機能 により,キーワード検索に比べ,データの検索容易性が 向上し,データの利活用が促進されることが期待できる. 現在,オープンデータを既存のホームページの一部に公 *35 http://www.opendata.gr.jp/ *36 http://www.city.yokohama.lg.jp/seisaku/ seisaku/opendata/odshishin.pdf *37 http://www.city.yokohama.lg.jp/seisaku/ seisaku/opendata/catalog.html *38 http://open-data.pref.shizuoka.jp/ *39 http://www.netcommons.org/ *40 http://fugaku3776.okfn.jp/ *41 http://yokohama.openpark.jp/api *42 http://linkdata.org/work/rdf1s2305i *43 http://opendefinition.org/ *44 http://www.glocom.ac.jp/chijo_lib/119/004-015_shoji.pdf *45 http://www.soumu.go.jp/johotsusintokei/ linkdata/h26_07_houkoku.pdf
開しているサイトでは,メタデータを公開していても, メタデータを用いた検索機能が備わっていない場合が多 い.そのため,今後は,上記のカタログ機能を整備して いくことが望まれている. カタログ機能を備えたサイトの構築には,CKAN な どのデータカタログソフトウェアを用いることが考えら れる.それは,データカタログソフトウェアが,カタロ グ機能の実現を目的に実装されているためである.デー タカタログソフトウェアを用いたサイトを公開する自治 体が増えると,二つの副次的な効果も期待できる.一つ は,メタデータの登録・修正・削除が容易になるため, メタデータの鮮度向上とデータ公開の促進である.もう 一つは,同一データカタログソフトウェアを使用したサ イト同士のデータは簡単にまとめることができるため, 複数の自治体のデータをまとめて,一括で検索すること が容易になることである.一方で,データカタログソフ トウェアを用いたサイトの構築には,ホームページの一 部にオープンデータを公開する場合に比べ,システム構 成が複雑になるといった課題がある.そのため,容易に 構築できる方法が求められている. § 4 オープンデータ公開にかかる作業コストが高い オープンデータ公開には,データの棚卸,公開データ の選定,メタデータの収集,公開サイトの構築,さらに は,データの機械判読化などの作業が新たに発生する. この課題に対しては,オープンデータ流通推進コンソー シアムの後身組織である VLED*46において,オープン データ公開を支援するツールの検討が進められている. 例えば,メタデータの収集を支援するツールや,表デー タが機械判読に適した形式の指針*47に沿っているかを チェックするツールである*48.しかし,これらは各作 業における一部分を支援するツールであるため,残りの 作業を効率化するツールも整備していく必要がある.そ れらのツールの実現には,さまざまな技術の適用が考え られる.以下にいくつかの例を示す. 例えば,データの棚卸は,ホームページによる公開デー タや,各組織内に存在するデータを対象に行う.前者で は,クローリング技術が有効である. 各データのタイトルや作成課,公開日といった,メ タデータを収集するためには,クローリングしてきた HTML文書からメタデータを抽出する Web スクレイピ ング技術や,一般的な文書やデータからの情報抽出技術 が必要になる.また,カテゴリーやタグなどあらかじめ 選択肢が決まっているメタデータに関しては,文書分類 技術により,それらが自動付与できる.これにより,メ タデータを非属人的に付与できるといった効果も期待で きる. データの機械判読化ではデータの形式と語彙を統一す る必要がある.例えば,データ形式には CSV や RDF, 語彙には共通語彙基盤などの標準化された語彙を採用 する.XLS や CSV から RDF へ変換する場合であれば, 記述内容の構造を認識し,三つ組(主語─述語─目的語) の形式へ変換する技術が必要となる.語彙の統一化には, もともと記述されている表記に対応する固有 ID を見つ ける技術が必要となる.上記のようなツールを整備し, 共有していくことで,オープンデータを公開する自治体 数の増加や,公開データの拡大が期待できる.
4.オープンデータ利活用の取組み
オープンデータ利活用においても,中央省庁,自治体, 市民がそれぞれの立場でさまざまな取組みを行ってい る.中央省庁はオープンデータの流通・連携・利活用の 促進を主な目的とし,自治体は行政サービスや地域の課 題解決を目的としている.本章では,各立場による利活 用の取組みと今後の課題について述べる. 4・1 中央省庁による利活用の取組み § 1 総務省による実証実験 総務省では,複数の分野をまたいだデータの流通・連 携・利活用を効果的に行うことを目的に情報流通連携基 盤共通 API の実証実験を 2012 年度から実施してきた. 共通 API とは,データの総合運用性を確保するための共 通のデータ形式や通信規約のことである.2012 年度に は,公共交通,地盤,災害など 5 分野の API を用意した. 2013年度には自治体行政,観光,花粉症などの新たな 7 分野を対象にした.また,7 分野のデータを活用した優 秀作品を表彰するアプリコンテスト*49を実施すること で,データ利活用のユースケースが創出され,オープン データの利活用を促進させた.受賞作品には,花粉飛散 量と Twitter 投稿解析を組み合わせた総合花粉情報提供 アプリ*50や,自治体の避難所や AED などの情報を利活 用して位置情報付きの写真をゲーム感覚で収集するアプ リなどがある.2014 年度には,自治体が管理する道路 や公園,学校,公民館などの施設情報をオープンデータ として公開した.この取組みにより,住民の利便性の向 上や社会的な課題の解決などにオープンデータが寄与で きることが実証された. § 2 経産省による取組み 経産省では,オープンデータ利活用に向け,主に二つ の取組みを行っている.一つは,市民参加型のイベント *46 https://www.vled.or.jp/ *47 http://www.opendata.gr.jp/news/docs/opendata-guide-v1.pdf *48 http://www.vled.or.jp/committee/docs/ 20150303_tech_siryo1.pdf *49 http://www.opendata.gr.jp/2013contest/award/ index.html *50 http://kahunkun-dev.cloudapp.net/pc/index. html究所との共同研究で「オープンデータを活用した災害 に強い地域づくり事業*56」を推進している.その中で, 大雨により浸水被害が予想される地域,地震による各地 域の揺れやすさ,避難所などの防災情報をオープンデー タとして公開している.ほかにも公共施設所在地,AED 設置場所,Wi-Fi 設置場所なども公開しており,利活用 に向けたイベント開催も盛んに行っている.例えば,小 学生を対象としたイベントや,「子育て」,「自然環境」,「防 災」などをテーマにしたアイデアソン,中高生を対象と したハッカソン*57などさまざまなイベントを開催して いる. 4・3 市民による利活用の取組み 日本各地で市民自らが技術を活用することで地域課題 を解決しようとする動き「Civic Tech」が活発化している. Civic Techを支援する非営利団体 Code for Japan*58
が中心になり,各都道府県や市区町村の団体が,各地 域の課題を解決するためのアイデアソンやハッカソン などのイベントを開催している.その成果の一部は, Knowledge Connectorにて公開されている.本章では, 市民による三つの利活用例を紹介する. § 1 ご当地なび*59 現在位置から,周辺 500m/1km/2km エリアの避難所 情報,観光情報,小説・アニメ情報などをまとめて知る ことができるアプリケーションである.地図を使った目 的地へのナビゲーション機能も備えている.利用してい るデータは,京都市,奈良市,海南市,藤井寺市,羽曳 野市に関するオープンデータである. § 2 PUSH 大阪*60 自治体が公開している RSS の情報を使用し,利用者 の興味に応じて,自治体の情報を簡単に取得できるアプ リケーションである.大阪市のデータを用いた「PUSH 大阪」のほかに,汎用版の「PUSH 広報」も提供している. § 3 GEEO*61 総務省統計局や国土交通省が公開するオープンデータ を利用し,日本各地の不動産価格を推測するシステムで ある.地点の座標や不動産の条件を入力することにより, JSON形式で予測価格を取得することができる.それぞ れのマンションや一軒家の販売価格の推測には,機械学 習技術を用いている.
の開催である.2013 年度には Open DATA METI にて
公開している統計表を用いたアイデアソン*51とビジュ アライズソン*52を開催した.その成果として,さまざ まな社会課題の解決に寄与する作品が創出された.また, データの価値の具体的なイメージを,データの提供側で ある官と利活用側である民の間で共有することができ た. もう一つは,オープンデータ公開の本来の目的の一 つである,データを活用したビジネス創出のための取組 みである.具体的には,2014 年度より,オープンデー タを活用したビジネス創出のためのマッチング支援サイ ト「Knowledge Connector(β 版)*53」を公開している. 本サイトでは,全国的に開催されているオープンデー タを活用したイベントの成果(アイディアやアプリケー ションなど)を集約し,一元的な検索を可能にすること で,アイディアやアプリケーションを創出した人とビジ ネスパートナとのマッチングを支援している. 4・2 自治体による利活用の取組み § 1 福井県鯖江市 鯖江市のオープンデータは,地元の IT 企業との協働 により推進されている.そのため,市の公開データを利 用した多数のアプリケーションが作成されてきた*54.例 えば,公衆トイレや AED までの徒歩ルートを表示する アプリケーションや,コミュニティバスの GPS 情報か らバスの現在地がわかるアプリケーションなどがある. また,データの二次利用促進を目的とした,アイデアソ ンやアプリコンテストを積極的に開催している. § 2 神奈川県横浜市金沢区 金沢区では,これまで複数の局区が別々にホームペー ジで公開していた子育てに関連する情報を LOD 化し, 情報の検索や一元配信ができる「かなざわ育なび net*55」 を構築した.「子供の生年月日」や「郵便番号」を入力 することでパーソナライズできる機能も備えている.こ の機能により,生年月日ごとに決められている乳幼児健 診日程や,郵便番号の場所に近い保育園での対象年齢ク ラスの空き状況,年齢に応じた予防接種などの情報を提 供している.LOD により,市民が必要な情報を探し回 るのではなく,市民の属性に応じて必要な情報が収集さ れるサービスを容易に実現している. § 3 千葉県流山市 流山市は 2013 年より,独立行政法人防災科学技術研 *51 「アイデアソン」とは,「アイデア」と「マラソン」からなる 造語で,さまざまな参加者がグループになり,アイディアを出 し合い,それをまとめていく形式のイベントである. *52 「ビジュアライズソン」とは,「ビジュアライズ」と「マラソ ン」からなる造語で,データの分析結果などを効果的に可視化 するイベントである. *53 http://idea.linkdata.org/ *54 http://data.city.sabae.lg.jp/applications/ *55 http://kirakana.city.yokohama.lg.jp/ *56 http://ecom-plat.jp/nagareyama/group.php?gid =10303 *57 「ハッカソン」とは,「ハック」と「マラソン」からなる造語 で,プログラマが集い,技術とアイディアを競い合う開発イベ ントである. *58 http://code4japan.org/ *59 https://itunes.apple.com/jp/app/go-dang-denabi-misasaginabi/id398326620?mt=8 *60 http://push.jp.net/ *61 http://geeo.otani.co/
4・4 オープンデータ利活用における今後の課題 § 1 利活用事例を共有する環境がない 利活用事例を共有する場が求められている.例えば, オープンデータを利活用した地域課題の解決のための事 例とその効果を公開することで,他の自治体でも同様の 取組みを行いやすくなる. § 2 利活用のためのツールが整備・共有されていない データを利活用するためには,データの収集,整形, 連携,検索,解析といった処理を行う.そのため,それ らを効率化するツールを整備する必要がある.例えば, 多様な形式や表現を用いたオープンデータから,組合せ 可能なデータを探し出し,それらを適切に組み合わせて, 効率的に有用なアプリケーションを開発するツールの整 備が考えられる.その実現には,3・4 節 §4 で述べたよ うなさまざまな技術の適用が必要になる.また,開発し たツールを,無償・有償にかかわらず,共有することも 重要である. § 3 利活用事例を継続的に創出していく必要がある 中央府省や自治体におけるオープンデータ公開の動き が進むにつれ,さまざまな分野におけるデータが二次利 用可能な形式で公開されている.この動きは日本だけで なく,世界中で活発化している.さまざまな技術を使い, オープンデータを利活用することで,多くの社会課題や 地域課題などを解決する事例を創出することが,我々, 研究者に期待されている.また,国内において,オープ ンデータを活用したビジネスを創出していくことも今後 の課題である.
5.お わ り に
本稿では,国内の行政機関を中心に,オープンデータ のこれまでの取組みを紹介し,今後の課題について述べ た.日本政府は,2012 年に電子行政オープンデータ戦 略を策定し,2013 年にオープンデータ推進のための工 程表を公開し,諸外国の取組みや国内での実証の状況を 反映する形で工程表を修正しながら,オープンデータの 取組みを推進している.オープンデータの「公開」と「利 活用」の促進には,行政,民間企業,市民の協働が重要 であり,今後も三者が協働していくことが必要となる. そして,日本全体や各地域の持つ社会課題の解決だけで はなく,2020 年東京オリンピック・パラリンピックな どのイベントをターゲットにしたオープンデータの利活 用も期待される. 謝 辞 本稿の執筆にあたり,貴重なご助言をいただきました 株式会社日立製作所の岩山 真氏に感謝申し上げます.◇ 参 考 文 献 ◇
[浅野 13] 浅野 優 ほか:統計データの RDF 化のためのテンプレー ト,情報処理学会第 12 回情報科学技術フォーラム講演論文集 (2013)[Asano 14] Asano, Y., et al.: A template for handling statistical data in RDF, 2nd Int. Workshop on Semantic Statistics (SemStats 2014)(2014) [日立コンサルティング 13] 日立コンサルティング:「オープン データに関する調査研究」報告書,経済産業省,http:// d a t a m e t i . g o . j p / d a t a / j a / s t o r a g e / f /2013-06-12T032111/H24-opendata-report.pdf(2014) [日立コンサルティング 14] 日立コンサルティング:「オープンデー タ推進に関する調査研究」報告書,経済産業省,http://www. meti.go.jp/meti_lib/report/2014fy/E004103.pdf (2015)
[Koide 13] Koide, et al.: An LOD practice lessons ad learned from open data METI, Joint Int. Workshop on LDPW and PAOS, JIST(2013) [小出 15] 小出誠二 ほか:企業コードと XBRL データの LOD 化, 人工知能学会第 35 回セマンティックウェブとオントロジー研 究会,http://sigswo.org/papers/SIG-SWO-035/SIG-SWO-035-09.pdf(2015) [武田 13] 武田英明 ほか:統計データの LOD 化とデータ間の関係 の表現,人工知能学会第 27 回全国大会(2013) 2015年 6 月 15 日 受理