• 検索結果がありません。

データジャケットを用いた異分野データ連携

N/A
N/A
Protected

Academic year: 2021

シェア "データジャケットを用いた異分野データ連携"

Copied!
9
0
0

読み込み中.... (全文を見る)

全文

(1)

1.AI と デ ー タ

近年,データを資源と見ることで,蓄積された膨大な データを再利用し,さまざまな分析手法を用いた新しい 価値の発見や意思決定に役立てようという動きが活発に なってきている.特にビッグデータというキーワードが 流行し,分野を横断したデータの組合せと利活用によっ て,既存のサービスの付加価値向上や新製品の開発に対 する期待が高まってきている.さらに,昨今の人工知能 (AI)ブームの後押しもあり,その潮流はさらに加速し ているといえる. そこで問題となるのが,どのようにして価値あるデー タを入手し,どのような AI ツールを適用するのかと いうことである.AGFA(Apple,Google,Facebook, Amazon)や Twitter のように,一つの組織の中でデー タ分析の技術,データ,人材のすべてがそろっているこ とはまれである.普通の組織において,データを活用し, 新しい価値を発見したり,ビジネスを創出するデータ駆 動型イノベーションを実現するためには,組織間でデー タ分析の技術,データ,人材を流通させ,マッチングさ せることが重要となる.しかし,データ利用者や分析者 は誰が・どこに・どのようなデータをもっているのかを 知る方法は少ない.さらに,データ保有者には自身のデー タの新しい活用方法を見いだしたいというニーズがある ものの,組織を横断したデータの流通に対する不安の声 も聞く.データ駆動型イノベーションに対する期待があ るものの,超えなければならないさまざまな障壁が存在 する. そこで,著者らは,円滑なデータ取引や異業種のコラ ボレーションを実現するため,計算機ではなく人が読む ためにデータ概要や変数名を記述する「データジャケッ ト」を提案し,さまざまな領域において導入し,活用し てきた.本稿では,データジャケットを用いたデータの 価値発見と異分野データ連携の実例を示し,データ流通 および交換を促進する諸技術について紹介していく. さて,そもそも我々が扱おうとしている「データ」と は一体何なのであろうか.次章ではまず,データ,情報, そして知識について整理することから始めたい.

2.データ・情報・知識

[村上 80] は,人間の事実の認識(fact)は外界に存在 する情報(data)の取捨選択という行為によってつくり 出されるとした.[Hayashi 06] は村上の例を用い,同じ 物理的実態(外界に存在する情報)を観察する二人の問 題解決者は,それぞれのもつ知識や置かれたバックグラ ウンドなどの違いがつくり出す視点の差異によって,異 なる認知フィルタをつくり出すことを指摘した.すなわ ち,異なるフィルタを通して対象となる data を観察す ることで,両者は同一の data を観察しているにもかか わらず,異なった事実を構成し得ることを実験的に明ら かにした. 一方,[Boisot 04] は人間の事実の認識および外界に存 在する情報について,経済学や物理学の視点から,刺激 (stimuli),データ(data),情報(information),知識 (knowledge)として詳細にモデル化した.彼らによれば, データとは,物理世界(world)の刺激をある知覚可能 な範囲で取得したものである.つまり,知覚フィルタ (perceptual filters)を通して取得した物理世界の刺激が データとして取得される.そして,データは概念フィル タ(conceptual filters)を通して情報に変換される.知 覚フィルタおよび概念フィルタは,エージェントの認知 的・感情的期待(cognitive and affective expectations) によって調整される.この認知的・感情的期待が外界か ら得られた刺激を認識する人間のフィルタに影響するこ

データジャケットを用いた異分野データ連携

Cross-Disciplinary Data Exchange and Collaboration Using Data Jackets

早矢仕 晃章

東京大学大学院工学系研究科システム創成学専攻

Teruaki Hayashi Department of Systems Innovation, School of Engineering, The University of Tokyo. [email protected], http://teruaki-hayashi.weebly.com/

大澤 幸生

(同   上)

Yukio Ohsawa [email protected], http://www.panda.sys.t.u-tokyo.ac.jp/

Keywords:

data jacket, innovators marketplace, market of data, data exchange, design of data. 「AI とデータ─データに基づく意思決定と社会イノベーション創出─」

(2)

とは [Clark 97] や [Damasio 00] でも指摘されている. これらをまとめたものを図 1 に示す. [Sterman 00]はデータから得られる情報は概念フィル タによって構成される文脈に依存することの興味深い例 を示している.1974 年にオゾン層の破壊が指摘された が,多くの科学コミュニティはその事実に懐疑的であっ た.しかし,1985 年に南極のオゾンホールの存在が証 明されたことをきっかけに,NASA の科学者は再度デー タを精査した.すると,NASA は 1978 年からオゾン層 の破壊を示すデータを取得していたのである.つまり, 当初からオゾン層の破壊を示すデータを取得してきたに もかかわらず,そのような現象が存在することが認識さ れていなかったため,オゾン層の破壊という情報を得ら れていなかったのである.

3.データ市場におけるデータの交換

前章で説明したように,データから意思決定において 重要な情報を発見することは難しい.しかし,言い換え れば,適切な利用文脈を与えることによって,データは 思わぬ価値をもち得るということである.そこで,デー タを交換可能な材として扱うことによって市場に提供 し,データの利用方法および価値を策定するデータ市場 が発展してきた.交換とは,ステークホルダ間で合意さ れた条件を設定してデータを取引する戦略を意味する. しかし,データ市場という概念自体は新しいものではな い.19 世紀中期に Paul Reuter がパリとロンドン間で 電報による株式情報を売買していたという記録が残って いる [Dumbill 12].そして 20 世紀中期から,Thomson Reuters社や Bloomberg 社などがデータアグリゲータ (データを仲介する事業者)として利用者に対し,デー タの提供をビジネス化してきた.また,1980 年の IET Electronics & Power誌では,データ取得製品(センサ) とデータ送信技術の発展に伴い,データ市場が活性化す ることに言及している [EP 80].

その後,計算機の高度化と普及により多様なデータが やり取り可能となると,Web を新たなプラットフォーム

とするデータ市場が誕生した.すでに,Microsoft Azure, Data Market(2014 年 10 月 Qlik に買収),KDnuggets, Factual,Infochimps,Everypost(EverySense 社),Senseek (オムロン社)といった,データを売買・交換するサー ビスが登場してきた.以上のような,異なる分野のデー タを取引するためのプラットフォームの創生により, データの流通を促進させる仕組みがデータ市場の一形態 として提案され,サービスとして社会実装されてきてい る.また,個人のオンラインショップの購買履歴や健康 情報などを一括管理する情報銀行 [秋山 13, 砂原 14] の 運用が 2018 年から始まるなど個人の同意を得たパーソ ナルデータの流通も行われつつある.民間企業間のデー タ交換による新事業創出のための場であるデータエクス チェンジ・コンソーシアム(DXC)は,多数の事業者の ニーズを取り入れ,株式会社日本データ取引所に発展し てきた.さらに,データ駆動型イノベーション創出戦略 協議会,データ流通環境整備検討会などの産官学での検 討会はデータ流通推進協議会に発展し,現在も活発に議 論が進んでいる. しかし,異分野データ連携において常に問題となるの が,データに含まれる個人情報のプライバシーやビジネ ス機会の損失である.利用方法によっては,データには 従来想定していなかった問題を起こす潜在的なリスクが 存在する.[Acquisti 09] は異なる個人データの組合せは 深刻なプライバシー侵害を引き起こし得ることを指摘し た.また,[Xu 14] は,データ保有者,分析者,意思決 定者などのステークホルダの目的が異なることがデータ 利活用を複雑化させていると述べた.さらに,異種のデー タの組合せは客観的な解釈を難しくさせることが指摘さ れている [Bollier 10]. つまり,データ市場において異分野データ連携を実 現するためには,プライバシーやビジネス機会損失のリ スクを低減しつつ,データの利用方法を分野横断的に検 討するという問題を解かなければならない.データジャ ケットは以上の問題に対する一つの解となる技術であ る.

4. データジャケットを用いたデータ利活用方法と

価値の発見

4・1 データジャケットの仕組み データジャケット(Data Jacket:DJ)はデータの中 身ではなく,データの概要(データ内の変数名,保存形 式,収集方法,共有条件など)を共有し,データの利用 価値を検討可能にするデータ概要情報の記述方法である [Ohsawa 13,など].個人を識別する情報を含む共有不 可能なデータでも,DJ として記述することでメタデー タ化し,セキュリティ上のリスクを低減させつつ,デー タに関する情報の共有が可能となる.例えば,商品の購 買履歴データには日付,顧客 ID,支払金額などの変数 図 1 The agent-in-the-world([Boisot 04] を著者一部改変)

(3)

および個人を識別可能な値が含まれる.そのため,これ らのデータを Web 上に公開して共有可能な状態にする ことは通常は困難である.しかし,購買履歴データを「日 付」,「顧客 ID」,「支払金額」といった公開可能な変数 名としてメタデータ化すれば,個人を識別可能な値は秘 匿のまま,データに関する情報が共有可能となる(図 2). また,変数ラベルだけでなく,DJ ではタイトル,デー タ概要,データの収集方法,保存形式,共有条件など 12の記述項目を定義している.これらの DJ に記述され た内容を読めば,例えば,そのデータがどのような形式 のもので,誰がどのような意図で取得したのか,またデー タ取得にかかったコストや期待する分析成果などを理解 することが可能となる.さらに,DJ に対してテキスト マイニングのツールなどを適用することにより,人間だ けでなく計算機においても可読となり,データの関連性 を可視化することも可能となる.データ同士のつながり を共有条件や変数ラベルから理解することができ,仮説 の生成などを支援することが可能となる. データ本体ではなく,メタデータを用いたデータ検 索・結合を行う試みは数多く行われてきた.初期のメ タデータは図書館のカードベースの索引であるといわ れている.その後,インターネット技術の進展により, Web上のリソースやメタデータを効率的に検索可能と するため,Dublin Core などの共通語彙が提案されてき た.そして,メタデータを介して各データベースに含ま れるデータに統一的にアクセスする環境の構築を目指す Linked Open Data関連研究が進んできた [Berners-Lee

01,など].しかし,共通語彙の枠組みで表現可能なデー タ以上に世の中には多様なデータが存在しており,デー タ市場は今までは市場に登場してこなかった多種多様な データが扱われるイノベーションの場である.多様なス テークホルダが共存するデータ市場において,データ概 要情報は人間が認知し,表現し,理解し得る自然言語で の記述が望ましい.そのため,DJ のデータ概要情報記述 フレームワークは,データが公開あるいは共有可能であ ることを前提とせず,データ自体を秘匿にしたまま,デー タ利活用方法を検討可能するための方法となっている. DJは 2013 年からビジネスパーソン,各分野の専門 家,研究者,データサイエンティストなどから広く DJ の収集を開始した.2017 年 12 月現在,登録されている DJのうち,公開可能な約 1 500 件の DJ は RDF/XML 形 式(Resource Description Framework) で 保 存 さ れ,SPARQL エンドポイント*1から検索でき,API も 公開されている.なお,RDF ストアには OPENLINK SOFTWARE社の Virtuoso を用いている.

4・2 データ利活用方法検討ワークショップ § 1 Innovators Marketplace on Data Jackets 異なる領域の多種多様な形式のデータを DJ という共 通のフレームワークで記述することにより,異分野の データを同じ土俵で議論することが可能となる.例えば, データ同士の関係を DJ に含まれるキーワードを介して 可視化し作成したシナリオマップが図 3 である.四角 ノードが DJ を表し,ノードの色に応じてデータの共有 条件が異なる.また,円形ノードは単語を表し,DJ(デー タ概要,変数ラベルなど)に含まれる単語の共起関係か ら算出される.このようなシナリオマップを用い,デー タ利活用方法を検討するワークショップ手法として, *1 http://160.16.227.37/sparql 図 2 DJ の記述例 図 3 DJ 同士の関係を可視化し作成したシナリオマップを一部 拡大した図([Ohsawa 98] を利用し,一部加工した)

(4)

Innovators Marketplace on Data Jackets(IMDJ)が提 案されてきた [Ohsawa 13,大澤 17a,など].IMDJ はデー タの概要情報である DJ を入力として,データに関わる ステークホルダ間のコミュニケーションから,データ利 活用方法の検討が行われる場として機能する.IMDJ で は,データ市場に関わり,データの利用方法について議 論するプレーヤの最小単位としてデータの「保有者」,「利 用(消費)者」,「提案者」の三者を設定している.保有 者はデータを保有するプレーヤ,利用者はデータを活用 したいと考えているプレーヤ,提案者はデータ利活用方 法を提案するプレーヤである.ワークショップ中,参加 者は利用者,提案者,データ保有者を兼任し,保有者は 自身の保有するデータに関する情報を DJ として提供す る.データ利用者の立場からは,自身が意識している問 題を提起し,他の参加者に要求を出す.続いて,提案者 の立場から,利用者の要求を深掘りしながら DJ に記述 された情報を読み解き,データ利活用案(ソリューショ ン)を提案する.これらのやり取りにより,データ保有 者は自身のデータを公開することなく活用方法を知るこ とができ,利活用価値から利用者と取引に関する交渉を 開始させることができる. § 2 アクション・プランニング [経産省 15] は,データによる新事業創出の障壁として, データの提供および交渉における時間・労力・合意の不 確実性をあげている.これらの障壁を乗り越えるために は,データ分析だけでなく,関連するさまざまな要素(コ スト,ステークホルダ,潜在的リスクなど)を考慮した 事業計画および分析計画といった実行動における指針と なるシナリオの生成が必要である.アクション・プラン ニング(AP)は IMDJ において創出されたデータ利活 用案(ソリューション)をもとに,データ利活用シナリ オを生成するワークショップ手法である [Hayashi 13, Hayashi 15a,など].さまざまなステークホルダが共存 するデータ市場において,論理は異なる領域の知識を共 通の土俵で議論するための文法となる.データ市場は, 異なる領域に存在するさまざまな意図によって取得され た多種多様なデータについてステークホルダが議論する 場であることを考慮すると,専門知識が多岐にわたって おり,議論の収束は容易ではない.彼らが一堂に会して データの活用方法について議論し,データの価値を決定 するためには,論理という思考のフレームワークが重要 となる.AP では,計画段階でさまざまな領域の知識同 士の整合していない矛盾を表出化し,前提を疑う議論を 促進させることで,盲点となる事実への気付きが促され, 実行動におけるリスクを低減させたデータ利活用シナリ オが創出される. § 3 IMDJ および AP の成果 以上に説明した,DJ を用いたワークショップ手法に より,従来のデータ流通プラットフォームに欠けていた データ市場におけるステークホルダ間のコミュニケー ションが実現する.すなわち,要求やソリューションお よびシナリオによって,データに利活用の文脈が与えら れることで利用方法とデータの価値が発見される.表 1 はデータ利活用方法検討ワークショップによって実現し たデータ分析およびツール開発の事例の一部である.表 1に示すように,データの利用価値が認められたり,デー タに適用する新しい分析ツールが提案されるなどの成果 が得られている. 表 1 IMDJ および AP から送出されたデータ利活用案から実現した実際のデータ分析およびツール開発事例の一部

(5)

さらに,「街路灯のデータ」と「Google Maps の地図 データ」を組み合わせたシナリオでは,実際に行政との 交渉の末,非公開のデータを入手した事例が報告されて いる [池上 14].また,高経年化原子力システムの安全 性の議論においては,ワークショップにおいて創出され たソリューションを見たデータ保有者は,該当データを 共有するための有益な情報(所有者や入手方法など)を 新たに提供する傾向が見られた [大澤 14].以上から,デー タ利活用方法の提案とコミュニケーションにより,デー タ保有者が自身のデータの利活用方法を認識すれば,積 極的なデータおよび知識の交換が行われ得る.

5.DJ の導入とアプリケーション

2013年からデータ概要情報記述手法 DJ はさまざま な分野で導入され,異分野データ連携とコラボレーショ ンを支援してきた.そして現在,DJ をコア技術とした プロジェクトやアプリケーションが多様な展開を見せて いる. 5・1 産官学民における DJ の導入 2014年に実施した経済産業省主催のデータ駆動型イ ノベーション創出戦略協議会(以下,DDI)やデータエ クスチェンジ・コンソーシアム(以下,DXC)の分科 会を始めとし,この数年で産業界において浸透しつつあ る.構造計画研究所主導による DDI 調査事業には,65 の企業から 110 名が参画し,各社のデータを DJ として 登録・共有し,データの利活用方法について検討を行う 一連のワークショップを開催した [経産省 15].約 6 か 月にわたる議論と IMDJ プロセスの実施の末,データに よるビジネスアイディアの創出から事業シナリオ化を行 う中で,データ利活用における各社の課題と解決策の共 有,そしてユースケースの検討がなされた.また,DXC のプロジェクトでは,DJ の入力と可視化を含め,IMDJ プロセスによるワークショップを 6 回実施した.さらに, 翌年 2015 年のベンチャー事業化支援等事業でも構造計 画研究所主導による IMDJ プロセスが導入され,四つの 案件が自律的にビジネスに発展した [経産省 16].さら に同手法は国土交通省のビッグデータ活用のための調査 研究 [国交省 16] にも用いられた.また,2017 年の総務 省のデータ利活用型スマートシティ推進事業では,株式 会社リアライズと行政情報システム研究所を中心に,公 共課題解決に DJ および IMDJ プロセスを導入してい る [狩野 18, 総務省 17].横浜市と協業し,「子育て支援」 をテーマに参加者を集め,複数回の IMDJ ワークショッ プを開催し,政策課題に対する事業シナリオづくりが進 んでいる.このプロジェクトを発端に,さらに川崎市で は,「世代間交流のためのコミュニティづくり」をテー マに公共課題解決が進行している.そして,トッパン・ フォームズ株式会社は,ダイレクトメールの新しいニー ズの発見とソリューションの提案に DJ を用いている. 一般社団法人日本ダイレクトメール協会のデータベース マーケティング委員会にて 3 回のワークショップを実施 し,企業間連携を進めている [宇井 18]. 産業界のみならず学術の場においても,DJ をコア とした技術は注目され,研究会やワークショップが盛 んに行われている.ICDM(International Conference on Data Mining)や KES(International Conference on Knowledge-Based and Intelligent Information & Engineering Systems)では,2013 年からデータ市場に 関する国際ワークショップを開催している.これらの国 際ワークショップでは,学術界に留まらない多様なデー タ利活用事例を含めた研究が発表された.また,2015 年と 2016 年にはインドの Amity 大学にて IMDJ ワー クショップを行い,インドの社会システム改善のための データ利活用シナリオを創出した.2018 年春には同大 学にて同様のワークショップの開催が予定されている. また,台灣大学,精華大学でも DJ を用いたワークショッ プを実施し,考案されたデータの組合せ案から導かれた データ分析事例が生まれている.さらに,DJ をコア技 術として組織間連携を促し,実社会に働きかける取組 み(データジャケット推進ワーキンググループ)も進ん でいる.そのほか,国内学会や研究会にて数々のワーク ショップが実施されており,DJ は産官学民の異分野デー タ連携とデータ利活用価値発見に貢献してきている. 5・2 データ利活用支援アプリケーション DJを用いたデータ利活用方法検討支援はワーク ショップ手法のみではない.異分野データ連携と利活 用を支援する研究とアプリケーションの開発も進んでい る.

Data Jacket Store(DJ ストア)は構造化したデータ 利活用知識を用いたデータ検索システムである.世の中 にどのようなデータが存在し,どのようなデータが自身 の問題解決に関係があるのかを知る方法は意外に少な い.Web 上に存在するデータであれば自然言語による 検索が可能かもしれないが,ほしいデータを的確に検索 し発見することは難しい.なぜなら,人間にとって自分 の関心事をデータ内の用語(変数名や概要など)で表す ことは必ずしも容易ではないからである.そこで DJ ス トアは,データのみならず多様な文脈とその背景にある さまざまな人の観点が反映された知識を構造化すること で,データについての深い理解がなくとも,関連する データを検索できる仕組みとなっている(図 4)[早矢 仕 16].実験では,過去の IMDJ において議論された要 求・データ利活用案・データの関係をデータ利活用知識 として構造化し,ユーザが自分と異なる視点をもつ過去 のユーザが考案したデータの使途を発見したり,別の人 が考案したデータ利活用案から意思決定に役立つ DJ を 探し出すことが可能となることがわかっている.

(6)

また,データ市場はデータの組合せのみを議論する場 ではない.異分野データ連携を実現するためには,デー タ利活用に関わる多様なステークホルダの関係性を考慮 しなければならない.そこで,データ利活用シナリオ創 出手法 AP によって生成されたシナリオの要素を構造化 し,実行動におけるステークホルダの表出と関係を推定 するシステム Resource Finder が開発された [Hayashi 15b].これにより,シナリオを介して潜在的なビジネス パートナーを推定するだけでなく,敵対するステークホ ルダについても事前に予期できるため,シナリオを考案 する時点で対策を検討することが可能となり,異分野 データ連携におけるリスクを低減できる. さらに,DJ の中の変数ラベル(変数の概要情報)に 着目し,新たにデータを取得する意思決定者を支援する VARIABLE QUEST(VQ)というアプリケーションも 提案されている [Hayashi 17a, Hayashi 17b].天気予報

のデータの変数ラベルは「気温」,「地域名」,「天気」,「日 にち」などであり,身体のデータには「身長」,「体重」, 「年齢」,「性別」などがある.VQ の基本的な機能は,あ る意思決定に関連のある変数ラベルを推定し,ユーザに 提示することである.例えば,検索クエリとして「ある 地域の明るさを知るためのデータを取得したい」と入力 したとき,本システムは「街路灯 ID」,「光束」,「色温度」, 「緯度」,「経度」,「設置区分」,「柱種別」などの変数ラ ベルを出力する.この機能を実装するため,変数名の共 起性に着目する.変数名の共起性とは,ある変数名のペ アがあるデータの中に同時に登場する特徴を意味する. 例えば,「緯度」と「経度」は位置を表すデータの中で 同時に取得される可能性が高い.また,健康関連データ では,「年齢」,「性別」,「生年月日」は同時に現れやすい. このような変数ラベルの共起性を考慮することで,ある データでは欠けていた変数を他のデータの中で登場する 変数の共起性によって補完することが可能となる.すな わち,どのようなデータ(変数の集合)を取得すべきか 意思決定者に提示することで,データ取得後にデータの 再取得などの手戻りの発生のリスクを低減できる.図 5 は VQ を用いて変数ラベルの共起性をネットワーク可視 化したものである.可視化によって,異分野のステーク ホルダ間でデータ連携の際の変数の組合せや整合性を議 論することが可能となる.VQ のアプリケーションはデー タ設計(Design of Data)支援手法として研究が進んで いる. また,データ利活用方法検討ワークショップ IMDJ 自体の改良と拡張を行う研究も進んでいる.Web をプ ラットフォームとした IMDJ を行うことにより,ワーク 図 4 DJ ストアによる構造化知識の検索 図 5 VARIABLE QUEST による変数ラベル可視化の一部. ノードの大きさは登場頻度を表し,エッジの太さは共起頻度を表す(図では変数ラベルの登場頻度が 3回以上のものに限定して表示している)

(7)

ショップの準備による負荷を軽減し,遠隔地のユーザの データ利活用コミュニケーションを支援することができ る [岩佐 18].また,従来の卓上での IMDJ では取得が 困難であった参加者の時系列行動ログを取得でき,参加 者のデータ利活用方法を検討するという創造活動のプロ セスを分析することも可能となる(図 6). 2017年から,富士通株式会社との共同研究の中で, DJとブロックチェーン技術を組み合わせたデータ流通・ 利活用プラットフォーム Virtuora DX(仮)の開発を行っ ている [佐々木 18].このアプリケーションには DJ を 介してデータ市場の多様なステークホルダがデータを登 録・検索・交換する機能を有している.つまり,DJ は データの資産・利用価値策定におけるデータ保有者と利 用者をつなぐ役割をしている.さらに Virtuora DX(仮) の重要な機能は,プラットフォーム上でユーザ同士が データの利用方法などを検討するコミュニケーションが 実現することである(図 7).これにより,従来のデー タポータルサイトやデータ流通プラットフォームにはな かった,データ保有者,利用者をはじめとするデータ市 場のステークホルダの協調的創造活動が促進される.創 造活動におけるコミュニケーションの重要性については [石井 01, Miwa 04, Miyake 86,など] があり,異分野の データ連携を検討するうえでコミュニケーションは欠か せない要素である.さらに,これらの技術を活用し,東 京駅周辺のエリアマネジメントとデータによる異業種コ ラボレーションを促進させるプロジェクトが予定されて いる.

6.む  す  び

本稿では,データジャケットを用いたい異分野デー タ連携とコラボレーションの実例およびそれを促進する ための諸技術,そして取組みについてまとめた.保有す るデータを活用したり,異なる領域のデータを組み合わ せて新しい価値を創出し,ビジネスや意思決定に役立て ることへの期待は高まっているものの,プライバシーや データの使途が明らかとなっていないことによる機会損 失など,社会的障壁が多く存在する.そのような中で, データの再利用および流通環境の整備に注目が集まる一 方で,データをどう使うか,データを使うことによりど のような問題が解決可能であるのか,というデータ利活 用方法を検討するコミュニケーション技法や支援技術に ついての議論は十分に行われてこなかった.組織横断的 な協働を促進するためには,データのみならず,データ から得られる情報や知識の交換が重要となる.本稿で述 べたように,データの価値を発見し,流通させ,新し いデータ駆動によるイノベーションを創出させるために は,データジャケットは有効な手段であるといえよう. 図 6 データ利活用方法検討ワークショップ IMDJ を Web プラットフォーム上で実装したアプリケーションの一部 図 7 Virtuora DX(仮)上でのコミュニケーションの例

(8)

謝 辞 本稿に関連する一部の論文は,JST-CREST(JPMJCR 1304),JSPS 科研費(JP16H01836, JP16K12428)の 助成を受けました.本稿執筆にあたり,ご協力いただい た株式会社構造計画研究所,富士通株式会社,トッパン・ フォームズ株式会社,株式会社リアライズ,一般社団法 人行政情報システム研究所の皆様,そして,データジャ ケットワークショップにご参加いただいた多数の企業, 実務家,研究者の皆様に心より感謝申し上げます.

◇ 参 考 文 献 ◇

[Acquisti 09] Acquisti, A. and Gross, R.: Predicting social security numbers from public data, Proc. National Academy of Science, Vol.106, No.27, pp.10975-10980(2009)

[秋山 13] 秋山寛子,山内正人,柴崎亮介,砂原秀樹:情報銀行 システムにおける個人情報蓄積機構の機能設計と実装,マル チメディア,分散協調とモバイルシンポジウム 2013 論文集, pp.1953-1957(2013)

[Berners-Lee 01] Berners-Lee, T., Hendler, J. and Lassila, O.: The

Semantic Web, Scientific American(2001)

[Boisot 04] Boisot, M. and Canals, A.: Data, information and knowledge: Have we got it right?, Journal of Evolutionary

Economics, Vol. 14, No. 1, pp.43-67(2004)

[Bollier 10] Bollier, D.: The promise and peril of big data,

Communications and Society Program, The Aspen Institute,

Washington, DC(2010)

[Boyd 12] Boyd, D. and Crawford, K.: Critical questions for big data, Information, Communication & Society, Vol.15, No.5, pp.662-679(2012)

[Clark 97] Clark, A.: Being There: Putting Brain, Body, and World

Together Again, The MIT Press, Cambridge(1997)

[Damasio 00] Damasio, A.: The Feeling of What Happens: Body

and Emotion in the Making of Consciousness, Mariner Books

(2000)

[Dumbill 12] Dumbill, E.: Data markets compared: A look at data market offerings from four providers, http://radar. oreilly.com/2012/03/data-markets-survey.html (2012)(最終アクセス 2017 年 12 月 1 日)

[Emoto 15] Emoto, M.: Extraction of preference of recipe providers and users on recipe-sharing websites, Int. Conf. on

Data Mining Workshops(MoDAT),pp. 694-697(2015) [江本 17] 江本 守,大澤幸生:トピックモデルを用いた顧客行動分

析と商品 DNA 作成手法の提案,信学技報,人工知能と知識処 理研究会,Vol. 116, No. 460, pp. 51-55(2017)

[EP 80] Electronics and Power: New move into data market,

Electronics and Power, Vol. 26, No. 8, p. 619(1980)

[池上 14] 池上顕真,早矢仕晃章,大澤幸生:データ利活用におけ る創造的コミュニケーションと行動プロセス,信学技報,人工 知能と知識処理研究会,Vol. 114, No. 343, pp. 45-50(2014) [石井 01] 石井成郎,三輪和久:創造的問題解決における協調認知 プロセス,認知科学,Vol. 8, No. 2, pp. 151-168(2001) [岩佐 18] 岩佐太路,早矢仕晃章,大澤幸生:Web 版 innovators

marketplace on data jacketsを用いたデータ利活用法に関する コミュニケーション支援,信学技報,人工知能と知識処理研究会, Vol. 117, No. 440, pp. 55-60(2018)

[Hayashi 06] Hayashi, Y., Miwa, K. and Morita, J.: A laboratory study on distributed problem solving by taking different perspectives, Proc. 28th Annual Conf. of the Cognitive Science

Society, pp. 333-338(2006)

[Hayashi 13] Hayashi, T. and Ohsawa, Y.: Processing combinatorial thinking: Innovators marketplace as role-based game plus action planning, Int. Journal of Knowledge and

Systems Science, Vol. 4, No. 3, pp. 14-38(2013)

[Hayashi 15a] Hayashi, T. and Ohsawa, Y.: Relationship between

externalized knowledge and evaluation in the process of creating strategic scenarios, Open Journal of Information

Systems, Vol. 2, No. 1, pp. 29-40(2015)

[Hayashi 15b] Hayashi, T.: Estimating contextual relationships of stakeholders in scenarios using dbpedia, Int. Conf. on Data

Mining Workshops(MoDAT),pp. 698-705(2015)

[早矢仕 16] 早矢仕晃章,大澤幸生:データ利活用知識構造化と再 利用による検索システム:Data jacket store,人工知能学会論 文誌,Vol. 31, No. 5, pp. A-G15_1-9(2016)

[Hayashi 17a] Hayashi, T. and Ohsawa, Y.: Matrix-based method for inferring variable labels using outlines of data in data jackets, The Pacific-Asia Conf. on Knowledge Discovery and

Data Mining(2017)

[Hayashi 17b] Hayashi, T. and Ohsawa, Y.: VARIABLE QUEST: Network visualization of variable labels unifying co-occurrence graphs, Int. Conf. on Data Mining Workshops (MoDAT),pp. 577-583(2017)

[狩野 18] 狩野英司,大西浩史:官民データ活用による行政課題解 決サイクルの仕組み化に向けて∼「官民データ活用シナリオ創 発プラットフォーム事業」の取組み∼,信学技報,人工知能と 知識処理研究会,Vol. 117, No. 440, pp. 67-72(2018)

[Kasuga 16] Kasuga A., Ohsawa Y., Yoshino T. and Ashida S: Non-conformity detection in high-dimensional time series of stock market data, Int. Conf. on Industrial, Engineering and

Other Applications of Applied Intelligent Systems(2016) [経産省 15] 経済産業省:平成 26 年度経済産業省委託事業,我が国 経済社会の情報化・サービス化に係る基盤整備(データ駆動型 イノベーション創出に関する調査事業)調査報告書,http:// www.meti.go.jp/meti_lib/report/2015fy/001102.pdf (2015)(最終アクセス 2017 年 12 月 1 日) [経産省 16] 経済産業省:平成 26 年度補正経済産業省委託事業, 先端課題に対応したベンチャー事業化支援等事業(データ利活 用促進支援事業:データ駆動型イノベーションを実行するプ ラットフォーム・プロセス支援)報告書,http://www.meti. go.jp/meti_lib/report/2015fy/001102.pdf(2016)(最 終アクセス 2017 年 12 月 1 日)

[Miwa 04] Miwa, K.: Collaborative discovery in a simple reasoning task, Cognitive System Research, Vol. 5, No. 1, pp. 41-62(2004)

[Miyake 86] Miyake, N.: Constructive interaction and the interactive process of understanding, Cognitive Science, Vol. 10, No. 2, pp. 151-177(1986)

[村上 80] 村上陽一郎:動的世界像としての科学,新曜社(1980) [Ohsawa 98] Ohsawa, Y., Benson, N. E. and Yachida, M.:

KeyGraph: Automatic indexing by co-occurrence graph based on building construction metaphor, Proc. Advanced Digital

Library Conference, pp. 12-18(1998)

[Ohsawa 13] Ohsawa, Y., Kido, H., Hayashi, T. and Liu, C.: Data jackets for synthesizing values in the market of data, 17th Int.

Conf. in Knowledge Based and Intelligent Information and Engineering Systems and Procedia Computer Science, Vol. 22,

pp. 709-716(2013)

[大澤 14] 大澤幸生:市場メカニズムを模倣したシステム安全評価 に資するデータ共有・活用手法の研究,平成 25 年度高経年化技 術評価高度化事業報告書(2014)

[Ohsawa 16] Ohsawa, Y. and Hayashi, T.: Tangled string for sequence visualization as fruit of ideas in innovators marketplace on data jackets, Intelligent Decision Technologies, pp. 1-13(2016) [大澤 17a] 大澤幸生,早矢仕晃章,秋元正博,久代紀之,中村 潤: データ市場,近代科学社(2017) [大澤 17b] 大澤幸生,早矢仕晃章:データ社会の現状と展望∼ AI ブームからオーダーメイドモデルへ∼,エネルギーレビュー, Vol. 2017, No. 11, pp. 38-42(2017) [大澤 17c] 大澤幸生,早矢仕晃章:データ市場を活かす国家的戦略 を,Evidence, Vol. 003,政策シンクネット(2017) [佐々木 18] 佐々木泰芳,池田栄次:「ブロックチェーン×データ ジャケット」によるデータ流通・利活用社会への加速,信学技報, 人工知能と知識処理研究会,Vol. 117, No. 440, pp. 43-47(2018) [総務省 17] 総務省:官民データ活用シナリオ創発プラットフォー ム 事 業,http://www.soumu.go.jp/main_content/

(9)

000491118.pdf(2017)(最終アクセス 2017 年 12 月 1 日) [Sterman 00] Sterman, D. J.: Business Dynamics -Systems

Thinking and Modeling for a Complex World-, Irwin

McGraw-Hill(2000) [砂原 14] 砂原秀樹,山内正人,金杉 洋,柴崎亮介:「情報銀行」 構想とその技術的課題,マルチメディア,分散協調とモバイル シンポジウム 2014 論文集,pp. 1024-1026(2014) [竹村 18] 竹村航太,早矢仕晃章,大澤幸生,相原大介,須川敦史: サッカー中継映像からの選手・ボールの座標抽出とその分析の ための可視化手法,信学技報,人工知能と知識処理研究会,Vol. 117, No. 440, pp. 93-98(2018)

[宇井 18] 宇井剛史:Innovators Marketplace on Data Jackets を 用いたオープンイノベーション∼一般社団法人日本 DM 協会に おける実用化事例∼,信学技報,人工知能と知識処理研究会, Vol. 117, No. 440, pp. 83-86(2018)

[Xu 14] Xu, L., Jiang, C., Wang, J., Yuan, J. and Ren, Y.: Information security in big data: Privacy and data mining,

IEEE Access, Vol. 2, pp. 1149-1176(2014)

[吉鷹 17] 吉鷹伸太朗,大澤幸生:プロテニスプレイヤーの戦術分 析のための時系列データ可視化,信学技報,人工知能と知識処 理研究会,Vol. 116, No. 460, pp. 45-50(2017) 2018年 1 月 16 日 受理

著 者 紹 介

早矢仕 晃章(正会員) 2012年東京大学工学部卒業.2017 年同大学院工学 系研究科にて博士(工学)取得.東京大学リーディ ング大学院プログラム GSDM 修了.2017 年より東 京大学大学院工学系研究科助教.専門はデータ利活 用知識の構造化,シナリオ創出支援.情報処理学会, 日本認知科学会各会員.主な著書に「データ市場」(近 代科学社,2017). 大澤 幸生(正会員) 1995年東京大学で博士(工学)取得後,大阪大学助手, 筑波大学および東京大学准(助)教授,JST 研究員 などを経て,2009 年より東京大学大学院工学系研究 科教授.非線形光工学,人工知能,経営科学におけ る研究活動から「チャンス発見学」なる分野を創始. 2013年より,データの流通と創造的分析を同時に刺 激するデータ市場のデザインに傾注している.

参照

関連したドキュメント

層の項目 MaaS 提供にあたっての目的 データ連携を行う上でのルール MaaS に関連するプレイヤー ビジネスとしての MaaS MaaS

Google マップ上で誰もがその情報を閲覧することが可能となる。Google マイマップは、Google マップの情報を基に作成されるため、Google

「養子縁組の実践:子どもの権利と福祉を向上させるために」という

 そこで,今回はさらに,日本銀行の金融政策変更に合わせて期間を以下 のサブ・ピリオドに分けた分析を試みた。量的緩和政策解除 (2006年3月

SST を活用し、ひとり ひとりの個 性に合 わせた   

2011 年の主たる動向は、欧州連合 (EU) の海洋政策に新たな枠組みが追加されたことであ る。漁業分野を除いた

工事用車両の走行に伴う騒音・振動の予測地点は、図 8.3-5 に示すとおり、現況調査を実施し た工事用車両の走行ルート沿いである道路端の

基準地震動 Ss-1~7 の全てについて、許容変位を上回る結果を得た 西山層以深の地盤データは近接する1号炉原子炉建屋下のデータであった 2014 年 11