リンクするデータ(Linked Data)-広がり始めたデータのクラウド- : 2.Linked Dataとメディア-メディアがLinked Dataを活用する理由-
7
0
0
全文
(2) 特集 リンクするデータ (Linked Data)〜広がり始めたデータのクラウド〜. ない)で実施されたため詳細な報告はないが,本会 議結果をふまえた「Linked Data を使う 10 の理由」 という記事が会議参加者の Martin Moor(Media 2). Standards Trust)によって発表されている .これ は「Linked Data とメディア」について本稿の結論と もいうべき項目を簡潔にまとめた内容であるが,こ. タイプ. 人手によるもの 自動付与のもの. トータル. 人名. 4,978. 0. 4,978. 組織名. 1,489. 1,592. 3,081. 地名. 1,910. 0. 1,910. 498. 0. 498. 記事記述子. 表 - 1 Linked Data クラウドへ開放したタグ数. の背景には新聞メディアでは The New York Times, および放送メディアでは BBC の先進事例がその根. ● Linked Data クラウドへの開放. 拠となっている.そこで,最初にこれら先進事例の. The New York Times は記事見出しに対し,十分. 説明を行い「Linked Data を使う理由」について筆者. 慎重にメタタグを付与していたが,それは「孤立」し. らの考察を含めて紹介することにしたい.. たタグであった.確かにこれらタグにより,たとえ. 新聞メディアと Linked Data. ば Madonna に関する記事情報を TimesTag API を. The New York Times は「新聞の使命に基づきオー. が 1958 年 8 月 16 日 に 生 ま れ た こ と, ま た 最 近. プンなインターネットの基盤の上でソーシャルネッ. 発表したアルバムなどは The New York Times の. トワーキングと集合知を活用し,ジャーナリズムと. 記事だけでは分からない.そこで The New York. して行動する」Times Open 戦略,そしてこの Times. Times は‘Linked Open Data’として図 - 1 のように. Open 戦略の基盤となる「ニュースと情報のプラット. 各記事の検索 API(クエリ式)を含めた URI を公開. フォーム」 の開発を進めている.. し,また他の Web データベースである Freebase や. 本章では 「ニュースと情報のプラットフォーム」 とし. DBpedia とリンクさせた情報も公開した.具体的に. て Linked Data がいかに活用されているかを紹介する.. は,以下のように「owl:sameAs」によって関係が定. 通して得ることは可能であった.しかし Madonna. 義されている.. ● Linked Data クラウドへのタグの開放. owl:sameAs. The New York Times は 100 年間に及び 5 種類の. h t t p : / / d b p e d i a . o r g / r e s o u r c e / M a d o n n a _ %28. カテゴリ (記事主題,人名,組織名,地理情報,作品. entertainer%29. 名(書籍,映画,演劇,etc.) )に基づく 100 万語以上. owl:sameAs. の語彙をシソーラスとして整備してきた.. http://rdf.freebase.com/ns/en.madonna. このシソーラスは Times Topics として記事見出し. こ れ に よ り DBpedia か ら は 誕 生 日(dbpedia-. におけるタグの統制語として使われると同時に頻度. owl:birthData)や生誕地(dbpedia-owl:birthPlace)な. が高い 27,000 個のタグを TimesTag API として公開 してきた. 3) ,4). .これらタグの開放は最終的には 1851. 年の記事まで遡って行うことが予定されている.同 時に,第 1 段階としては人名,そして第 2 段階とし て人名に加えた組織名,会社名,地名のタグを LOD クラウドへ開放した. 2010 年 1 月 13 日 時 点 に お け る The New York ☆1. Times の Linked Open Data サイト. で公表されて. いるタグの数は表 -1 に示す総数 10,467 件となる. ☆1. Linked Open Data(http://data.nytimes.com/). 294 情報処理 Vol.52 No.3 Mar. 2011. 図 - 1 The New York Times : Linked Open Data 「Madonna」のページ.
(3) 2.Linked Data とメディア –メディアが Linked Data を活用する理由–. 図 -2 Freebase の「Madonna」のページ. 図 - 3 The New York Times の. Linked Data アプリ(Who Went Where). ど,また Freebase からは図 - 2 の Madonna のページ. サービスを提供していくこと,これが「ニュースと情. で公開されている最新アルバルの情報等が「孤立し. 報のプラットフォーム」戦略ということに結び付いて. たタグ」ではなく 「リンク付けされたタグ」 として,自. いく.. 社内で利用可能になるとともに,次節に記述するよ うに,The New York Times の「Linked Open Data」. 放送メディアと Linked Data. をハブとして第三者も利用することが可能となる.. ●孤立していたオンラインサイト BBC は世界で最大規模の放送局で,8 つの国営. ● Linked Data アプリケーションへ. 放送局と地方局,10 の国営ラジオ局と 40 のローカ. The New York Times は,タグを LOD クラウド. ルなラジオ局を運営している.BBC は 1920 年にラ. に開放するとともに,これらタグによるアプリケー. ジオ放送を開始し,1930 年にはテレビ放送,そし. ションの環境や情報の提供を開発者ネットワーク. て 1994 年からオンラインサービスを開始した.し. (Developer Network)を通して積極的に進めている.. かしサービス開始時は,各サイトは番組ごとにそ. ここで詳細なプログラムの説明と併せて紹介されて. れぞれ人手で作成するという状況であった.この. いるのが,試験的なサイト“あの人はどこ?(Who. 状況を改善するため「孤立したサイトではなく 1 つ. ☆2. Went Where) ”. である(図 -3) .大学名を入れる. のページから次のページ,そして次のページへと. と,The New York Times から卒業生の記事の一覧を,. BBC のオンラインサイトで旅ができるような魅力的. 他の LOD クラウドからは生年月日(DBpedia) ,出身. なサイト」 「すべての BBC の番組に対して整合性と. 地情報(GeoNames)などの検索結果を返す.つまり,. 高い品質を持つオンラインサイト」 を目指した新しい. こうしたアプリケーションが簡単に誰でも The New. オンラインサイトの構築を開始した.ここで利用し. York Times の Linked Open Data 上で構築すること. た技術が Linked Data であり,オントロジーである.. が可能になる. このようなマッシュアップによる CMS(コンテン. ●番組オントロジーで全番組をつなげる. ツマネージメントシステム) 自体は Google を始め多く. この莫大な番組を管理するために BBC は番組オン. の Web2.0 企業が提供しているが,莫大な信頼性の. (図 - 4) . トロジー (Programmes Ontology) を開発した. 高いコンテンツをハブとして提供できることが The. 番組オントロジーは BBC が配信している各種コ. New York Times の強みであり,それに自社だけで. ンテンツとその関係を記述するためのシンプルな. なく多くの開発者を巻き込みながら多様で魅力的な. ボキャブラリである.BBC が保有するすべてのコ. ☆3. ☆2. ☆3. Alumni In The News (http://data.nytimes.com/schools/schools.html). BBC Programmes Ontology (http://www.bbc.co.uk/ontologies/programmes/2009-09-07.shtml). 情報処理 Vol.52 No.3 Mar. 2011. 295.
(4) 特集 リンクするデータ (Linked Data)〜広がり始めたデータのクラウド〜 5). .このことは,BBC 内の っている ). Content. コンテンツをつなげることともに,The. Brand. New York Times と同様に Linked Data Series. クラウドの各種情報も利用することが. Programme. 可能となったことを意味する. たとえば BBC/Music の Madonna の ページには以下のリンク情報が自動的. Episode Medium Broadcaster. Outlet. Service. Channel. に張られている. Wikipedia article on <a href="http://en.wikipedia.org/. Version. Broadcast. wiki/Madonna_(entertainer)">. Publishing. tl:Interval. tl:Timeline. Madonna(entertainer)</a>. tl:Interval. MusicBrainz entry on. Segment. Temporal annotations. rdfs:subClassOf object property 図 - 4 BBC 番組オントロジー概要. <a href="http://musicbrainz.org/ artist/79239441-bfd5-4981-a70c55c3f15c1287.html">Madonna</a> こ れ に よ っ て, 利 用 者 は,BBC/. ンテンツは番組のブランド(Top Gear などの「番組. Music の Madonna のサイトから関係する BBC の番. 名」 ) ,ジャンル (ドラマなど),シリーズ(シーズン),. 組を辿れるとともに,アーティストのプロフィールな. エピソード(各放映分),放送日時などのイベント,. ど BBC サイトから外部の Web ページにも利用者は. 放送のサービス内容などで定義された.これによっ. 辿ることが可能になった.つまり,BBC のサイトを. て,各サイトが一貫した形式で最新情報を提供する. 利用するということは,BBC から提供されるコンテ. ことができ,またこれまでは“孤立していた”ホーム. ンツを見るということだけでなく,BBC のサイトを. ドラマのサイトからジャンルとして整理されている. ハブとして利用者が他のサイトへ,より詳細な情報. ホームドラマ一覧サイトを利用者が辿れるようにな. が記述されている Web ページへ 「オンラインサイトで. るなど整合性があり高い品質を持つオンラインサイ. 旅ができる」 サイトを構築したのである.. トが実現した.. また利用者のメリットと同時に Linked Data を利 用することで BBC だけでは到底不可能な 450,000. ● DBpedia で LOD クラウドとつなげる. 件のアーティスト情報について,いつでも新鮮な情. 番組オントロジーにより,これまで孤立していた. 報を利用者に提供することが可能となった.. 番組はつながったが,まだ BBC/Programmes にある 音楽番組サイトの情報と,BBC/Music にあるアーテ. Linked Data を使う 10 の理由. ィストの情報は孤立したままである.そこで,これ. こうした先進事例を背景に書かれたのが「報道機. らの情報をつなげること,つまり各サイトにある膨. 関が Linked Data を使うべき 10 の理由(Why News. 大なボキャブラリを同等の意味としてマッピングす. Organizations Should Use‘Linked Data’)」である.. ることを行った.このときに採用したのが LOD クラ. この 10 の理由のうち本稿の事例に最も関係が深い. ウドで統制語彙となっている DBpedia である (オント. と思われる項目をここでは挙げる.. ロジーマッピング技術を使い自動的に関係付けを行. 296 情報処理 Vol.52 No.3 Mar. 2011.
(5) 2.Linked Data とメディア –メディアが Linked Data を活用する理由– [理由 2]Linked Data により Martin Moor(人物), Martin Moore(キッチン)の区別が可能に. Wikipedia アーティストのプロフィールをリンク. なり簡単に知的にサイトへのリンクを誘 導できる. [理由 3] すでに Linked Data を通して各コンテン ツが機械可読であれば簡単にサービス開 発が可能となる. [理由 4]Linked Data を使ってアイディアを構築す る材料を提供することで,キラーアプリ が開発される可能性がある.つまり自社 のコンテンツで第三者がサービスを構築 することができる.. MusicBrainz アーティストの音楽情報をリンク 図 - 5 Linked Data を自社コンテツのサービスに. [理由 7]Linked Data に出版物をおけば有料に値す るかどうかが判断できる十分な情報を与. る.これが,オンラインでコンテンツを配信す. えることが可能となり,有料コンテンツ. る一方向のサービスとは異なるサービス提供と. への誘導も可能となる.. して Linked Data を利用することの本質な理由. [理由 8]ページが Linked Data で構成されていれば. であろう.. 自動的にアップデートされ未更新のサイ. また,Linked Data を導入するということだけで. トはなくなる.. はなく,たとえば The New York Times の Times. [理由 9]Linked Data で開放することで標準的な基. Open 会議が Web2.0 を提唱した Tim O’Reilly(ティ. 準点になる,つまり情報のハブになれる.. ム・オライリー)の講演から始まったように,Web 自体の進化を理解し,メディアもその成功事例に. これらを “リンク”というキーワードで再度整理し. 取り組むという「Linked Data とメディア」を含めた. てみると,コンテンツを保有するメディアとネット. 「IT 技術の進化とメディア自体の進化」または逆に. との関係として次の 3 つの“リンク”の仕方があると. 「メディアの進化からみた IT 技術の進化」という視. 考えられる.. 点も重要と考える.そこで最後の章では再度この視. 1. データのリンク(Linked Data). 点に立ち戻り日本における「Linked Data をメディ. [理由 2,8]にあるように,自社のコンテンツ管理. アで活用する理由」 について考えてみたいと思う.. 開発の効率化と自社内では提供できないサービ スをデータのリンクで実現する(図 - 5) .. メディアの進化論と IT の役割. 2. アプリケーションのリンク(Linked Applications). 既述のように海外では Linked Data に取り組むメ. [理由 3,4]にあるように,LOD クラウドへ自社. ディア企業が現れている.わずか数人のチームで. コンテンツを開放することで,自社コンテンツ. 考えられた技術が,有益であれば非常に短い時間. と他の Linked Data をつなげたアプリケーショ. で世界中に広がることが IT の特徴でもある.今後,. ンが自社のサービスとしてリンクされていく.. Linked Data が IT 技術の枠組みの中でどう利用さ. 3. サービスのリンク(Linked Services). れていくのかを考えてみたい.そこで IT 技術の観. この Linked Data と Linked Applications を基盤. 点から,情報メディアの歴史を少し大きな視点から. とすることで[理由 7,9]にあるように,自社のサ. 概観し,Linked Data の役割を考察する(表 - 2).. ービスに中にリアルな世界(コンテンツ,利用者,. 人類の長い歴史の中で,情報の記録媒体として用. 多くの開発者など)を取り入れることが可能にな. いられてきたのは紙であろう.情報を大量に複製. 情報処理 Vol.52 No.3 Mar. 2011. 297.
(6) 特集 リンクするデータ (Linked Data)〜広がり始めたデータのクラウド〜. phase# 情報メディア. 記録メディア 【アナログから ディジタルへ】. 伝達網 【ローカルから グローバルへ】. phase1 出版. 紙・インク. 交通網. phase2 放送通信. アナログ電磁記録. 電波網・電流網. phase3 デジタル放送通信. ディジタル電磁記録 電波網・電流網. phase4 Web. ディジタル電磁記録 インターネット. phase5 Web2.0 phase6 Web3.0 セマンティックWeb. サービスや商品の例. 通信方向. 書籍 (1455年 欧州) 新聞 (1605年 欧州) 雑誌 (1665年 欧州) 電話(電信) (1878年 米国) ラジオ (1920年 米国) テレビ (1929年 米国) アナログレコード (1877年 米国) CD (1982年 日本) DVD (1996年 日本). 一方向 一方向 一方向 双方向(対話) 一方向 一方向 一方向 一方向 一方向. Webページ (1990年 欧州) ポータルサイト (1994年 米国) ブログ,SNS,Wiki Wiki(集合知)から,Linked Data, Linked Applications,Linked Servicesへ. 一方向 一方向 双方向(対話) 多方向(討論). リンク容易度. 低. 高. 表 - 2 情報メディアの歴史. し,広く世の中に配布する画期的な技術が,活版印. きるようになったのである(Web2.0).そのなかで,. 刷である.いわゆる「グーテンベルク聖書」が作られ. Wiki の果たす役割は大きく,世界中の「知」を集め. た 1455 年は,情報メディアにとって革命的な出来. る「場」を与えている(集合知).このような,人類の. 事と考えられる.しかし,これらの印刷物を伝達す. 「知」をより有効に活用できる世界を Web に作ろう. る手段は,現実世界の交通手段(徒歩,車,鉄道な. というのが,筆者たちの考える Web3.0 の世界であ. ど)である.このような,今からみると,純アナロ. る.その中で,「知」を「つなぐこと」に注力してい. グな世界を phase1 としてみよう.次に,電磁気的. こうという考え方が,Linked Data ではないだろう. な技術を用いた,情報の記録,およびその伝達手段. か? さらに,これらのデータを操作するアプリケ. が発明され普及する.情報は,電磁波をアナログ変. ーションをつなげる Linked Applications,そのつ. 調することにより,記録,伝達されるようになった. ないだアプリケーションによってできるサービス. (phase2) .さらに,情報を 2 進法で表すディジタル. を,さらにつなげて新しい価値を創造する Linked. 化が行われるようになり,情報の伝達,複製の際の. Services などが今後現れると筆者らは考えている.. 損失が少なくなって,情報がより確実に伝えられる. さて,このように,情報技術の歴史を俯瞰してき. ようになる(phase3).phase2 および 3 では,基本. たが, 「つなげる」つまりリンクに注目すると,この. 的に,情報は電磁波に乗って伝えられるのであるか. 情報技術の歴史は,情報と情報をつなぎ,また人と. ら,現実の交通網を用いることとは比べ物にならな. 人とを,地理的距離を越えてつなぐ努力の歴史であ. いほど,伝達速度が向上した.そして,この電磁波. ったとも考えられる.リンク度 (リンク容易度) という. 網を世界中に張り巡らせたインターネット,さらに. 考えを導入するならば,歴史が下るにつれてリンク. その上で提供される基盤のサービスである Web に. 度が向上し,リンクしやすい世界が開けてきている.. よって,情報に関しては世界中に瞬時に伝えられる. そのリンクされた情報の交通網であるインターネ. という IT 革命が起こったといえる.. ット上での交通整理をする役割を Linked Data が担. さて,phase4 以降の Web の世界では,始めは,. っていくともいえるだろう.. ユーザである一般市民にとっては,情報を与えられ. この流れの中で,The New York Times や BBC. るだけの一方向の通信がメインであった(Web1.0).. の試みを位置付けてみる.The New York Times は,. し か し, す ぐ に ブ ロ グ,SNS,Wiki な ど の サ ー. 新聞から Web3.0 へ行こうとしている(phase1 か. ビスが開始され,IT 技術を活用すれば,世界中の. ら phase6)し,また BBC は,放送から Web3.0 へ. 誰もが,安価にいつでもどこにいても情報発信で. 298 情報処理 Vol.52 No.3 Mar. 2011. (phase2 から phase6 へ)向かう過程にいる..
(7) 2.Linked Data とメディア –メディアが Linked Data を活用する理由– また従来は,放送通信の融合といわれてきたが,. きたように,飛躍することができるかもしれない.. この Web3.0 に至っては,放送通信にさらに出版業. それは,先に述べたとおり,数人のチームが考えた. 界を巻き込んだ巨大な流れになっていることがよく. 技術やサービスが,ユーザに受け入れられさえすれ. 分かる.放送・通信・出版に蓄積された人類の巨. ば,安価でコピーできるために,瞬時に世界に広が. 大な「知」の交通整理を,Linked Data によって行い,. るからである.Web のフェーズでも日本が飛躍で. 「知」 の交換が容易に行える世界を築いていきたいと,. きるような技術の開発が進むことを期待している.. 筆者らは考える.. 日本の将来に向けて. 思っている.日本のメディアに共通する文化の基盤. 参考文献 1) 日経産業新聞「小学館,電子雑誌を休刊, 『紙の手法』求められ ず」 (Sep. 22. 2008) . 2) Why News Organizations Should Use‘Linked Data’ (MartinMoor) http://martinjemoore.com/why-news-organizations-should-trypublishing-in-linked-data/ 3) NYT to Release Thesaurus and Enter Linked Data Cloud (The New York Times オープンブログ). 4) First 5,000 Tags Released to the Linked Data(The New York Times オープンブログ) . 5) Kobilarov, G., Scott, T., et al. : Media Meets Semantic WebHow the BBC Uses DBpedia and Linked Data to Make Connections, ESWC2009.. は「日本語」である.Linked Data の中でも,言語の. . このような状況の中で,日本のメディア界はどの 方向へ進んでいくのだろうか? 筆者らがとても 大切に思っていることは,技術は世界標準である が,そこで交換される情報,いわゆる“コンテンツ” は,その発信者の個性を反映してこそ価値があると. (平成 22 年 10 月 29 日受付). 違いというのは大きな問題でもある.Linked Data の中にも 「日本語の領域」というガラパゴスが随所に できると思うが,そのガラパゴスと大陸を上手につ なぐ工夫が必要であり,Linked Data 上での「翻訳」 のリンクが肝心である. 日本は現在いくばくかの遅れをとっているが,イ ンドが,第 1 次産業から一気に IT 産業に進出して. 乙守信行 [email protected]. (株)MetaMoji セマンティック技術開発部所属.自然言語処理,オ ントロジーの研究開発に従事.(1 節(1.1 を除く),2 〜 4 節を担当). 湯本正典(正会員) [email protected]. (株)日立ソリューションズ事業開発部所属.2000 年(株)日立シ ステムアンドサービス入社.セマンティックなサービスを研究して いる.博士(理学).(1 節 -1.1,5・6 節を担当). 情報処理 Vol.52 No.3 Mar. 2011. 299.
(8)
図
関連したドキュメント
ちな みに定理の名前は証明に貢献した数学者たち Martin Davis, Yuri Matiyasevich, Hilary Putnam, Julia Robinson の名字に由来する. この定理により Halt0 を
クチャになった.各NFは複数のNF ServiceのAPI を提供しNFの処理を行う.UDM(Unified Data Management) *11 を例にとれば,UDMがNF Service
Instagram 等 Flickr 以外にも多くの画像共有サイトがあるにも 関わらず, Flickr を利用する研究が多いことには, 大きく分けて 2
2)海を取り巻く国際社会の動向
第9図 非正社員を活用している理由
ダイキングループは、グループ経 営理念「環境社会をリードする」に 則り、従業員一人ひとりが、地球を
活用することとともに,デメリットを克服することが不可欠となるが,メ
data-set-name BOOLEAN 参照 DataSet true(レポート内に収容). data-reference BOOLEAN データ項目情報