第 4 章 日本語 Wikipedia オントロジ ーの評価ーの評価
4.3 日本語 Wikipedia オントロジー Linked Open Data Data
4.3.1 日本語 Wikipedia オントロジー LOD の設計と公開
92 第4章 日本語Wikipediaオントロジーの利用
4.3 日本語 Wikipedia オントロジー Linked Open
4.3 日本語WikipediaオントロジーLinked Open Data 93
図 4.6 日本語 Wikipedia オントロジー統計情報(20130530 版)
日本語 WikipediaオントロジーLODの設計にあたり,以下の3点に注意した.これら
はLinked Data Design Issue及びLinked Dataのための5つ星の原則に則っている.
(1) URI の定義
(2) 他のLOD との関連付け
(3) SPARQL エンドポイントの公開
(1) URI の定義
外部からの参照を可能にするため,日本語Wikipediaオントロジーの全てのクラス・イ ンスタンス・プロパティについて,HTTP URIを付加する.表4.2にHTTP URIの一覧 を示す.
各リソースは「/」以下に日本語もしくは URIエンコードされた日本語を入力すること でアクセス可能である.301リダイレクトにより,ブラウザからのアクセスは「page」へ,
アプリケーションからのアクセスは「data」へアクセスする.現在選択できるデータの種 類はrdf,owl,rdf/json,jsonの3 種類である.例えば,
「http://www.wikipediaontology.org/instance/福澤諭吉」へブラウザからアクセスした 場合は「http://www.wikipediaontology.org/pages/instance/福澤諭吉」へリダイレクトさ れる.福澤諭吉のURI エンコードである
「%E7%A6%8F%E6%BE%A4%E8%AB%AD%E5%90%89」へアクセスした場合も同様 である.
94 第4章 日本語Wikipediaオントロジーの利用
表 4.2 日本語 Wikipedia オントロジーURI
リソース URI
インスタンス
URI http://www.wikipediaontology.org/instance/
ページ http://www.wikipediaontology.org/pages/instance/
データ http://www.wikipediaontology.org/data/instance/
クラス
URI http://www.wikipediaontology.org/class/
ページ http://www.wikipediaontology.org/pages/class/
データ http://www.wikipediaontology.org/data/class/
プロパティ
URI http://www.wikipediaontology.org/property/
ページ http://www.wikipediaontology.org/pages/property/
データ http://www.wikipediaontology.org/data/property/
Infoboxプロパティ
URI http://www.wikipediaontology.org/infobox/
ページ http://www.wikipediaontology.org/pages/infobox/
データ http://www.wikipediaontology.org/data/infobox/
(2) 他のLODとの関連付け
日本語WikipediaオントロジーのインスタンスとDBpedia Japanese29,LODAC30,青 空文庫31,saveMLAK32のリソースの関連付けを行う.日本語Wikipedia オントロジー内 の イ ン ス タ ン ス と 各 LOD の リ ソ ー ス の 文 字 列 照 合 を 行 い , 完 全 照 合 し た 場 合 に
owl:sameAsによって対応付けを行う.表4.3に関連付けの一例を示す.
表 4.3 他の LOD リソースとの関連付けの一例 日本語Wikipedia オントロジーURI 関連先URI
http://www.wikipediaontology.org/instance/福澤諭吉 http://ja.dbpedia.org/resource/福澤諭吉
http://www.wikipediaontology.org/instance/福澤諭吉 http://www.aozora.gr.jp/index_pages/person296.html http://www.wikipediaontology.org/instance/吾輩は猫である http://www.aozora.gr.jp/cards/000148/card789.html http://www.wikipediaontology.org/instance/ギアナウズラ http://lod.ac/species/ギアナウズラ
http://www.wikipediaontology.org/instance/慶應義塾普通部 http://savemlak.jp/wiki/慶應義塾普通部 http://www.wikipediaontology.org/instance/東京都立大島高等学校 http://savemlak.jp/wiki/東京都立大島高等学校 http://www.wikipediaontology.org/instance/落穂拾い http://lod.ac/id/497029
29 http://ja.dbpedia.org/
30 http://lov.okfn.org/dataset/lov/
31 http://www.aozora.gr.jp/
32 http://lov.okfn.org/dataset/lov/
4.3 日本語WikipediaオントロジーLinked Open Data 95
図 4.7 SPARQL クエリの一例
(3) SPARQL エンドポイントの公開
SPARQLエンドポイントは「http://www.wikipediaontology.org/query/」である.図4.7 上部のようなSPARQLクエリを入力する場合,図4.7下部のようなURLにアクセスする ことで,xml形式でデータを得ることができる.
ブラウザを利用し,表示した場合の一例を図4.8に示す.リソース名(図4.8では「福澤 諭吉」インスタンス)を主語とした「主語-述語-目的語」のトリプルが一覧で表示される.
また,図4.9のように検索ページから概念の検索が可能である.入力語に完全一致する リソース,部分一致するリソース,入力語を目的語とするリソースを関連候補として,順 に表示している.
図 4.8 HTTP ページの一例(福澤諭吉インスタンス)
96 第4章 日本語Wikipediaオントロジーの利用
図 4.9 検索実行結果の一例
4.4 日本語 Wikipedia オントロジーからの日本語語
彙構築
本節では,日本語WikipediaオントロジーのプロパティとLinked Open Vocabularies の語彙の対応付けによる日本語語彙抽出手法を述べる.