• 検索結果がありません。

拡張SPARQLクエリのための動的オントロジーマッチングとチューニング支援機構の試作

N/A
N/A
Protected

Academic year: 2021

シェア "拡張SPARQLクエリのための動的オントロジーマッチングとチューニング支援機構の試作"

Copied!
5
0
0

読み込み中.... (全文を見る)

全文

(1)

人工知能学会研究会資料 SIG-SWO-039-10

拡張

SPARQL

クエリのための

動的オントロジーマッチングとチューニング支援機構の試作

Toward a System of Dynamic Ontology Matchings

and Tuning Supports for Extended SPARQL queries

足立拓也

1

福田直樹

2

Takuya Adachi

1

Naoki Fukuta

2

1

静岡大学情報学部

1

Faculty of Informatics, Shizuoka University

2

静岡大学学術院情報学領域

2

Department of Informatics, Shizuoka University

Abstract: 本研究では,拡張 SPARQL クエリのための動的オントロジーマッチングとチューニング 支援機構の実現のための試みとその課題について述べる.オントロジーマッピングを用いた SPARQL クエリ拡張である SPARQLoid クエリのコーディング時における不具合の原因調査およびその対処 の困難さの改善のために,オントロジーマッピングおよびマッピング先の情報を必要に応じて提示す るための機構と,動的オントロジーマッチングによる検索対象拡大・調整のための一時オントロジー マッピングに基づくクエリコードのチューニング支援機構の試作を行う.

1

はじめに

SPARQL は RDF 形式で記述する際に必要となる 語彙の定義となるデータを検索するクエリ言語であ り,RDF 形式で記述されたオントロジーを十分に理 解しない状態では,効果的なクエリを記述することが 容易ではない [Fujino 12a].オントロジーマッピング [Atencia 12][Noy 09]を用いた SPARQL クエリを実行 可能にするものに,SPARQLoid[Fujino 12a, Fujino 12b, Fujino 14]がある.SPARQLoid では,重み付きオント ロジーマッピング [Atencia 12] を効果的に利用可能する ために SPARQL クエリを拡張し既存の SPARQL エン ドポイント上でも実行させることが可能な SPARQL ク エリに変換する機構を備えるオントロジーマッピングを 用いた拡張 SPARQL クエリを実行した結果が期待通り とはならなかった場合使用したオントロジーマッピング やインスタンスの存在の多寡などといった様々な原因が 考えられ,原因を特定することが難しい [藤野 13].本研 究では,オントロジーマッピングを用いた拡張 SPARQL クエリのコーディング時におけるオントロジーマッピ ングに起因した問題に対し,それを動的オントロジー 連絡先: 静岡大学        静岡県浜松市城北 3-5-1        E-mail: [email protected] マッチングおよび記述パラメータチューニングの支援 を行うことで,解決を試みる.

2

背景

本章では,既存の研究および技術である拡張 SPARQL クエリとその変換エンジンである SPARQLoid[Fujino 12a, Fujino 12b, Fujino 14]とその支援機構,および本研究 で取り組む課題について述べる.

2.1

拡張 SPARQL クエリとその支援機構

オントロジーマッピングに基づいて SPARQL クエリ を行う手法として SPARQLoid[Fujino 12a, Fujino 12b, Fujino 14]がある.SPARQLoid は重み付きオントロ ジーマッピング [Atencia 12] を利用するクエリを生成 するために,既存の SPARQL の文法を拡張したクエ リ言語,および,その変換エンジンのことを呼ぶ.拡 張したクエリ言語の構文には,重み付きオントロジー マッピングに付与された確信度に基づくフィルタリン グや並び替えが可能である. 拡張された SPARQL クエリである SPARQLoid ク エリを記述することは,記述が SPARQL クエリより

(2)

複雑になる部分があり,初めて SPARQL を知った人や SPARQLを利用する人にとって,それらの拡張構文の 記述のみならず,適切な語彙の選択にも何らかの支援が あることが望ましいと考えられる.これらの課題に対し て,SPARQL クエリの語彙・エンドポイント検索支援の 手法である SuPARQooL[Noguchi 13] と SuPARQooL を拡張した試作機構 [足立 16a] がある.試作機構にお いて,幅広いエンドポイントに対して,語彙・エンド ポイント推薦機構を行う際,処理に時間がかかってし まうことが課題であった.SPARQL Endpoint Status1

から取得できるエンドポイントの特徴に基づく機械学 習による手法 [Adachi 16b] 等を用いて処理時間の削減 の実現が検討されている.また,ユーザがマッピング の詳細な情報を意識せずに,クエリを記述した場合に も,マッピングを効果的に利用可能なクエリへ拡張を 行えるための機構 [足立 16b] が検討されており,使用 するオントロジーマッピングに対して動的なオントロ ジーマッピングの生成を用いて,SPARQLoid クエリ におけるデバッグ支援を検討している [Adachi 16a].

2.2

拡張 SPARQL クエリにおける課題

Listing 1に,SPARQLoid クエリの例を示す.この クエリは,我々が現在準備を進めている木曽町オント ロジーに基づく木曽町 LOD に対して,「yamada:子育て しやすい環境づくり」のインスタンスを取得するもの である.このとき,SPARQLoid 内部では「yamada:子 育てしやすい環境づくり」に対するマッピングの検索を 行っている.「yamada:子育てしやすい環境づくり」に対 するマッピングの検索結果を表 1 に示す.SPARQLoid では,拡張された SPARQL クエリを記述可能であり, これらの拡張されたクエリは新しい構文を含んでおり, オントロジーマッピングに付与された確信度を加味し てクエリの動作を調整することができる一方で,対象と なるオントロジーやマッピングの特性に関する知識が 必要となる [足立 16a].Listing 1 で示す SPARQLoid クエリは実行時に表 1 のマッピングを参照し,それら のマッピング先の要素を参照するように変換されて実 行される.ところが,実際にこの SPARQLoid クエリ をエンドポイントに対して実行した際,インスタンス を得られない. 先のクエリでインスタンスが得られない理由は,使 用するオントロジーマッピングから参照されるクラス にはインスタンスが直接結びついておらず,そのオン トロジーマッピングから参照されるクラスの下位クラ スにインスタンスが結びついていた.エンドポイント が OWL-DL における推論等を扱えない設定になって いる場合,このようなインスタンスの検索が成功しな 1http://sparqles.ai.wu.ac.at い場合がある.クエリ実行対象となるエンドポイント の設定を変更できない場合,オントロジーマッピング の情報および SPARQLoid クエリ中の記述のみからこ れらの問題を解決可能となることが望ましく,そのた めの支援機構が必要となると考えられる. PREFIX r d f : <h t t p : / /www. w3 . o r g /1999/02/22− rdf −syntax−ns#> PREFIX yamada : <h t t p : / /www. s e m a n t i c w e b . o r g / c s 1 3 0 9 8 / o n t o l o g i e s / 2 0 1 6 / 4 / k i s o#> SELECT DISTINCT ? s WHERE { ? s r d f : t y p e yamada :子 育 て し や す い 環 境 づ く り . THRESHOLD { yamada : 子 育 て し や す い 環 境 づ く り >= 0 . 4 8 } CRITERIA ? c { yamada : 子 育 て し や す い 環 境 づ く∗ 100 } RANKING ? s c o r e { ? c } } Listing 1: SPARQLoidクエリ例 表 1: 「yamada:子育てしやすい環境づくり」に対する マッピング例 MappedConcept Confidence adachi:住みやすい地域づくり 0.659 adachi:子育て環境整備施策 0.491 adachi:企業退職者の移住環境づくり施策 0.479 adachi:子育てカフェの整備・充実施策 0.429 adachi:結婚・出産・子育て戦略施策 0.324 adachi:妊娠・出産・子育て世代包括支援施策 0.289 adachi:子ども 0.050

3

本試作機構

本章では,マッピングデータおよびマッピング先の 情報の提示するための機構と動的オントロジーマッチ ングの必要性,動的オントロジーマッチングに基づく チューニング支援について述べる.SPARQLoid クエ リのコーディング時における不具合の原因調査のため にオントロジーマッピングおよびマッピング先の情報 の提示を必要に応じて行い,不具合の原因の対処の困 難さの解消のために,動的にオントロジーマッチング を用いて補助的な一時オントロジーマッピングを生成 し,それを併用することを可能にする機構の実現に向 け,複数のオントロジーマッピングを SPARQLoid ク エリ内で効果的に扱うことを支援するための,クエリ・ マッピングのチューニング支援について述べる.

3.1

マッピングデータおよびマッピング先の

情報の提示

オントロジーマッピングマッピングを用いた拡張 SP-ARQLクエリでは,オントロジーマッピングを格納し

(3)

たエンドポイントや対象エンドポイントを用いるため, 不具合があった場合,原因を特定することは難しい.本 研究では,SPARQLoid クエリのコーディング時にお ける不具合の原因調査のための,オントロジーマッピ ングおよびマッピング先の情報の提示するための機構 を用意している.オントロジーマッピングおよびマッ ピング先の情報を取得するため,対象エンドポイント へオントロジーマッピングが格納するエンドポイント を経由するクエリを実行することにより,情報を取得 する.Listing 2 にオントロジーマッピングマッピング およびマッピング先の情報を取得するクエリ例を示す. Listing 2で示すクエリを実行した結果を表 2 に示す. 本試作機構における実行例を図 1 に示す.本試作機 構では,必要に応じてオントロジーマッピングを入力 し,クエリを実行することで,オントロジーマッピン グおよびマッピング先の情報を取得し,提示される. SPARQLoidクエリで用いられるオントロジーマッピ ングの有無とそこで使用するオントロジーマッピング から参照されるクラス等にインスタンス,下位クラス の有無を検出することで,SPARQLoid クエリのコー ディング時におけるインスタンスが取得しない不具合 の原因調査が可能となる. PREFIX a d a c h i : <h t t p : / /www. s e m a n t i c w e b . o r g / a d a c h i / k i s o c h o#> PREFIX r d f : <h t t p : / /www. w3 . o r g /1999/02/22− rdf −syntax−ns#> PREFIX r d f s : <h t t p : / /www. w3 . o r g / 2 0 0 0 / 0 1 / r d f schema#>

PREFIX owl : <h t t p : / /www. w3 . o r g / 2 0 0 2 / 0 7 / owl#> PREFIX yamada : <h t t p : / /www. s e m a n t i c w e b . o r g / c s 1 3 0 9 8 / o n t o l o g i e s / 2 0 1 6 / 4 / k i s o#> PREFIX a l i g n : <h t t p : / / knowledgeweb . s e m a n t i c w e b . o r g / h e t e r o g e n e i t y / a l i g n m e n t#> PREFIX xsd : <h t t p : / /www. w3 . o r g / 2 0 0 1 /XMLSchema #> SELECT DISTINCT ( ( ? m a p 0 子 育 て し や す い 環 境 づ く り ) AS ? MappedConcept ) ( ( ? c o n f 0 子 育 て し や す い 環 境 づ く り ) AS ? C o n f i d e n c e ) ( c o u n t ( ? s 1 ) AS ? I n s t a n c e C o u n t ) ( c o u n t ( ? s 2 ) AS ? SubClassOfCount ) WHERE{ SERVICE <h t t p : / / 1 9 2 . 1 6 8 . 0 . 2 9 : 3 0 3 0 / a l i g n / query> { SELECT ? m a p 0 子 育 て し や す い 環 境 づ く り ? c o n f 0 子 育 て し や す い 環 境 づ く り WHERE { { ? a l i g n 0 a l i g n : onto1 <http : / /www. s e m a n t i c w e b . o r g / a d a c h i / k i s o c h o > . ? a l i g n 0 a l i g n : o n t o 2 <h t t p : / /www. s e m a n t i c w e b . o r g / c s 1 3 0 9 8 / o n t o l o g i e s / 2 0 1 6 / 4 / k i s o > . OPTIONAL { ? a l i g n 0 a l i g n : map ?map0 . ?map0 a l i g n : e n t i t y 2 yamada :子 育 て し や す い 環 境 づ く り . ?map0 a l i g n : e n t i t y 1 ? m a p 0 子 育 て し や す い 環 境 づ く り . ?map0 a l i g n : measure ? c o n f 0 子 育 て し や す い 環 境 づ く り . FILTER ( ? c o n f 0 子 育 て し や す い 環 境 づ く り >= ” 0 . 0 ” ˆˆ xsd : f l o a t ) } } } } { { OPTIONAL { ? s 1 r d f : t y p e ? m a p 0 子 育 て し や す い 環 境 づ く り . } } UNION { OPTIONAL { ? s 2 r d f s : s u b C l a s s O f ? m a p 0 子 育 て し や す い 環 境 づ く り . } } } } GROUP BY ? m a p 0 子 育 て し や す い 環 境 づ く り ? c o n f 0 子 育 て し や す い 環 境 づ く り ORDER BY DESC ( ? C o n f i d e n c e ) Listing 2: オントロジーマッピングおよびマッピング 先の情報を取得するクエリ例 図 1: マッピングデータおよびマッピング先の情報の提 示画面例

3.2

動的オントロジーマッチングの必要性

指定したクラスとあわせて関連クラスも同様の検索 する場合などのように,SPARQL クエリ中で検索対象 とするデータの対象範囲を拡大する手法としては,ク エリを修正する手法が挙げられる.オントロジーマッ ピングを用いない通常の SPARQL 記述では,クエリ 中に実質的な下位クラスなどの関連クラスをあわせて

(4)

表 2: 「yamada:子育てしやすい環境づくり」からマッピングされたクラスのインスタンスとサブクラス数 MappedConcept Confidence InstanceCount SubClassOfCount

adachi:住みやすい地域づくり 0.659 0 1 adachi:子育て環境整備施策 0.491 0 2 adachi:企業退職者の移住環境づくり施策 0.479 3 0 adachi:子育てカフェの整備・充実施策 0.429 4 0 adachi:結婚・出産・子育て戦略施策 0.324 0 4 adachi:妊娠・出産・子育て世代包括支援施策 0.289 1 6 adachi:子ども 0.050 0 0 検索する記述を直接追加することにより,下位クラス に対してもクエリを行うことが可能である.オントロ ジーマッピングを用いた拡張 SPARQL クエリの記述で は,たとえば検索に追加して含めたい関連語彙まで検 索可能なようにクエリを書き換えるには,検索対象と なるエンドポイント上で用いられるオントロジー中の 目当てのクラス等の語彙との間でマッピングが存在し なければならず,それらが欠損している場合には,オン トロジーマッピングを用いずに直接的に対象オントロ ジー上の語彙を参照してクエリを記述する以外に,解 決の方法がない.また,そのような直接的な語彙の参 照をクエリ中に行った場合には,拡張 SPARQL クエリ にあるような,マッピングの確信度に基づく計算式を 利用した並び替えやフィルタリング等と整合性の取れ るクエリを作成することが難しく,拡張 SPARQL クエ リから変換された複雑な SPARQL クエリを直接書き換 えるといった対処が必要になる.本研究では,我々は, クエリの改変を直接的に行うことではなく,オントロ ジーマッピングを効果的に用いることに着目する.も しも,拡張 SPARQL クエリで用いられるオントロジー マッピングが必要な範囲の内容を十分に包含しない場 合には,動的にオントロジーマッチングを用いて補助 的な一時オントロジーマッピングを生成し,それを併 用することを可能にする機構の実現を考える.この手 法では,クエリを修正する必要がなく,オントロジー マッピングの内容を調整することで,直接マッピング された概念等には結びついていないデータも,そのク エリの実行により取得することが可能になる. 今回の試作を行う機構では,動的オントロジーマッ チングを行う設定となっている場合には動的に,補助 的なオントロジーマッピングを生成し,それをクエリ 中で使用できるようにする.

3.3

動的オントロジーマッチングに基づく

チューニング支援

これまでの SPARQLoid のクエリ変換エンジンでは, 動的に生成されたオントロジーマッピングに限らず,1 組のオントロジーの間に複数種のオントロジーマッピン グが用意されている場合や,それらのオントロジーマッ ピングごとのカバー範囲が異なる場合などについては, その支援機構の検討が行われていなかった [Fujino 13]. 本研究では,複数のオントロジーマッピングを SPAR-QLoidクエリ内で効果的に扱うことを支援するための, クエリ・マッピングのチューニング支援機構を用意して いる.動的オントロジーマッチングにより生成したオ ントロジーマッピングは,チューニング支援機構によ り,必要に応じてオントロジーマッピング格納エンド ポイント上に読み込まれる.SPARQLoid クエリから SPARQLクエリの変換時において,オントロジーマッ ピングを格納したエンドポイントは,チューニング作業 を効率的に行えるようにするために,チューニング支援 機構に内包され,そこから直接制御される SPARQL エ ンドポイント上で動作し,チューニング作業中は,オン トロジーマッピングの参照はこのエンドポイントを経 由して行われる.本エンドポイントの実装には,fuseki2 を用いている. SPARQLoidクエリ実行時での動作のトレースを行い やすくするために,SPARQLoid クエリから SPARQL クエリに変換する過程において,必要に応じてチュー ニング用の付加情報取得のためのコードを付加できる ようにした本試作機構を用いることによって,動的に オントロジーマッピング追加・改変しながら,そこで使 用するオントロジーマッピングから参照されるクラス 等にはインスタンスが直接結びついていない場合を検 出したり,動的に生成する一時オントロジーマッピン グに下位クラスや関連クラスを含めさせるようにマッ ピングを拡張させる機能を準備することで,OWL-DL における推論等を扱えない設定になっているエンドポ イントに対しても,柔軟にインスタンスを検索するよ うな SPARQLoid クエリを準備することが可能となる. 2https://jena.apache.org/documentation/serving data/

(5)

4

おわりに

本研究では,拡張 SPARQL クエリのための動的オン トロジーマッチングとチューニング支援機構の実現の ための試みとその課題について述べた.オントロジー マッピングを用いた SPARQL クエリ拡張である SPAR-QLoidクエリのコーディング時における不具合の原因 調査およびその対処の困難さの改善のためにオントロ ジーマッピングおよびマッピング先の情報を必要に応 じて提示するための機構と,動的オントロジーマッチ ングによる検索対象拡大・調整のための一時オントロ ジーマッピングに基づくクエリコードのチューニング 支援機構の試作について述べた. 本試作機構上では,ユーザがクエリの特定の部分に 対応するインスタンスの有無などを参照したい場合に おいて,それを提示可能なシステムの試作は行ってい るが,その効果的な方法には異なる複数の提示方法が 考えられ,それぞれの優位性やその評価についての検 討は,今後の課題である.

謝辞

本研究の一部は,JST CREST の支援を受けたもの である.

参考文献

[Adachi 16a] Adachi, T. and Fukuta, N.: Toward Better Debugging Support on Extended SPARQL queries with On-the-fly Ontology Mapping Gen-eration, in Proc. of The Eleventh International

Workshop on Ontology Matching collocated with the 15th International Semantic Web Conference ISWC-2016 (OM2016) (2016), (poster, to appear)

[Adachi 16b] Adachi, T., Yamada, N., and Fukuta, N.: Toward Better Query Coding Support Utilizing Ontology Mappings, in Proc. of

1st International Workshop on Platforms and Ap-plications for Social problem Solving and Collective Reasoning (PASSCR2016) (2016), (to appear)

[Atencia 12] Atencia, M., Borgida, A., Euzenat, J., Ghidini, C., and Serafini, L.: A Formal Seman-tics for Weighted Ontology Mappings, in Proc. of

the 11th International Semantic Web Conference (ISWC2012), pp. 17–33 (2012)

[Fujino 12a] Fujino, T. and Fukuta, N.: A SPARQL Query Rewriting Approach on Heterogeneous On-tologies with Mapping Reliability, in Proc. of

the IIAI-AAI International Conference on e-Services and Knowledge Management (IIAI-AAI-ESKM2012), pp. 230–235 (2012)

[Fujino 12b] Fujino, T. and Fukuta, N.: SPARQLoid - a Querying System using Own Ontology and Ontology Mappings with Reliability, in Proc. of

the 11th International Semantic Web Conference (Posters & Demos) (ISWC2012) (2012)

[Fujino 13] Fujino, T. and Fukuta, N.: Utiliz-ing Weighted Ontology Mappings on Feder-ated SPARQL Querying, in Proc. of the 3rd

Joint International Semantic Technology Confer-ence (JIST2013) (2013)

[Fujino 14] Fujino, T. and Fukuta, N.: Utiliz-ing Weighted Ontology MappUtiliz-ings on Federated SPARQL Querying, in Kim, W., Ding, Y., and Kim, H.-G. eds., Lecture Notes in Computer

Sci-ence, Vol. 8388, pp. 331–347, Springer-Verlag

(2014)

[Noguchi 13] Noguchi, H., Fujino, T., and Fukuta, N.: On Implementing a SPARQLoid Query Coding Support - Vocabulary Discovery for Queries with Weight Ontology Mappings, in Proc. of

Inter-national Workshop on Linked Data in Practice (LDPW 2013), pp. 33–38 (2013)

[Noy 09] Noy, N. F.: Ontology Mapping, in Staab, S. and Studer, R. eds., Handbook on Ontologies, pp. 573–590, Springer-Verlag Berlin Heidelberg (2009) [足立 16a] 足立 拓也, 山田 直希, 野口 宙毅, 福田 直樹: オントロジーマッピングに基づく SPARQL クエリ 記述支援システムの拡張機構の試作, 第 38 回セマン ティックウェブとオントロジー研究会 (SIG-SWO38) (2016) [足立 16b] 足立 拓也, 福田 直樹:オントロジーマッピン グを用いた SPARQL クエリにおけるマッピングに関 する詳細知識を必要としないシステムの試作, 第 30 回人工知能学会全国大会 (JSAI2016), 1N4-OS-19a-5in2 (2016) [藤野 13] 藤野 敬久, 福田 直樹:マッピングの信頼度 を利用した異種 LOD への横断的 SPARQL 検索にお けるデバッグ支援手法の検討, 第 27 回人工知能学会 全国大会 (JSAI2013), 1N4-OS-10b-2in (2013)

表 2: 「yamada:子育てしやすい環境づくり」からマッピングされたクラスのインスタンスとサブクラス数 MappedConcept Confidence InstanceCount SubClassOfCount

参照

関連したドキュメント

 そこで、本研究では断面的にも考慮された空間づくりに

そのため本研究では,数理的解析手法の一つである サポートベクタマシン 2) (Support Vector

For this purpose, we observed various nonverbal behaviors, such as gazing, gestures, nods, and smiles, which were used by speakers of speeches, and we described the

FUJISAWA SHUNSUKE MIGITA Cancer Research Institute Kanazawa University Takaramachi, Kanazawa,... 慢性活動性肝炎,細

本体背面の拡張 スロッ トカバーを外してください。任意の拡張 スロット

荷役機器の増車やゲートオープン時間の延長(昼休みの対応を含む)、ヤードの拡張、ターミ

一方で、自動車や航空機などの移動体(モービルテキスタイル)の伸びは今後も拡大すると

本センターは、日本財団のご支援で設置され、手話言語学の研究と、手話の普及・啓