・Federation
5. 山口敦⼦
・Querying: Benchmakrs
ISWC 2017サーベイ
担当: Querying: Benchmarks and Tools, Federation
DBCLS 山口敦子
Querying: Benchmarks and Tools
Automatic Query-centric API for Routine Access to Linked Data
Albert Meroño-Peñuela and Rinke Hoekstra
In-Use Track
LOD-a-lot: A Queryable Dump of the LOD cloud
Javier D. Fernández, Wouter Beek, Miguel A. Martinez-Prieto and Mario Arias
Resource Track
A Corpus for Complex Question Answering over Knowledge Graphs
Priyansh Trivedi, Gaurav Maheshwari, Mohnish Dubey and Jens Lehmann
Resource Track
The YASGUI Family of SPARQL Clients
Lauren Rietveld and Rinke Hoekstra
Journal Track
Automatic Query-centric API for Routine Access to Linked Data
Albert Meroño-Peñuela and Rinke Hoekstra
In-Use Track
論文より引用
SPARQLエンドポイン ト,RDFダンプ,
Linked Data
Fragment, HTMLに埋 め込まれたRDFaを,
OpenAPIの枠組みで検
索できるようにしたシ
ステムの紹介
LOD-a-lot: A Queryable Dump of the LOD cloud
Resource Track Javier D. Fernández, Wouter Beek,
Miguel A. Martinez-Prieto and Mario Arias
28B トリプルを一つの
HDT(RDFデータのイン
デックス付き圧縮形式)
ファイルに変換し,一
括検索を実現
A Corpus for Complex Question
Answering over Knowledge Graphs
質問応答システム向けのデータセット LC-QuADの紹介
• 自然文-DBPedia用のSPARQLクエリの対応データ セット(5000組の対応)が含まれる
• 自然文テンプレート(NNQT)-SPARQLクエリテンプ レートを用いてデータを生成
• このデータセットにより質問応答システムにおける マニュアルな介在を減らすことができることが期待 される
Priyansh Trivedi, Gaurav Maheshwari, Mohnish Dubey and Jens Lehmann
Resource Track
The YASGUI Family of SPARQL Clients
SPARQLクライアントYASGUIファミリーの紹介
• YASQE
データ提供者向けのJavaScriptライブラリ.HTMLテキストエリアを拡 張したSPARQLクエリエディタを構築できる.
• YASR
データ提供者向けのJavaScriptライブラリ.SPARQLクエリの結果をパー ズし,可視化できる.
• YASGUI
データ利用者向けのJavaScriptライブラリ.任意のSPARQLエンドポイントを 利用可能なSPARQLクエリエディタ.
Lauren Rietveld and Rinke Hoekstra
Journal Track
Federation
Challenges of source selection in the WoD
Tobias Grubenmann, Abraham Bernstein, Dmitry Moor and Sven Seuken
Research TrackRealizing an RDF-based Information Model for a Manufacturing Company – A Case Study
Niklas Petersen, Lavdim Halilaj, Irlán Grangel-González, Steffen Lohmann, Christoph Lange and Sören Auer
In-Use TrackThe Odyssey Approach for Optimizing Federated SPARQL Queries
Gabriela Montoya, Hala Skaf-Molli and Katja Hose
Research TrackAutomated Fine-grained Trust Assessment in Federated Knowledge Bases
Andreas Nolle, Melisachew Wudage Chekol, Christian Meilicke, German Nemiorvskij
and Heiner Stuckenschmidt
Research TrackChallenges of source selection in the WoD
• フェデレート検索において,部分クエリの結果 の大きさの見積もりは重要である
• ブルームフィルタ構造(要素が集合に属するか を判定するデータ構造.擬陽性あり偽陰性な し)を利用して,見積もりを試みたが,累積エ ラーが爆発して使い物にならなかった
• 時には見積の計算時間が,実際のクエリ応答時 間より長いこともあった
• 擬陽性があるすべての見積もり手法について,
同様のことが起きることを理論的に解析した
Tobias Grubenmann, Abraham Bernstein, Dmitry Moor and Sven Seuken
Research Track
Realizing an RDF-based Information Model for a Manufacturing Company – A Case Study
• 製造業の会社において,機械データを中心とし たRDFデータモデルを作成した
• 作成したデータモデルでは,既存のオントロ ジー・語彙として,VIVO, NeoGeo, FOAF, Semantic Sensor Networkを利用し,それ以 外の語彙は定義した.
• 会社で利用中のシステムを作成したデータモデ ルにマップした.
• ドメイン知識の形式化を行った.
Niklas Petersen, Lavdim Halilaj, Irlán Grangel-González, Steffen Lohmann, Christoph Lange and Sören Auer
In-Use Track
The Odyssey Approach for
Optimizing Federated SPARQL Queries
• 各データセットの統計情報を利用して,フェデ レート検索の結合計画を最適化
• 各リソースに対し,それをサブジェクトとする トリプル数,オブジェクトとするトリプル数, 各プロパティに対し,それが使われるトリプル 数,異なるプロパティをつなぐトリプル数など を使う
• HiBISCuS, SemaGrow, FedX, SPLENDIDの 4つのフェデレート検索システムと,
FedBenchを用いて検索時間を比較,Odyssey 法が最も優れていることを示した.
Gabriela Montoya, Hala Skaf-Molli and Katja Hose
Research Track
Automated Fine-grained Trust
Assessment in Federated Knowledge Bases
• 複数のデータセット間では記述に一貫性が失われた り,衝突が起きたりする
• これまではある程度マニュアルに信頼性を評価し,
衝突が起きないようデータセットから信頼性の低い 記述を除く手法が主流
• 本研究は衝突の起きるデータセット間に衝突グラフ を作成し,これをGibbsサンプリングのマルコフモ デルとして利用して,データセットの信頼値を計算 する.フルオートで複数のデータセットからナレッ ジベースが作成できる.
• 図書館情報学のデータセットを用いて,手法の検証 を行った.
Andreas Nolle, Melisachew Wudage Chekol, Christian
Meilicke, German Nemiorvskij and Heiner Stuckenschmidt
Research Track
ドキュメント内
ISWC2017サーベイ
(ページ 68-80)