・Querying II
4. 福田直樹(静岡大学)
Querying(I)
ISWC2017 Conference Session Preview
by N. Fukuta (Shizuoka Univ.)
International Semantic Web Conference 2017 Conference Session Preview
Track: RE=Research, RO=Resource, IU=InUse, JO=Journal
Temporal Query Answering in DL-Lite over Inconsistent Data
Camille Bourgaux and Anni-Yasmin Turhan
• データストリームに対するクエリを対象
– 「ついさっき過負荷になりかけたサーバって この前も過負荷になりかけてなかったっけ?」
↑
この下線部を推論で出したい (→ Linear Temporal Logic : LTL )
• LTL 推論への拡張をした DL-Lite R クエリを Inconsistency に頑健になるように拡張
– 主に理論的な性質 ( 計算量など ) を解析
RE
著者らの結論 : よい条件で P ,あとは NP-complete でできるよ!
A Formal Framework for Comparing Linked Data Fragments
Olaf Hartig, Ian Letter and Jorge Pérez
• Best Research Paper!
• Linked Data へのアクセスは SPARQL クエリ?
– RDF ソースのダンプや簡易パターンなど複数種 – 疑問:どの公開方法 (Interface) でどこまでできる ?
• TuringMachine を拡張した LDFMachine を定義
– “expressiveness lattice” を明らかに
• coreSPARQL なのか BGP なのか Federated なのか etc.
– どの複雑さをどこ ( サーバ or クライアント ?) で ということも考慮
RE
著者らの結論 : どの複雑さが Computable なのか等を明らかにできたよ
Computing FO-Rewritings in EL in Practice:
from Atomic to Conjunctive Queries Peter Hansen and Carsten Lutz
• FO(First-Order)Rewriting
– 一階述語論理のクエリへの書き換え
( 備考 : 一階述語論理の∧節表現は SQL の基本 ) – 疑問:この変換はそもそも計算できるのか?
• いつ使いたいのか?
– Ontology-Mediated Queries に使いたい
• ある患者 X が症状 A と症状 B を併発してて
それが同じ遺伝子異常 Z からきてる の X,A,B,Z は?
• 性能は? → 平均で 0.5 ~ 20 秒でできる
RE
著者らの結論 : これくらい性能出てるならいいんじゃないのか?
Strider: A Hybrid Adaptive Distributed RDF Stream Processing Engine
Xiangnan Ren and Olivier Curé
• 一言で言うと?
Apache Spark/Kafka を上手に使って
RDF データストリームを industry レベルの 耐故障性やスケーラビリティなどを持つ 感じで作れましたよ,というもの
• 特長:データの来かたの変化に適応可能
– ルールベース or 実行時の時間 (?) に応じて
• 実世界データに準拠した合成データで評価
– C-SPARQL とかよりもスループット出てます!
RE
著者らの結論 : たぶんこの目的では結構いいものできたんじゃないかと
人工知能学会研究会資料 SIG-SWO-044-13
Querying(II)
ISWC2017 Conference Session Preview
International Semantic Web Conference 2017 Conference Session Preview
Track: RE=Research, RO=Resource, IU=InUse, JO=Journal
An Investigative Search Engine for Social Good (for the Human Trafficking Domain?)
Mayank Kejriwal and Pedro Szekely
• Faceted search などをできるようにした intelligent search engine を実装
• 200+ の US law enforcement agencies で活用
– Human Trafficking の分野で活用 これを起点に Dark Web に挑む!
• Domain specific Insight Graph(DIG) に対応
• Soft Boolean Tree Query に対応
– Must/Should などで柔軟に → 上手に並べ替え
IU
著者らの結論 : case study と user study を見る限り,なかなかよいものができたと思う
Semantic Faceted Search with Aggregation and Recursion
Evgeny Sherkhonov, Bernardo Cuenca Grau, Evgeny Kharlamov and Egor V. Kostylev
• ( 念のため ) Faceted Search って何?
– 選択肢を順に選びながら検索範囲を狭めるもの – 例:プロセッサは, i7 で,メモリは …8 か 16GB ?
• どうして必要?
– 未知データをブラウズするときに飛躍的に楽に
• これを RDF 検索にできるように?
– すでにあるが, aggregation と recursion ができない
→ できるようにしよう!(本研究の貢献)
RE
著者らの結論 : 理論的にそういうクエリができそうなことは確認した!
Diefficiency Metrics: Measuring the Continuous Efficiency of Query Processing Approaches
Maribel Acosta, Maria Esther Vidal and York Sure-Vetter
• Best Resource Paper Nominated
• “diefficiency” = 大量の結果が返るクエリが 来たときに実際の性能がどう出るか
• 2つの指標を提案 : dief@t, dief@k
– dief@t : t 秒間にいくつ分の答えを返せるか
– dief@k : k 個分の答えを返すのに何秒かかるか
• nLDE エンジンで検証
• k=25%,50%,100% をそれぞれ比較等が可能
RO
著者らの結論 : 答えがどんな速度で少しずつ出てくるかを測れますよ
Iguana : A Generic Framework for Benchmarking the Read-Write Performance of Triple Stores
Felix Conrads, Jens Lehmann, Axel-Cyrille Ngonga Ngomo, Muhammad Saleem and Mohamed Morsey
• ポイント : 実用上の性能を多面的に評価可能
– データロード時間などの計測も可能 – クエリの並行実行の計測も可能
• 並行実行 = 同時に複数のクエリを受け付ける状況
– データを update するクエリの性能計測も可能
• 意外なようだがこれが今までになかった
→ アプリ的に静的データへの read が多かったから?
• Iguana 自身がスクリプトのカタマリなので
既存のベンチマークの実行制御も可能
RO
著者らの結論 : Virtuoso が速いですマジで (update 含めると fuseki 強い条件でも勝てる )
・Querying: Benchmakrs
ドキュメント内
ISWC2017サーベイ
(ページ 57-68)