福田直樹（静岡大学）

・Querying II

4. 福田直樹（静岡大学）

Querying(I)

ISWC2017 Conference Session Preview

by N. Fukuta (Shizuoka Univ.)

International Semantic Web Conference 2017 Conference Session Preview

Track: RE=Research, RO=Resource, IU=InUse, JO=Journal

Temporal Query Answering in DL-Lite over Inconsistent Data

Camille Bourgaux and Anni-Yasmin Turhan

• データストリームに対するクエリを対象

– 「ついさっき過負荷になりかけたサーバってこの前も過負荷になりかけてなかったっけ？」

↑

この下線部を推論で出したい (→ Linear Temporal Logic : LTL )

• LTL 推論への拡張をした DL-Lite _R クエリを Inconsistency に頑健になるように拡張

– 主に理論的な性質 ( 計算量など ) を解析

RE

著者らの結論 : よい条件で P ，あとは NP-complete でできるよ！

A Formal Framework for Comparing Linked Data Fragments

Olaf Hartig, Ian Letter and Jorge Pérez

• Best Research Paper!

• Linked Data へのアクセスは SPARQL クエリ？

– RDF ソースのダンプや簡易パターンなど複数種 – 疑問：どの公開方法 (Interface) でどこまでできる ?

• TuringMachine を拡張した LDFMachine を定義

– “expressiveness lattice” を明らかに

• coreSPARQL なのか BGP なのか Federated なのか etc.

– どの複雑さをどこ ( サーバ or クライアント ?) でということも考慮

RE

著者らの結論 : どの複雑さが Computable なのか等を明らかにできたよ

Computing FO-Rewritings in EL in Practice:

from Atomic to Conjunctive Queries Peter Hansen and Carsten Lutz

• FO(First-Order)Rewriting

– 一階述語論理のクエリへの書き換え

( 備考 : 一階述語論理の∧節表現は SQL の基本 ) – 疑問：この変換はそもそも計算できるのか？

• いつ使いたいのか？

– Ontology-Mediated Queries に使いたい

• ある患者 X が症状 A と症状 B を併発してて

それが同じ遺伝子異常 Z からきてるの X,A,B,Z は？

• 性能は？ → 平均で 0.5 ～ 20 秒でできる

RE

著者らの結論 : これくらい性能出てるならいいんじゃないのか？

Strider: A Hybrid Adaptive Distributed RDF Stream Processing Engine

Xiangnan Ren and Olivier Curé

• 一言で言うと？

Apache Spark/Kafka を上手に使って

RDF データストリームを industry レベルの耐故障性やスケーラビリティなどを持つ感じで作れましたよ，というもの

• 特長：データの来かたの変化に適応可能

– ルールベース or 実行時の時間 (?) に応じて

• 実世界データに準拠した合成データで評価

– C-SPARQL とかよりもスループット出てます！

RE

著者らの結論 : たぶんこの目的では結構いいものできたんじゃないかと

人工知能学会研究会資料 SIG-SWO-044-13

Querying(II)

ISWC2017 Conference Session Preview

International Semantic Web Conference 2017 Conference Session Preview

Track: RE=Research, RO=Resource, IU=InUse, JO=Journal

An Investigative Search Engine for Social Good (for the Human Trafficking Domain?)

Mayank Kejriwal and Pedro Szekely

• Faceted search などをできるようにした intelligent search engine を実装

• 200+ の US law enforcement agencies で活用

– Human Trafficking の分野で活用これを起点に Dark Web に挑む！

• Domain specific Insight Graph(DIG) に対応

• Soft Boolean Tree Query に対応

– Must/Should などで柔軟に → 上手に並べ替え

IU

著者らの結論 : case study と user study を見る限り，なかなかよいものができたと思う

Semantic Faceted Search with Aggregation and Recursion

Evgeny Sherkhonov, Bernardo Cuenca Grau, Evgeny Kharlamov and Egor V. Kostylev

• ( 念のため ) Faceted Search って何？

– 選択肢を順に選びながら検索範囲を狭めるもの – 例：プロセッサは， i7 で，メモリは …8 か 16GB ？

• どうして必要？

– 未知データをブラウズするときに飛躍的に楽に

• これを RDF 検索にできるように？

– すでにあるが， aggregation と recursion ができない

→ できるようにしよう！（本研究の貢献）

RE

著者らの結論 : 理論的にそういうクエリができそうなことは確認した！

Diefficiency Metrics: Measuring the Continuous Efficiency of Query Processing Approaches

Maribel Acosta, Maria Esther Vidal and York Sure-Vetter

• Best Resource Paper Nominated

• “diefficiency” = 大量の結果が返るクエリが来たときに実際の性能がどう出るか

• ２つの指標を提案 : dief@t, dief@k

– dief@t : t 秒間にいくつ分の答えを返せるか

– dief@k : k 個分の答えを返すのに何秒かかるか

• nLDE エンジンで検証

• k=25%,50%,100% をそれぞれ比較等が可能

RO

著者らの結論 : 答えがどんな速度で少しずつ出てくるかを測れますよ

Iguana : A Generic Framework for Benchmarking the Read-Write Performance of Triple Stores

Felix Conrads, Jens Lehmann, Axel-Cyrille Ngonga Ngomo, Muhammad Saleem and Mohamed Morsey

• ポイント : 実用上の性能を多面的に評価可能

– データロード時間などの計測も可能 – クエリの並行実行の計測も可能

• 並行実行 = 同時に複数のクエリを受け付ける状況

– データを update するクエリの性能計測も可能

• 意外なようだがこれが今までになかった

→ アプリ的に静的データへの read が多かったから？

• Iguana 自身がスクリプトのカタマリなので

既存のベンチマークの実行制御も可能

RO

著者らの結論 : Virtuoso が速いですマジで (update 含めると fuseki 強い条件でも勝てる )

・Querying: Benchmakrs

ドキュメント内 ISWC2017サーベイ (ページ 57-68)

・Querying II

4. 福田直樹（静岡大学）

Querying(I)

ISWC2017 Conference Session Preview

by N. Fukuta (Shizuoka Univ.)

International Semantic Web Conference 2017 Conference Session Preview

Track: RE=Research, RO=Resource, IU=InUse, JO=Journal

Temporal Query Answering in DL-Lite over Inconsistent Data

Camille Bourgaux and Anni-Yasmin Turhan

• データストリームに対するクエリを対象

– 「ついさっき過負荷になりかけたサーバって この前も過負荷になりかけてなかったっけ？」

↑

この下線部を推論で出したい (→ Linear Temporal Logic : LTL )

• LTL 推論への拡張をした DL-Lite R クエリを Inconsistency に頑健になるように拡張

– 主に理論的な性質 ( 計算量など ) を解析

RE

著者らの結論 : よい条件で P ，あとは NP-complete でできるよ！

A Formal Framework for Comparing Linked Data Fragments

Olaf Hartig, Ian Letter and Jorge Pérez

• Best Research Paper!

• Linked Data へのアクセスは SPARQL クエリ？

– RDF ソースのダンプや簡易パターンなど複数種 – 疑問：どの公開方法 (Interface) でどこまでできる ?

• TuringMachine を拡張した LDFMachine を定義

– “expressiveness lattice” を明らかに

• coreSPARQL なのか BGP なのか Federated なのか etc.

– どの複雑さをどこ ( サーバ or クライアント ?) で ということも考慮

RE

著者らの結論 : どの複雑さが Computable なのか等を明らかにできたよ

Computing FO-Rewritings in EL in Practice:

from Atomic to Conjunctive Queries Peter Hansen and Carsten Lutz

• FO(First-Order)Rewriting

– 一階述語論理のクエリへの書き換え

( 備考 : 一階述語論理の∧節表現は SQL の基本 ) – 疑問：この変換はそもそも計算できるのか？

• いつ使いたいのか？

– Ontology-Mediated Queries に使いたい

• ある患者 X が症状 A と症状 B を併発してて

それが同じ遺伝子異常 Z からきてる の X,A,B,Z は？

• 性能は？ → 平均で 0.5 ～ 20 秒でできる

RE

著者らの結論 : これくらい性能出てるならいいんじゃないのか？

Strider: A Hybrid Adaptive Distributed RDF Stream Processing Engine

Xiangnan Ren and Olivier Curé

• 一言で言うと？

Apache Spark/Kafka を上手に使って

RDF データストリームを industry レベルの 耐故障性やスケーラビリティなどを持つ 感じで作れましたよ，というもの

• 特長：データの来かたの変化に適応可能

– ルールベース or 実行時の時間 (?) に応じて

• 実世界データに準拠した合成データで評価

– C-SPARQL とかよりもスループット出てます！

RE

著者らの結論 : たぶんこの目的では結構いいものできたんじゃないかと

Querying(II)

ISWC2017 Conference Session Preview

International Semantic Web Conference 2017 Conference Session Preview

Track: RE=Research, RO=Resource, IU=InUse, JO=Journal

An Investigative Search Engine for Social Good (for the Human Trafficking Domain?)

Mayank Kejriwal and Pedro Szekely

• Faceted search などをできるようにした intelligent search engine を実装

• 200+ の US law enforcement agencies で活用

– Human Trafficking の分野で活用 これを起点に Dark Web に挑む！

• Domain specific Insight Graph(DIG) に対応

• Soft Boolean Tree Query に対応

– Must/Should などで柔軟に → 上手に並べ替え

IU

著者らの結論 : case study と user study を見る限り，なかなかよいものができたと思う

Semantic Faceted Search with Aggregation and Recursion

Evgeny Sherkhonov, Bernardo Cuenca Grau, Evgeny Kharlamov and Egor V. Kostylev

• ( 念のため ) Faceted Search って何？

– 選択肢を順に選びながら検索範囲を狭めるもの – 例：プロセッサは， i7 で，メモリは …8 か 16GB ？

• どうして必要？

– 未知データをブラウズするときに飛躍的に楽に

• これを RDF 検索にできるように？

– すでにあるが， aggregation と recursion ができない

→ できるようにしよう！（本研究の貢献）

RE

著者らの結論 : 理論的にそういうクエリができそうなことは確認した！

Diefficiency Metrics: Measuring the Continuous Efficiency of Query Processing Approaches

Maribel Acosta, Maria Esther Vidal and York Sure-Vetter

• Best Resource Paper Nominated

– 「ついさっき過負荷になりかけたサーバってこの前も過負荷になりかけてなかったっけ？」

• LTL 推論への拡張をした DL-Lite _R クエリを Inconsistency に頑健になるように拡張

– どの複雑さをどこ ( サーバ or クライアント ?) でということも考慮

それが同じ遺伝子異常 Z からきてるの X,A,B,Z は？

RDF データストリームを industry レベルの耐故障性やスケーラビリティなどを持つ感じで作れましたよ，というもの

– Human Trafficking の分野で活用これを起点に Dark Web に挑む！

• “diefficiency” = 大量の結果が返るクエリが来たときに実際の性能がどう出るか