Skip to main content
QUICK REVIEW

[論文レビュー] Validating RDF with Shape Expressions.

Iovka Boneva, José Emilio Labra Gayo|arXiv (Cornell University)|Apr 4, 2014
Semantic Web and Ontologies参考文献 34被引用数 23
ひとこと要約

この論文は、ノードの近傍を制約する正則被袋式(RBEs)を用いてRDFグラフを検証するスキーマ形式であるShape Expression(ShEx)を導入する。多型検証は、単一出現RBE(SORBE)を用いた決定的スキーマにおいては tractable(多項式時間で解ける)であることが示され、一方単一型検証は依然として非 tractable(NP困難)であるが、決定的SORBEベースのスキーマでは一回のパスで効率的な検証が可能である。

ABSTRACT

We propose shape expression schema (ShEx), a novel schema formalism for describing the topology of an RDF graph that uses regular bag expressions (RBEs) to define con-straints on the admissible neighborhood for the nodes of a given type. We provide two alternative semantics, multi- and single-type, depending on whether or not a node may have more than one type. We study the expressive power of ShEx and study the complexity of the validation problem. We show that the single-type semantics is strictly more ex-pressive than the multi-type semantics, single-type validation is generally intractable and multi-type validation is feasible for a small class of RBEs. To further curb the high com-putational complexity of validation, we propose a natural notion of determinism and show that multi-type validation for the class of deterministic schemas using single-occurrence regular bag expressions (SORBEs) is tractable. Finally, we consider the problem of val-idating only a fragment of a graph with preassigned types for some of its nodes, and argue that for deterministic ShEx using SORBEs, multi-type validation can be performed efficiently and single-type validation can be performed with a single pass over the graph. 1

研究の動機と目的

  • RDFグラフの構造的トポロジーを正確な近傍制約で記述できるスキーマ言語の必要性に対処すること。
  • RDFスキーマ検証における2つの意味論—多型と単一型—を定義・比較し、ノードが複数の型をもてるかどうかを捉えること。
  • これらの意味論下でのRDF検証の計算複雑性を分析し、 tractable(多項式時間で解ける)な部分クラスを同定すること。
  • 検証の複雑性を低減するために、決定性と単一出現正則被袋式(SORBE)を導入すること。
  • 特に決定的ShExスキーマ下で、事前にノードの型が割り当てられたグラフ断片に対して効率的な検証を可能にすること。

提案手法

  • ノードの特定の型に関する近傍制約を定義するために正則被袋式(RBEs)を用いるスキーマ形式Shape Expression(ShEx)を提案する。
  • 2つの意味論を定義する:多型(ノードは複数の型をもてる)と単一型(ノードは正確に1つの型をもつ)、それぞれ異なる検証動作を示す。
  • ShExの表現力の分析を行い、単一型意味論が多型意味論よりも厳密に表現力が強いことを示す。
  • 曖昧なパスパターンを制限し、検証の複雑性を低減するために、ShExスキーマにおける決定性の概念を導入する。
  • 検証が効率的に行えるRBEの部分クラスである単一出現正則被袋式(SORBE)に焦点を当てる。
  • 多型検証は、SORBEを用いた決定的スキーマにおいては tractable であり、グラフを一回のパスで効率的に検証可能であることを示す。

実験結果

リサーチクエスチョン

  • RQ1ShExにおける単一型意味論の表現力は、多型意味論と比べてどのように異なるか?
  • RQ2多型および単一型ShEx意味論下でのRDFグラフ検証の計算複雑性は何か?
  • RQ3ShExスキーマにおける決定性は検証の複雑性を低減できるか? もしそうなら、どのような条件下で可能か?
  • RQ4ノードの型が事前に割り当てられたグラフ断片を検証する場合、効率的な検証が可能か?
  • RQ5単一型意味論下で、決定的ShExスキーマにSORBEを適用した場合、一回のパスによる検証が達成可能か?

主な発見

  • 単一型意味論は、より細かく制御された構造的制約を許容できるため、多型意味論よりも厳密に表現力が強い。
  • 複数の型割り当ての推論に高い計算複雑性が伴うため、単一型検証は一般的に非 tractable(NP困難)である。
  • 多型検証はRBEの小さなクラスでのみ可能だが、決定性とSORBEの導入により tractable になる。
  • 決定的ShExスキーマにSORBEを用いる場合、多型検証は tractable であり、グラフ断片に対しても効率的に実行可能である。
  • 決定的SORBEベースのスキーマでは、単一型検証をグラフを一回のパスで実行することで達成でき、効率的な処理が可能である。
  • 決定性とSORBEの導入により、検証の計算複雑性が効果的に抑制され、ShExが実世界のRDFデータに対して実用的になる。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。