Skip to main content
QUICK REVIEW

[论文解读] Ontology-based Data Access: A Study through Disjunctive Datalog, CSP, and MMSNP

Meghyn Bienvenu, Balder ten Cate|arXiv (Cornell University)|Jan 28, 2013
Semantic Web and Ontologies参考文献 30被引用 55
一句话总结

本文建立了本体媒介查询(OMQs)与逻辑形式化及约束满足问题之间的深层联系,表明基于析取 Datalog、CSP 和 MMSNP 公式的 OMQ 可相互定义。本文证明了关键的不可判定性结果:对于某些本体语言,即使限制在合取查询的并集和一元原子查询的情况下,OMQ 的一阶逻辑可重写性(FO-rewritability)与 Datalog 可重写性(datalog-rewritability)也是不可判定的。

ABSTRACT

Ontology-based data access is concerned with querying incomplete data sources in the presence of domain-specific knowledge provided by an ontology. A central notion in this setting is that of an ontology-mediated query, which is a database query coupled with an ontology. In this paper, we study several classes of ontology-mediated queries, where the database queries are given as some form of conjunctive query and the ontologies are formulated in description logics or other relevant fragments of first-order logic, such as the guarded fragment and the unary-negation fragment. The contributions of the paper are three-fold. First, we characterize the expressive power of ontology-mediated queries in terms of fragments of disjunctive datalog. Second, we establish intimate connections between ontology-mediated queries and constraint satisfaction problems (CSPs) and their logical generalization, MMSNP formulas. Third, we exploit these connections to obtain new results regarding (i) first-order rewritability and datalog-rewritability of ontology-mediated queries, (ii) P/NP dichotomies for ontology-mediated queries, and (iii) the query containment problem for ontology-mediated queries.

研究动机与目标

  • 通过析取 Datalog 的片段来刻画本体媒介查询(OMQ)的表达能力。
  • 建立 OMQ 与约束满足问题(CSP)及其逻辑推广形式 MMSNP 公式之间的正式联系。
  • 确定 OMQ 中基本问题的可判定性与复杂度,包括一阶逻辑可重写性与 Datalog 可重写性、数据复杂度以及查询包含性。
  • 提供一个统一的框架,基于逻辑与计算属性对 OMQ 进行分类,特别是在描述逻辑与受控片段的背景下。

提出的方法

  • 将 OMQ 可重写性问题归约为 MMSNP 公式的可满足性与 CSP 实例的可满足性问题。
  • 使用平铺问题作为归约目标,以证明一阶逻辑可重写性与 Datalog 可重写性的不可判定性。
  • 构造特定的本体与数据实例,以模拟平铺问题与三着色问题,从而证明不可判定性。
  • 通过 OMQ、析取 Datalog 与 MMSNP 之间的逻辑转换,建立不同形式化之间的表达等价性。
  • 以受控片段(GF)、一元否定片段(UNFO)与受控否定片段(GNFO)作为核心本体语言。
  • 运用模型论技术证明:若不存在有限的反例集合,则可直接推出非一阶逻辑可重写性。

实验结果

研究问题

  • RQ1本体媒介查询在析取 Datalog 片段中的表达能力如何?
  • RQ2本体媒介查询与约束满足问题(CSP)及 MMSNP 公式之间有何关系?
  • RQ3在标准描述逻辑与受控片段上,本体媒介查询的一阶逻辑可重写性是否可判定?
  • RQ4本体媒介查询的 Datalog 可重写性是否可判定?其复杂度界限为何?
  • RQ5本体媒介查询的数据复杂度如何?在此设置下是否存在 P/NP 二分法?

主要发现

  • 对于包含受控片段与一元否定片段的本体语言,本体媒介查询的一阶逻辑可重写性是不可判定的。
  • 即使限制在合取查询的并集与一元原子查询的情况下,本体媒介查询的 Datalog 可重写性同样是不可判定的。
  • 本文建立了 OMQ 与 MMSNP 公式之间的紧密对应关系,表明 OMQ 可以表达且仅能表达 MMSNP 可定义的查询类。
  • 当本体固定且查询为合取查询的并集时,OMQ 的数据复杂度满足 P/NP 二分法。
  • 即使限制在一元原子查询与简单本体语言的情况下,本体媒介查询的查询包含性也是不可判定的。
  • 对于某个 OMQ 是否存在有限反例集合的问题是不可判定的,这直接意味着在这些情况下无法实现一阶逻辑可重写性。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。