Skip to main content
QUICK REVIEW

[论文解读] Rewriting Ontological Queries into Small Nonrecursive Datalog Programs

Georg Gottlob, Thomas Schwentick|arXiv (Cornell University)|Jun 19, 2011
Logic, Reasoning, and Knowledge参考文献 31被引用 77
一句话总结

本文提出了一种多项式时间方法,将用 DL-Lite 或 Linear Datalog ± 表达的本体查询重写为小型非递归 Datalog 程序,避免了查询规模的指数级膨胀。其关键贡献在于证明了此类重写存在,并且当底层的元组生成依赖满足多项式见证性质时,可以高效构造出来。

ABSTRACT

We consider the setting of ontological database access, where an Abox is given in form of a relational database D and where a Boolean conjunctive query q has to be evaluated against D modulo a Tbox T formulated in DL-Lite or Linear Datalog+/-. It is well-known that (T,q) can be rewritten into an equivalent nonrecursive Datalog program P that can be directly evaluated over D. However, for Linear Datalog? or for DL-Lite versions that allow for role inclusion, the rewriting methods described so far result in a nonrecursive Datalog program P of size exponential in the joint size of T and q. This gives rise to the interesting question of whether such a rewriting necessarily needs to be of exponential size. In this paper we show that it is actually possible to translate (T,q) into a polynomially sized equivalent nonrecursive Datalog program P.

研究动机与目标

  • 解决在使用 DL-Lite 或 Linear Datalog ± 配合角色包含时,本体数据库查询重写中出现的指数级膨胀问题。
  • 研究是否可以将查询重写为非递归 Datalog 程序,并保持其大小为多项式级别,而非先前方法中的指数级别。
  • 建立此类多项式大小重写的条件,重点关注依赖关系的结构特性。
  • 通过将本体查询编译为等价的非递归 Datalog 程序,为利用标准 DBMS 技术实现高效查询评估提供理论基础。

提出的方法

  • 利用 chase 过程来模拟数据库上元组生成依赖(tgds)的逻辑结果。
  • 引入多项式见证性质(PWP)作为确保查询蕴含关系可在多项式数量的 chase 步骤内被见证的充分条件。
  • 通过编码在 PWP 所保证的多项式边界内的 chase 推导过程,构建一个非递归 Datalog 程序。
  • 使用目标谓词表示查询结果,确保当且仅当原始查询被蕴含时,Datalog 程序才会推导出该目标。
  • 当无全局顺序时,通过线性排序或对数编码控制 Datalog 谓词的元数。
  • 通过证明其满足 PWP,将该方法应用于特定类型的 tgds,包括线性 tgds、粘性 tgds 和粘性连接 tgds。

实验结果

研究问题

  • RQ1是否可以将 DL-Lite 或 Linear Datalog ± 中的本体查询重写为大小为多项式的非递归 Datalog 程序?
  • RQ2是否存在一种元组生成依赖的结构性质,可保证多项式大小的重写?
  • RQ3是否可以利用 chase 过程高效构造此类重写,而不会导致指数级膨胀?
  • RQ4像粘性 tgds 和粘性连接 tgds 这类允许角色包含的形式化系统,是否支持多项式大小的非递归 Datalog 重写?
  • RQ5最终 Datalog 程序所需的最小元数是多少?它如何依赖于输入模式和查询?

主要发现

  • 对于任何满足多项式见证性质(PWP)的 tgds 类,每个布尔性合取查询均可重写为大小为查询与 T-Box 联合大小的多项式级别的非递归 Datalog 程序。
  • 在存在全局线性顺序的前提下,最终 Datalog 程序的元数最多为 max(a+1, 3),其中 a 是模式中谓词的最大元数。
  • 在无全局顺序的情况下,元数被限制在 O(max(a+1, 3) · log m) 以内,其中 m 是查询与 T-Box 的联合大小。
  • 该方法适用于多个重要形式化系统,包括线性 tgds、支持角色包含的 DL-Lite 变体以及粘性 tgds,这些系统均满足 PWP。
  • 该构造过程在多项式时间内运行,使得通过 SQL 翻译在标准 DBMS 上实现高效预处理成为可能。
  • 本研究结果扩展了先前工作,即使在存在角色包含公理的情况下,也避免了查询大小的指数级膨胀,而这类公理此前已知会导致重写大小的指数增长。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。