[论文解读] Rewriting Ontological Queries into Small Nonrecursive Datalog Programs
本文提出了一种多项式时间方法,将用 DL-Lite 或 Linear Datalog ± 表达的本体查询重写为小型非递归 Datalog 程序,避免了查询规模的指数级膨胀。其关键贡献在于证明了此类重写存在,并且当底层的元组生成依赖满足多项式见证性质时,可以高效构造出来。
We consider the setting of ontological database access, where an Abox is given in form of a relational database D and where a Boolean conjunctive query q has to be evaluated against D modulo a Tbox T formulated in DL-Lite or Linear Datalog+/-. It is well-known that (T,q) can be rewritten into an equivalent nonrecursive Datalog program P that can be directly evaluated over D. However, for Linear Datalog? or for DL-Lite versions that allow for role inclusion, the rewriting methods described so far result in a nonrecursive Datalog program P of size exponential in the joint size of T and q. This gives rise to the interesting question of whether such a rewriting necessarily needs to be of exponential size. In this paper we show that it is actually possible to translate (T,q) into a polynomially sized equivalent nonrecursive Datalog program P.
研究动机与目标
- 解决在使用 DL-Lite 或 Linear Datalog ± 配合角色包含时,本体数据库查询重写中出现的指数级膨胀问题。
- 研究是否可以将查询重写为非递归 Datalog 程序,并保持其大小为多项式级别,而非先前方法中的指数级别。
- 建立此类多项式大小重写的条件,重点关注依赖关系的结构特性。
- 通过将本体查询编译为等价的非递归 Datalog 程序,为利用标准 DBMS 技术实现高效查询评估提供理论基础。
提出的方法
- 利用 chase 过程来模拟数据库上元组生成依赖(tgds)的逻辑结果。
- 引入多项式见证性质(PWP)作为确保查询蕴含关系可在多项式数量的 chase 步骤内被见证的充分条件。
- 通过编码在 PWP 所保证的多项式边界内的 chase 推导过程,构建一个非递归 Datalog 程序。
- 使用目标谓词表示查询结果,确保当且仅当原始查询被蕴含时,Datalog 程序才会推导出该目标。
- 当无全局顺序时,通过线性排序或对数编码控制 Datalog 谓词的元数。
- 通过证明其满足 PWP,将该方法应用于特定类型的 tgds,包括线性 tgds、粘性 tgds 和粘性连接 tgds。
实验结果
研究问题
- RQ1是否可以将 DL-Lite 或 Linear Datalog ± 中的本体查询重写为大小为多项式的非递归 Datalog 程序?
- RQ2是否存在一种元组生成依赖的结构性质,可保证多项式大小的重写?
- RQ3是否可以利用 chase 过程高效构造此类重写,而不会导致指数级膨胀?
- RQ4像粘性 tgds 和粘性连接 tgds 这类允许角色包含的形式化系统,是否支持多项式大小的非递归 Datalog 重写?
- RQ5最终 Datalog 程序所需的最小元数是多少?它如何依赖于输入模式和查询?
主要发现
- 对于任何满足多项式见证性质(PWP)的 tgds 类,每个布尔性合取查询均可重写为大小为查询与 T-Box 联合大小的多项式级别的非递归 Datalog 程序。
- 在存在全局线性顺序的前提下,最终 Datalog 程序的元数最多为 max(a+1, 3),其中 a 是模式中谓词的最大元数。
- 在无全局顺序的情况下,元数被限制在 O(max(a+1, 3) · log m) 以内,其中 m 是查询与 T-Box 的联合大小。
- 该方法适用于多个重要形式化系统,包括线性 tgds、支持角色包含的 DL-Lite 变体以及粘性 tgds,这些系统均满足 PWP。
- 该构造过程在多项式时间内运行,使得通过 SQL 翻译在标准 DBMS 上实现高效预处理成为可能。
- 本研究结果扩展了先前工作,即使在存在角色包含公理的情况下,也避免了查询大小的指数级膨胀,而这类公理此前已知会导致重写大小的指数增长。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。