Skip to main content
QUICK REVIEW

[论文解读] Combined Tractability of Query Evaluation via Tree Automata and Cycluits

Antoine Amarilli, Pierre Bourhis|arXiv (Cornell University)|Dec 13, 2016
Advanced Graph Theory Research参考文献 14被引用 2
一句话总结

本文提出了一种带分层否定的可扩展团守卫Datalog(ICG-Datalog),该语言可在有界树宽数据库上实现以规则大小为参数的固定参数可满足性线性(FPT-linear)评估。其通过将查询编译为交替双向树自动机,并利用具有分层语义的循环证明电路(cycluits)实现高效评估,同时表明在此参数化下,概率查询评估仍为不可解。

ABSTRACT

Several query evaluation tasks can be done via knowledge compilation: the query result is compiled as a lineage circuit from which the answer can be determined. For such tasks, it is important to leverage some width parameters of the circuit, such as bounded treewidth or pathwidth, to convert the circuit to structured classes, e.g., deterministic structured NNFs (d-SDNNFs) or OBDDs. In this work, we show how to connect the width of circuits to the size of their structured representation, through upper and lower bounds. For the upper bound, we show how bounded-treewidth circuits can be converted to a d-SDNNF, in time linear in the circuit size. Our bound, unlike existing results, is constructive and only singly exponential in the treewidth. We show a related lower bound on monotone DNF or CNF formulas, assuming a constant bound on the arity (size of clauses) and degree (number of occurrences of each variable). Specifically, any d-SDNNF (resp., SDNNF) for such a DNF (resp., CNF) must be of exponential size in its treewidth; and the same holds for pathwidth when compiling to OBDDs. Our lower bounds, in contrast with most previous work, apply to any formula of this class, not just a well-chosen family. Hence, for our language of DNF and CNF, pathwidth and treewidth respectively characterize the efficiency of compiling to OBDDs and (d-)SDNNFs, that is, compilation is singly exponential in the width parameter. We conclude by applying our lower bound results to the task of query evaluation.

研究动机与目标

  • 识别查询与数据库的参数化类别,使得联合查询评估为固定参数可满足性(FPT)。
  • 填补在树状(有界树宽)数据库上查询评估的可解联合复杂度方面的空白。
  • 开发一种编译框架,通过自动机与证明追踪实现高效评估。
  • 表明即使在所提出的参数化下,概率查询评估仍为不可解。
  • 形式化并证明在有界树宽且带有团守卫的条件下,如双向正则路径查询和α-无环合取查询等查询类的可解性。

提出的方法

  • 提出ICG-Datalog,一种带有分层否定、团守卫和膨胀不动点的Datalog片段。
  • 将ICG-Datalog程序编译为交替双向树自动机,以在树状实例上实现高效评估。
  • 引入cycluits——具有分层语义的循环证明电路——以表示并线性时间评估自动机的证明。
  • 使用带团守卫的树分解(即单纯分解)作为可解性的结构参数。
  • 通过cycluits提出一种新颖的自动机操作语义,以处理递归与双向遍历。
  • 将查询评估归约为自动机的空性检测,利用有界树宽实例的树状模型特性。

实验结果

研究问题

  • RQ1我们能否在有界树宽数据库上实现以规则大小为参数的固定参数可满足性(FPT)线性联合复杂度查询评估?
  • RQ2我们能否定义一种Datalog片段,使其在有界树宽下能够捕捉如α-无环合取查询和双向正则路径查询等可解查询类?
  • RQ3是否存在一种证明表示方法,能高效处理基于自动机的查询编译中的递归与双向遍历?
  • RQ4cycluits——具有分层语义的循环电路——能否实现线性时间评估,并作为布尔电路或公式的可行替代方案?
  • RQ5所提出的参数化是否能保持概率查询评估的可解性?

主要发现

  • ICG-Datalog实现了以规则大小为参数的有界树宽数据库上的FPT线性联合复杂度查询评估。
  • 该语言能够捕捉α-无环合取查询、有界CQ秩的守卫否定片段查询以及双向正则路径查询。
  • Cycluits可实现对交替双向自动机的证明的线性时间评估,在处理递归与双向遍历方面优于传统公式或电路。
  • 仅靠有界树宽不足以实现对自动机的高效编译,如通过下界结果所示:无团守卫时,树宽不足以保证效率。
  • 即使在所提出的参数化下,概率查询评估在联合复杂度下仍为不可解。
  • 本文建立了单元Datalog在有界树宽合取查询中包含关系的2EXPTIME难性结果,与一般上界一致。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。