[论文解读] Finding Smallest Witnesses for Conjunctive Queries
本文研究无自连接的合取查询(CQs)的最小见证问题(SWP),建立了一个二分法:当且仅当查询具有头簇性质时,SWP 可在多项式时间内求解。在近似方面,本文识别出头支配性为关键性质——具有该性质的查询可实现常数因子近似,而缺乏该性质的查询除非 P = NP,否则无法在对数因子内近似。本文进一步为特定 CQ 类型提供了近似算法,包括贪心算法与基于归约的方法,并建立了严格的不可近似性下界。
A witness is a sub-database that preserves the query results of the original database but of much smaller size. It has wide applications in query rewriting and debugging, query explanation, IoT analytics, multi-layer network routing, etc. In this paper, we study the smallest witness problem (SWP) for the class of conjunctive queries (CQs) without self-joins. We first establish the dichotomy that SWP for a CQ can be computed in polynomial time if and only if it has head-cluster property, unless P = NP. We next turn to the approximated version by relaxing the size of a witness from being minimum. We surprisingly find that the head-domination property - that has been identified for the deletion propagation problem [Kimelfeld et al., 2012] - can also precisely capture the hardness of the approximated smallest witness problem. In polynomial time, SWP for any CQ with head-domination property can be approximated within a constant factor, while SWP for any CQ without such a property cannot be approximated within a logarithmic factor, unless P = NP. We further explore efficient approximation algorithms for CQs without head-domination property: (1) we show a trivial algorithm which achieves a polynomially large approximation ratio for general CQs; (2) for any CQ with only one non-output attribute, such as star CQs, we show a greedy algorithm with a logarithmic approximation ratio; (3) for line CQs, which contain at least two non-output attributes, we relate SWP problem to the directed steiner forest problem, whose algorithms can be applied to line CQs directly. Meanwhile, we establish a much higher lower bound, exponentially larger than the logarithmic lower bound obtained above. It remains open to close the gap between the lower and upper bound of the approximated SWP for CQs without head-domination property.
研究动机与目标
- 确定无自连接的合取查询中计算最小见证问题的精确可 tractability 边界。
- 利用头支配性性质表征最小见证问题的可近似性。
- 为缺乏头支配性的 CQs 设计高效的近似算法,特别是针对星型与线性 CQs。
- 为缺乏头支配性的 CQs 中的近似 SWP 问题建立紧致的不可近似性下界。
- 探索 SWP 与其他基本问题(如有向斯坦纳森林与部分集合覆盖)之间的联系。
提出的方法
- 证明一个二分法:在假设 P ≠ NP 的前提下,SWP 属于 P 当且仅当查询具有头簇性质。
- 引入头支配性性质,作为可近似性的精确刻画:当且仅当头支配性成立时,才可实现常数因子近似。
- 提出一种平凡的近似算法,对一般 CQs 具有多项式近似比。
- 设计一种贪心算法,对仅含一个非输出属性的 CQs(如星型 CQs)实现对数近似比。
- 将线性 CQs 的 SWP 归约为有向斯坦纳森林(DSF)问题,从而可应用现有的 DSF 算法。
- 通过从标签覆盖问题到线性 CQs 的 SWP 的直接归约,建立超多项式不可近似性下界,表明其不可近似性下界为 Ω(2(log N)^{1−ϵ})。
实验结果
研究问题
- RQ1在何种条件下,合取查询的最小见证问题(SWP)可在多项式时间内求解?
- RQ2合取查询的何种结构性质决定了 SWP 是否可实现常数因子近似?
- RQ3我们能否为缺乏头支配性性质的 CQs 设计高效的近似算法?
- RQ4对于缺乏头支配性性质的 CQs,SWP 的最强可能不可近似性下界是什么?
- RQ5SWP 与有向斯坦纳森林、部分集合覆盖等其他基本问题有何关联?
主要发现
- 在假设 P ≠ NP 的前提下,合取查询的 SWP 可在多项式时间内求解当且仅当该查询具有头簇性质。
- 头支配性性质精确刻画了 SWP 的可近似性:当且仅当头支配性成立时,才可实现常数因子近似。
- 对于缺乏头支配性的 CQs,除非 P = NP,否则不存在多项式时间算法能实现对数因子近似比。
- 贪心算法对仅含一个非输出属性的 CQs(如星型 CQs)可实现对数近似比。
- 对于线性 CQs,SWP 可归约为有向斯坦纳森林问题,从而实现 O(min{|Q(D)|^{1/2+o(1)}, dom^{0.5778}, N^{1/2}}) 的近似。
- 在假设 P ≠ NP 的前提下,为线性 CQs 上的 SWP 建立了 Ω(2(log N)^{1−ϵ}) 的指数不可近似性下界。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。