[论文解读] A Dichotomy on the Complexity of Consistent Query Answering for Atoms with Simple Keys
本文建立了不含自连接的布尔合取查询中一致查询回答(CQA)复杂性的二分性,其中每个原子具有单属性主键(简单主键)或所有属性的复合主键。作者证明,对于此类查询,问题 CERTAINTY(Q) 要么属于 PTIME,要么属于 coNP-完全,通过一种新颖的基于图的查询与主键约束结构分析,证实了该设定下长期存在的一个猜想。
We study the problem of consistent query answering under primary key violations. In this setting, the relations in a database violate the key constraints and we are interested in maximal subsets of the database that satisfy the constraints, which we call repairs. For a boolean query Q, the problem CERTAINTY(Q) asks whether every such repair satisfies the query or not; the problem is known to be always in coNP for conjunctive queries. However, there are queries for which it can be solved in polynomial time. It has been conjectured that there exists a dichotomy on the complexity of CERTAINTY(Q) for conjunctive queries: it is either in PTIME or coNP-complete. In this paper, we prove that the conjecture is indeed true for the case of conjunctive queries without self-joins, where each atom has as a key either a single attribute (simple key) or all attributes of the atom.
研究动机与目标
- 解决长期存在的猜想,即布尔合取查询的 CERTAINTY(Q) 要么属于 PTIME,要么属于 coNP-完全。
- 分析在主键违反条件下的一致查询回答的复杂性,重点关注不含自连接且具有简单主键或全属性主键的查询。
- 识别查询图中的结构条件,以确定 CERTAINTY(Q) 是可 tractable 还是不可 tractable。
- 通过引入非树状结构中一致关系的概念,将先前关于一阶可表达性与可 tractability 的结果推广到更广泛的查询类。
提出的方法
- 构建一个有向查询图 G[Q],其中顶点为变量,边表示原子之间的连接条件。
- 基于主键约束和查询结构,定义一个变量上的标记函数 L,使用从主键属性导出的逻辑表达式。
- 引入 (R,S)-有效标记的概念,以刻画在主键约束下关系对的一致行为。
- 通过从 3-SAT 的约化,证明当标记导致重言式矛盾时,问题为 coNP-完全。
- 证明当标记产生一致且非重言式的表达式时,通过一阶重写构造,CERTAINTY(Q) 属于 PTIME。
- 利用洞察:在主键约束下,某些关系对可表现为一致关系,从而简化修复空间。
实验结果
研究问题
- RQ1对于不含自连接且具有简单主键或全属性主键的布尔合取查询,CERTAINTY(Q) 的复杂性是否存在二分性?
- RQ2在查询图和主键约束的何种结构条件下,CERTAINTY(Q) 属于 PTIME 而非 coNP-完全?
- RQ3主键约束的存在是否可用于将多个关系合并为一个有效的一致关系,从而简化修复空间?
- RQ4在无自连接且使用简单主键的条件下,是否能够对 CERTAINTY(Q) 进行完整的分类,划分为 PTIME 和 coNP-完全?
- RQ5变量上的标记函数 L 是否可用于算法性地确定 CERTAINTY(Q) 的复杂度类?
主要发现
- 对于不含自连接且具有简单主键或全属性主键的布尔合取查询,CERTAINTY(Q) 要么属于 PTIME,要么属于 coNP-完全,证实了该类的猜想。
- 分类由基于主键约束和连接结构在查询变量上定义的标记函数 L 的逻辑一致性决定。
- 当标记函数 L 的值为重言式(例如,⊥)时,问题为 coNP-完全;否则,属于 PTIME。
- 本文引入了一致关系的概念,表明具有共享主键属性的原子对可在修复空间中被视为单一的一致关系。
- 对于查询 Q₁=R(x̲,y),S(y̲,z),CERTAINTY(Q) 属于 AC⁰,而对于 Q₂=R(x̲,y),S(z̲,y),则为 coNP-完全,清晰展示了二分性。
- 结果可推广至任意元数关系,只要每个原子具有单个主键属性或全部属性作为主键。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。