Skip to main content
QUICK REVIEW

[论文解读] The Dichotomy of Evaluating Homomorphism-Closed Queries on Probabilistic Graphs

Antoine Amarilli, İsmail İlkan Ceylan|arXiv (Cornell University)|Oct 4, 2019
Bayesian Modeling and Causal Inference被引用 6
一句话总结

本文建立了在具有二元签名的概率图上评估同态封闭查询(等价于合取查询的无限并集,UCQ∞)的数据复杂性二分法。证明了所有无界UCQ∞查询在评估时均为#P难,而有界查询可约简为合取查询的并集,因此由Dalvi和Suciu先前的二分法分类。该结果完全刻画了此类广泛查询类别的概率查询评估复杂性,包括析取Datalog、正则路径查询和本体媒介查询。

ABSTRACT

We study the problem of query evaluation on probabilistic graphs, namely, tuple-independent probabilistic databases over signatures of arity two. We focus on the class of queries closed under homomorphisms, or, equivalently, the infinite unions of conjunctive queries. Our main result states that the probabilistic query evaluation problem is #P-hard for all unbounded queries from this class. As bounded queries from this class are equivalent to a union of conjunctive queries, they are already classified by the dichotomy of Dalvi and Suciu (2012). Hence, our result and theirs imply a complete data complexity dichotomy, between polynomial time and #P-hardness, on evaluating homomorphism-closed queries over probabilistic graphs. This dichotomy covers in particular all fragments of infinite unions of conjunctive queries over arity-two signatures, such as negation-free (disjunctive) Datalog, regular path queries, and a large class of ontology-mediated queries. The dichotomy also applies to a restricted case of probabilistic query evaluation called generalized model counting, where fact probabilities must be 0, 0.5, or 1. We show the main result by reducing from the problem of counting the valuations of positive partitioned 2-DNF formulae, or from the source-to-target reliability problem in an undirected graph, depending on properties of minimal models for the query.

研究动机与目标

  • 建立在概率图上评估同态封闭查询的完整数据复杂性二分法。
  • 对无限合取查询并集(UCQ∞)的概率查询评估(PQE)复杂性进行分类,UCQ∞是一类单调且递归的查询语言。
  • 将已知的合取查询并集(UCQ)二分法扩展至UCQ∞,特别是针对在同态下封闭的查询。
  • 研究该二分法在受限概率模型下是否成立,例如广义模型计数(GFOMC),其中事实概率被限制为{0, 0.5, 1}。

提出的方法

  • 从#PP2DNF(正性分区2-DNF公式赋值计数)归约,以证明在最小模型中存在非可迭代边的UCQ∞查询为#P难。
  • 从#U-ST-CON(无向图中源到目标连通性)归约,用于无非可迭代边的查询,依赖于对模型中最小紧边的详细分析。
  • 使用模型论技术,包括分离与精细分离,分析查询结构与最小模型。
  • 构建转换后的TID可能世界之间的概率保全双射,以将GFOMC归约为PQE,同时保持查询满足性。
  • 形式化证明:即使事实概率被限制为{0, 0.5, 1},在二元签名上,无界UCQ∞查询的评估仍为#P难。
  • 通过将一元原子转换为自环(R(x) → R′(x,x))将结果扩展至包含一元和二元谓词的签名,保持无界性与难度。

实验结果

研究问题

  • RQ1在概率图上评估同态封闭查询是否存在完整的数据复杂性二分法?
  • RQ2所有在二元签名上的无界UCQ∞查询在评估时是否均为#P难?
  • RQ3PQE的二分法是否可扩展至概率值在{0, 0.5, 1}范围内的广义模型计数(GFOMC)问题?
  • RQ4该难度结果能否扩展至包含一元谓词的签名?
  • RQ5在无权重模型计数设置下(所有事实概率为0.5),UCQ∞查询的PQE是否仍为#P难?

主要发现

  • 所有在二元签名上的无界UCQ∞查询在概率查询评估(PQE)下均为#P难,与Dalvi和Suciu的有界查询多项式时间类形成完整二分法。
  • 即使事实概率被限制为{0, 0.5, 1},#P难结果依然成立,通过仅使用这些值的归约得以证明,因此二分法被扩展至广义模型计数(GFOMC)问题。
  • 对于包含一元和二元谓词的签名上的任意无界UCQ∞查询,GFOMC(Q)为#P难,通过将一元原子转换为自环并保持无界性与难度得以证明。
  • GFOMC的二分法成立:要么Q等价于一个安全UCQ,此时GFOMC(Q)属于FP;要么不是,此时GFOMC(Q)为#P难。
  • 该证明依赖于两种归约:一种来自#PP2DNF(适用于存在非可迭代边的查询),另一种来自#U-ST-CON(适用于具有最小紧边的查询),两者均需细致的模型论分析。
  • 在假设存在合适的分离概念的前提下,结果可推广至任意元签名,但因处理高元关系中相交事实的技术挑战,该扩展仍为开放问题。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。