[论文解读] Faster algorithms for counting subgraphs in sparse graphs
本文通过引入一种新颖的树状分解方法,针对有向无环图,利用图的退化性,提出了在稀疏图中计数子图的更快算法。该方法在有界退化图中实现子图计数的时间复杂度为 2^O(k²) · O(n^{0.25k+2} log n),在有界平均度图中为 2^O(k²) · O(n^{0.625k+2} log n),优于经典 Nešetřil-Poljak 边界 O(n^{0.791k+2}),尤其在图具有稀疏性时。该方法在指数时间假设(ETH)下被证明是最优的。
Given a $k$-node pattern graph $H$ and an $n$-node host graph $G$, the subgraph counting problem asks to compute the number of copies of $H$ in $G$. In this work we address the following question: can we count the copies of $H$ faster if $G$ is sparse? We answer in the affirmative by introducing a novel tree-like decomposition for directed acyclic graphs, inspired by the classic tree decomposition for undirected graphs. This decomposition gives a dynamic program for counting the homomorphisms of $H$ in $G$ by exploiting the degeneracy of $G$, which allows us to beat the state-of-the-art subgraph counting algorithms when $G$ is sparse enough. For example, we can count the induced copies of any $k$-node pattern $H$ in time $2^{O(k^2)} O(n^{0.25k + 2} \log n)$ if $G$ has bounded degeneracy, and in time $2^{O(k^2)} O(n^{0.625k + 1} \log n)$ if $G$ has bounded average degree. These bounds are instantiations of a more general result, parameterized by the degeneracy of $G$ and the structure of $H$, which generalizes classic bounds on counting cliques and complete bipartite graphs. We also give lower bounds based on the Exponential Time Hypothesis, showing that our results are actually a characterization of the complexity of subgraph counting in bounded-degeneracy graphs.
研究动机与目标
- 为克服子图计数中 n^{Θ(k)} 的运行时间障碍,通过利用图的稀疏性。
- 为有向无环图设计一种新型树状分解,以利用宿主图中的退化性。
- 在具有有界退化性或平均度的稀疏图中,实现比 Nešetřil-Poljak 算法更快的运行时间。
- 利用指数时间假设(ETH)刻画有界退化性图中子图计数的精确复杂度。
提出的方法
- 提出一种新颖的有向无环图树状分解,受无向树分解启发,但针对退化性进行了调整。
- 在分解上使用动态规划来计数同态、出现次数以及模式图 H 在宿主图 G 中的诱导子图。
- 通过图 G 的退化度 d 和模式图 H 的宽度度量 τ(H) 参数化运行时间,得到 f(k) · O(d^{k−τ(H)} n^{τ(H)} log n) 的时间复杂度。
- 将该分解应用于推导诱导与非诱导子图计数的边界,分别处理同态与诱导子图。
- 利用指数时间假设证明下界,表明该算法在有界退化性图中是最优的。
- 通过统一框架推广经典关于团与完全二分图计数的结果。
实验结果
研究问题
- RQ1当宿主图 G 是稀疏图,特别是具有有界退化性时,能否加速子图计数?
- RQ2是否存在一种模式图 H 的结构分解,能够通过利用 G 中的退化性来实现更快的计数?
- RQ3在有界退化性图中,计数诱导子图的精确复杂度是什么?是否可以对其进行刻画?
- RQ4该算法能否在稀疏图中实现优于 Nešetřil-Poljak 边界的运行时间?在何种条件下可以实现?
主要发现
- 本文在有界退化性图中对任意 k 个节点的模式图 H 的诱导子图计数,实现了 2^O(k²) · O(n^{0.25k+2} log n) 的运行时间,优于 Nešetřil 和 Poljak 的 O(n^{0.791k+2}) 边界。
- 对于平均度有界的图 r,运行时间为 2^O(k²) · O(r^{1/2(k−⌊k/4⌋)−1} n^{1/2(k+⌊k/4⌋)+1} log n),当 r 相对于 n 为次线性时,n 的指数部分得以降低。
- 该算法在指数时间假设下是最优的,因为其与退化度为 2 的图的下界 n^{Ω(τ(H)/log τ(H))} 相匹配。
- 所提出的树状分解推广并统一了以往在稀疏环境下对团与完全二分图计数的研究成果。
- 当退化性有界时,该方法显著降低了 n 的多项式指数部分,降至 0.25k+2,对于足够稀疏的图,优于当前最优算法。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。