Skip to main content
QUICK REVIEW

[论文解读] Cluster Editing in Multi-Layer and Temporal Graphs

Jiehua Chen, Hendrik Molter|arXiv (Cornell University)|Jan 1, 2018
Opportunistic and Delay-Tolerant Networks被引用 14
一句话总结

本文提出了并分析了两种新的聚类编辑变体——多层聚类编辑(MLCE)和时序聚类编辑(TCE),用于对多层图和时序图进行聚类。针对MLCE,本文提出了一种固定参数可满足的算法,时间复杂度为 $k^{O(k+d)}s^{O(1)}$;同时证明了即使当 $d = 3$ 时,TCE 关于 $k$ 也是 W[1]-难的,揭示了两个问题之间根本的算法差异。

ABSTRACT

Motivated by the recent rapid growth of research for algorithms to cluster multi-layer and temporal graphs, we study extensions of the classical Cluster Editing problem. In Multi-Layer Cluster Editing we receive a set of graphs on the same vertex set, called layers and aim to transform all layers into cluster graphs (disjoint unions of cliques) that differ only slightly. More specifically, we want to mark at most d vertices and to transform each layer into a cluster graph using at most k edge additions or deletions per layer so that, if we remove the marked vertices, we obtain the same cluster graph in all layers. In Temporal Cluster Editing we receive a sequence of layers and we want to transform each layer into a cluster graph so that consecutive layers differ only slightly. That is, we want to transform each layer into a cluster graph with at most k edge additions or deletions and to mark a distinct set of d vertices in each layer so that each two consecutive layers are the same after removing the vertices marked in the first of the two layers. We study the combinatorial structure of the two problems via their parameterized complexity with respect to the parameters d and k, among others. Despite the similar definition, the two problems behave quite differently: In particular, Multi-Layer Cluster Editing is fixed-parameter tractable with running time k^{O(k + d)} s^{O(1)} for inputs of size s, whereas Temporal Cluster Editing is W[1]-hard with respect to k even if d = 3.

研究动机与目标

  • 形式化并研究多层图和时序图中聚类编辑的计算复杂性,将经典聚类编辑问题扩展至动态、多源场景。
  • 针对关键参数 $k$(每层的编辑次数)和 $d$(标记顶点数),分析多层聚类编辑(MLCE)和时序聚类编辑(TCE)的参数复杂性。
  • 识别 MLCE 与 TCE 之间的结构性差异,特别是从算法可解性以及时序设置中非局部依赖性的角度出发。
  • 为 MLCE 建立核化框架,并将其扩展至 TCE,确定核大小和计算复杂性的界限。
  • 证明在标准复杂性假设下,除非 NP ⊆ coNP/poly,否则 MLCE 和 TCE 关于顶点数 $n$ 均不具有多项式核。

提出的方法

  • 提出多层聚类编辑(MLCE)问题:在删除 $d$ 个标记顶点后,所有图层均需通过最多 $k$ 次边修改变为相同的聚类图。
  • 引入时序聚类编辑(TCE)问题:在每层中删除 $d$ 个标记顶点后,连续图层之间需保持一致,且每层最多允许 $k$ 次编辑。
  • 应用一组 8 条规约规则压缩 MLCE 实例,确保在 $O(\ell n^3)$ 时间内安全且彻底地应用,最终得到大小为 $O(\ell^3(k + d)^4)$ 的核。
  • 通过将 $d$ 替换为 $d\ell$,将 MLCE 的规约规则适配至 TCE,得到大小为 $O(\ell^3(k + d\ell)^4)$ 的核,运行时间为 $O(\ell n^3)$。
  • 利用经典聚类编辑问题的 AND-交叉组合技术,证明除非 NP ⊆ coNP/poly,否则 MLCE 和 TCE 均不具有关于 $n$ 的多项式核。
  • 采用参数复杂性技术,包括 W[1]-难性证明和核化方法,分析可解性的边界,尤其关注 $k$ 和 $d$ 的影响。

实验结果

研究问题

  • RQ1多层聚类编辑在联合参数 $k$ 和 $d$ 下是否为固定参数可满足的?
  • RQ2时序聚类编辑关于 $k$ 的参数复杂性如何,特别是在 $d$ 较小(如 $d = 3$)时?
  • RQ3MLCE 与 TCE 之间的结构性差异是否可由时序设置中非局部依赖性的存在来解释?
  • RQ4MLCE 和 TCE 是否具有关于顶点数 $n$ 的多项式核?
  • RQ5MLCE 的规约规则能否安全地扩展至 TCE?可推导出怎样的核大小界限?

主要发现

  • 多层聚类编辑在输入规模 $s$ 下具有 $k^{O(k+d)}s^{O(1)}$ 的运行时间,表明当 $k$ 和 $d$ 较小时具有高效的可解性。
  • 时序聚类编辑关于 $k$ 即使在 $d = 3$ 时也是 W[1]-难的,表明由于时间层之间的非局部依赖性,存在强烈的算法不可解性。
  • 通过一组 8 条安全规约规则,可在 $O(\ell n^3)$ 时间内计算出大小为 $O(\ell^3(k + d)^4)$ 的 MLCE 核。
  • TCE 的核大小为 $O(\ell^3(k + d\ell)^4)$,通过将 MLCE 的规约规则中 $d$ 替换为 $d\ell$ 得到,计算时间同样为 $O(\ell n^3)$。
  • 除非 NP ⊆ coNP/poly,否则 MLCE 和 TCE 均不具有关于 $n$(顶点数)的多项式核,该结论通过从经典聚类编辑问题出发的 AND-交叉组合技术得以证明。
  • TCE 的结构丰富性引入了经典聚类编辑或 MLCE 中不存在的算法障碍,尤其源于跨图层的时序非局部性在顶点标记中的影响。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。