Skip to main content
QUICK REVIEW

[论文解读] Connected k-Center and k-Diameter Clustering

Lukas Drexler, Jan Eube|arXiv (Cornell University)|Nov 3, 2022
Wildlife-Road Interactions and Conservation被引用 1
一句话总结

本文提出了连通 k-中心和 k-直径聚类问题的近似算法,其中聚类必须在给定的连通性图中诱导出连通子图。该文提出一个框架,首先计算一个非互斥的连通聚类,然后将其转换为互斥的聚类,从而在低维欧几里得空间和常数加倍度量下实现 O(1)-近似,在一般度量下实现 O(log²k)-近似。

ABSTRACT

Motivated by an application from geodesy, we introduce a novel clustering problem which is a $k$-center (or k-diameter) problem with a side constraint. For the side constraint, we are given an undirected connectivity graph $G$ on the input points, and a clustering is now only feasible if every cluster induces a connected subgraph in $G$. We call the resulting problems the connected $k$-center problem and the connected $k$-diameter problem. We prove several results on the complexity and approximability of these problems. Our main result is an $O(\log^2{k})$-approximation algorithm for the connected $k$-center and the connected $k$-diameter problem. For Euclidean metrics and metrics with constant doubling dimension, the approximation factor of this algorithm improves to $O(1)$. We also consider the special cases that the connectivity graph is a line or a tree. For the line we give optimal polynomial-time algorithms and for the case that the connectivity graph is a tree, we either give an optimal polynomial-time algorithm or a $2$-approximation algorithm for all variants of our model. We complement our upper bounds by several lower bounds.

研究动机与目标

  • 解决在大地测量学等实际应用中具有连通性约束的聚类问题。
  • 在互斥和非互斥聚类模型下,为连通 k-中心和 k-直径问题开发近似算法。
  • 弥合一般度量下连通聚类近似的上下界之间的差距。
  • 分析在各种连通性图结构下,连通 k-中心和 k-直径问题的可近似性。
  • 为特殊情形(如线性连通性图)提供最优算法。

提出的方法

  • 提出两阶段方法:首先计算非互斥连通聚类,然后将其转换为互斥聚类。
  • 利用良好分离划分确保在低维和加倍度量下的有界近似比。
  • 对路径图采用贪心路径覆盖策略,在 O(n² log n) 时间内计算最优解。
  • 应用基于直径的路径扩展技术,以在给定半径下找到最小聚类数量。
  • 依赖于结构洞察:非互斥解可被修改为互斥解,而不会增加直径或半径。
  • 证明对于路径图,存在互斥聚类的最优解,从而可通过路径覆盖实现高效的动态规划。

实验结果

研究问题

  • RQ1我们能否在低维欧几里得空间和常数加倍度量下,为互斥连通 k-中心和 k-直径问题实现常数因子近似?
  • RQ2连通 k-中心和 k-直径问题在一般度量下的最佳可能近似比是多少?
  • RQ3非互斥聚类框架能否用于推导出互斥变体的更好近似保证?
  • RQ4连通性图的结构如何影响连通聚类问题的可近似性?
  • RQ5是否存在某些图类(如路径图),使得连通 k-中心/diameter 问题可在多项式时间内被最优求解?

主要发现

  • 在常数维欧几里得空间和常数加倍维数度量下,实现了互斥连通 k-中心和 k-直径问题的 O(1)-近似。
  • 为一般度量情形提供了 O(log²k)-近似,优于先前的界。
  • 证明了在星型连通性图下,连通 k-直径问题难以在优于 2 的因子内近似。
  • 对于路径连通性图,k-中心和 k-直径的互斥与非互斥版本均可在 O(n² log n) 时间内被最优求解。
  • 证明在路径图中,存在互斥聚类的最优解,从而可通过路径覆盖实现高效的动态规划。
  • 表明在当前框架下,O(log log k) 以内的改进是不可能的,说明该方法在进一步提升方面存在根本性限制。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。