Skip to main content
QUICK REVIEW

[论文解读] Approximate Clustering via Metric Partitioning

Henzinger, Monika, Leniowski, Dariusz|arXiv (Cornell University)|Jul 8, 2015
Complexity and Algorithms in Graphs参考文献 19被引用 3
一句话总结

本文提出了一种准多项式时间 (1+ε)-近似算法,用于最小代价覆盖问题(MCC)和 k-聚类问题,采用度量划分和概率技术。该方法在 MCC 上实现了 (1+ε)-近似,在 k-聚类问题中使用 (1+ε)k 个球,优于以往的 3α 和 cα 近似保证。同时表明,在标准复杂性假设下,当 α 作为输入的一部分时,多项式时间 (1+ε)-近似对 MCC 是不可能的。

ABSTRACT

In this paper we consider two metric covering/clustering problems - extit{Minimum Cost Covering Problem} (MCC) and $k$-clustering. In the MCC problem, we are given two point sets $X$ (clients) and $Y$ (servers), and a metric on $X \cup Y$. We would like to cover the clients by balls centered at the servers. The objective function to minimize is the sum of the $α$-th power of the radii of the balls. Here $α\geq 1$ is a parameter of the problem (but not of a problem instance). MCC is closely related to the $k$-clustering problem. The main difference between $k$-clustering and MCC is that in $k$-clustering one needs to select $k$ balls to cover the clients. For any $\eps > 0$, we describe quasi-polynomial time $(1 + \eps)$ approximation algorithms for both of the problems. However, in case of $k$-clustering the algorithm uses $(1 + \eps)k$ balls. Prior to our work, a $3^α$ and a ${c}^α$ approximation were achieved by polynomial-time algorithms for MCC and $k$-clustering, respectively, where $c > 1$ is an absolute constant. These two problems are thus interesting examples of metric covering/clustering problems that admit $(1 + \eps)$-approximation (using $(1+\eps)k$ balls in case of $k$-clustering), if one is willing to settle for quasi-polynomial time. In contrast, for the variant of MCC where $α$ is part of the input, we show under standard assumptions that no polynomial time algorithm can achieve an approximation factor better than $O(\log |X|)$ for $α\geq \log |X|$.

研究动机与目标

  • 设计度量覆盖和聚类问题的高效近似算法,特别是针对 α-幂次代价函数下的 MCC 和 k-聚类问题。
  • 克服以往多项式时间算法在 MCC 和 k-聚类问题上仅能实现 3α 和 cα 近似所面临的局限。
  • 探索当多项式时间 (1+ε)-近似被排除时,是否可在准多项式时间内实现这些问题的 (1+ε)-近似。
  • 在 α 作为输入的一部分时,建立 MCC 的紧致不可近似性界,表明 O(log |X|) 是多项式时间近似因子的最佳可能值。
  • 将方法推广至带设施开放成本的变体,证明其在基本 MCC 模型之外的可扩展性。

提出的方法

  • 利用度量空间的概率划分构造与最优球相交较少的覆盖,利用最优解的结构特性。
  • 采用基于度量划分的递归分解策略,其中每个划分独立处理以构建近似解。
  • 对线性规划松弛得到的分数解应用舍入技术,通过仔细选择球半径确保 (1+ε)-近似。
  • 使用受几何分治启发的分离定理,经适配后应用于一般度量空间,以限制划分与球相交的数量。
  • 提出一种新颖的分析框架,通过将构造球的半径与最优解中的半径关联,界定向划分导致的成本增加。
  • 将支配集问题归约至 MCC,以证明不可近似性,表明当 α 作为输入时,MCC 的 (c log |X|)-近似意味着 P = NP。

实验结果

研究问题

  • RQ1尽管多项式时间算法存在局限,是否可在准多项式时间内实现 MCC 和 k-聚类的 (1+ε)-近似?
  • RQ2当 α 作为输入的一部分时,MCC 在多项式时间内的最佳可能近似比是多少?
  • RQ3当 α > 1 时,度量空间中最优解的结构如何变化,能否在算法上加以利用?
  • RQ4用于 MCC 的技术能否自然地推广至处理设施开放成本?
  • RQ5在当前技术水平下,是否可能在准多项式时间内实现 k-聚类的 (1+ε)-近似?

主要发现

  • 本文首次提出 MCC 和 k-聚类在准多项式时间内的 (1+ε)-近似算法,采用度量划分和概率方法。
  • 对于 k-聚类,算法使用 (1+ε)k 个球实现 (1+ε)-近似,优于目前已知的多项式时间 cα 近似。
  • 对于 MCC,当 α 作为输入的一部分时,本文证明在标准复杂性假设下,任何多项式时间算法都无法实现优于 O(log |X|) 的近似。
  • 通过从最小支配集问题的归约建立不可近似性结果,表明当 α 作为输入时,MCC 的 (c log |X|)-近似意味着 P = NP。
  • 该方法可推广至带设施开放成本的 MCC 变体,实现准多项式时间内的 (1+ε)-近似。
  • 结果表明,即使在多项式时间 (1+ε)-近似不可行时,准多项式时间仍可实现这些问题的 (1+ε)-近似。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。