Skip to main content
QUICK REVIEW

[论文解读] Complexity of Local Search for Euclidean Clustering Problems

Bodo Manthey, Nils Morawietz|arXiv (Cornell University)|Dec 22, 2023
Facility Location and Emergency Management被引用 1
一句话总结

本文证明,Flip启发式算法——一种用于在聚类间重新分配点的简单局部搜索方法——在k-均值聚类和平方欧几里得最大割问题中均为PLS-完全问题,即使在低维欧几里得空间中也是如此。该结果表明,尽管输入数据具有几何结构,但通过这种广泛使用的启发式算法寻找局部最优解仍然在计算上是困难的。

ABSTRACT

We show that the simplest local search heuristics for two natural Euclidean clustering problems are PLS-complete. First, we show that the Hartigan--Wong method for $k$-Means clustering is PLS-complete, even when $k = 2$. Second, we show the same result for the Flip heuristic for Max Cut, even when the edge weights are given by the (squared) Euclidean distances between the points in some set $\mathcal{X} \subseteq \mathbb{R}^d$; a problem which is equivalent to Min Sum 2-Clustering.

研究动机与目标

  • 确定欧几里得聚类问题中局部搜索启发式算法的计算复杂性。
  • 研究尽管k-均值和平方欧几里得最大割问题中的Flip启发式算法在实践中广受欢迎,其是否仍具有可解性。
  • 在Flip邻域下,为这些问题建立PLS-完全性,即使当k = 2或处于低维空间时亦成立。
  • 澄清欧几里得空间的几何结构是否会降低聚类问题中局部搜索的复杂性。

提出的方法

  • 通过坐标变换,将已知的PLS-完全问题(奇数最小二分问题和最大割问题)归约到欧几里得聚类问题。
  • 构造Rd中的点集,使得点对之间的欧几里得距离与组合图中的边权相对应。
  • 利用平方距离,通过几何嵌入模拟最大割和k-均值问题中的目标函数。
  • 对先前的归约方法(Ageev等,Alois等)进行调整,以在欧几里得设置下保持PLS-完全性。
  • 对点坐标进行精细的代数操作,以确保∥x−y∥2或∥x−y∥与目标问题中的期望权重一致。
  • 证明Flip启发式算法的邻域结构即使在边权由欧几里得距离导出时,仍保持其计算困难性。

实验结果

研究问题

  • RQ1k-均值聚类问题中的Flip启发式算法是否为PLS-完全问题,即使当k = 2时?
  • RQ2在采用平方距离的欧几里得最大割实例中,局部搜索的计算困难性是否依然存在?
  • RQ3欧几里得空间的几何约束是否能降低聚类问题中局部搜索的复杂性?
  • RQ4当维度d相对于点数为次线性时,Flip启发式算法的PLS-完全性是否依然成立?
  • RQ5欧几里得空间是否存在某些结构特性,可使聚类问题的局部搜索算法运行更快?

主要发现

  • k-均值聚类问题中的Flip启发式算法即使在k = 2时也是PLS-完全问题,证明在此设定下局部搜索的计算困难性依然存在。
  • 该结论同样适用于平方欧几里得最大割问题,表明即使边权由平方欧几里得距离导出,Flip启发式算法仍是PLS-完全问题。
  • 证明中使用的归约方法生成的实例维度为Ω(n),但即使当k和d较小时,计算困难性依然存在。
  • 欧几里得结构并未为局部搜索提供计算优势,因为其复杂性与一般最大割问题相当。
  • 这些结果意味着,为了解释Flip启发式算法在实际中的高效性,平滑分析可能是必不可少的,因为其最坏情况下的复杂性仍为指数级。
  • 研究结果表明,欧几里得局部搜索问题中的PLS-难问题极为罕见,且由于边权受几何约束,其建立过程极具挑战性。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。