Skip to main content
QUICK REVIEW

[論文レビュー] Parameterized k-Clustering: The distance matters!

Fedor V. Fomin, Petr A. Golovach|arXiv (Cornell University)|Jan 1, 2019
Advanced Graph Theory Research参考文献 28被引用数 3
ひとこと要約

本稿では、Minkowski距離の順序 p ∈ (0,1] における k-クラスタリングが、クラスタリングコスト D にパrameterized された場合、固定パrameter可 tractable(FPT)であることを示している。これは、新規のカラーリングとハイパーグラフカバー技法を用いて達成された。これに対して、p = 0(ハミング距離)および p = ∞(L∞)の場合、問題は W[1]-hard である。これは、距離ノルムの種別に起因する明確な複雑性の閾値を示している。

ABSTRACT

In k-Clustering we are given a multiset of n vectors X subset Z^d and a nonnegative number D, and we need to decide whether X can be partitioned into k clusters C_1, ..., C_k such that the cost sum_{i=1}^k min_{c_i in R^d} sum_{x in C_i} |x-c_i|_p^p <= D, where |*|_p is the Minkowski (L_p) norm of order p. For p=1, k-Clustering is the well-known k-Median. For p=2, the case of the Euclidean distance, k-Clustering is k-Means. We study k-Clustering from the perspective of parameterized complexity. The problem is known to be NP-hard for k=2 and it is also NP-hard for d=2. It is a long-standing open question, whether the problem is fixed-parameter tractable (FPT) for the combined parameter d+k. In this paper, we focus on the parameterization by D. We complement the known negative results by showing that for p=0 and p=infty, k-Clustering is W1-hard when parameterized by D. Interestingly, the complexity landscape of the problem appears to be more intricate than expected. We discover a tractability island of k-Clustering: for every p in (0,1], k-Clustering is solvable in time 2^O(D log D) (nd)^O(1).

研究の動機と目的

  • クラスタリングコスト D に関して k-クラスタリングのパrameterized 複雑性を調査すること。
  • Minkowski距離ノルム p の選択が、k-クラスタリングの tractability に与える影響を特定すること。
  • p ∈ (0,1] に対して FPT アルゴリズムを確立することと、p = 0 および p = ∞ に対して W[1]-hardness を示すこと。
  • k-クラスタリングの主要なサブルーチンであるクラスタ選択の構造的性質を調査すること。

提案手法

  • カラーリングを用いて k-クラスタリングをクラスタ選択問題に還元する。
  • Marx のハイパーグラフにおける分数的エッジカバーに関する定理を適用し、解の構造を制限する。
  • 特定の凸性および斉次性の性質を満たす距離ノルムを有するクラスタリング問題に k-クラスタリングを還元する。
  • k-クリークからクラスタ選択への新規な還元を用いて、p = 0 および p = ∞ における W[1]-hardness を証明する。
  • コスト D のインスタンスを構築し、最小コストを達成するのは彩色された k-クリークに対応する解に限ることを保証する。
  • 重み付きベクトルと重心最適化を用いて、Lp ノルム下でのクラスタコストをモデル化する。

実験結果

リサーチクエスチョン

  • RQ1Lp ノルム p ∈ (0,1] に対して、コスト D にパrameterized された k-クラスタリングは FPT に解けるか?
  • RQ2p ∈ (0,1] と p = 0 または p = ∞ の間で、k-クラスタリングの複雑性がなぜこれほど大きく変化するのか?
  • RQ3p ∈ (0,1] に対して、クラスタ選択問題は FPT 時間で解けるか?
  • RQ4FPT アルゴリズムが可能となる Lp ノルムと不可能となるものとの間に、根本的な構造的差異は存在するか?
  • RQ5D + k + d にパrameterized された場合の k-クラスタリングの微細な複雑性は何か?

主な発見

  • 任意の p ∈ (0,1] に対して、Lp ノルムを用いた k-クラスタリングは、時間 2^O(D log D) · (nd)^O(1) で解ける。これは D に関して FPT であることを示している。
  • p = 0(ハミング距離)の場合、k-クラスタリングは D にパrameterized された場合に W[1]-hard である。これは、FPT = W[1] でない限り、FPT アルゴリズムが存在しないことを示唆している。
  • p = ∞(L∞-距離)の場合、同じパrameterization においても k-クラスタリングは W[1]-hard である。
  • クラスタ選択問題は、p ∈ (0,1] に対して D に関して FPT である。これは、主結果を可能にする主要なアルゴリズム的貢献である。
  • k-クリークからクラスタ選択への W[1]-hardness 還元により、p = 0 または p = ∞ に対しては FPT アルゴリズムが存在しないことが証明された。
  • 構築されたインスタンスにおいて、コスト D が正確に達成されるのは、彩色された k-クリークに対応する解に限られ、還元の正しさが保証されている。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。