Skip to main content
QUICK REVIEW

[論文レビュー] Inapproximability for Local Correlation Clustering and Dissimilarity Hierarchical Clustering

Vaggos Chatziafratis, Neha Gupta|arXiv (Cornell University)|Oct 4, 2020
Advanced Clustering Algorithms Research参考文献 45被引用数 5
ひとこと要約

本稿は、2つのクラスタリング問題について強い近似不能性結果を確立している:ℓ∞-ノルムを目的関数に用いたローカル相関クラスタリングと、ダスガプタのコスト関数の最大化版を用いた階層的クラスタリング。Max-2Lin(q)問題への還元と、一意ゲーム予想の利用により、両問題がそれぞれ4/3および9159/9189の要因以内に近似することが不可能であることを証明し、これらの設定における最初のAPX-hardness結果を確立している。

ABSTRACT

We study the Minimum Sum Vertex Cover problem, which asks for an ordering of vertices in a graph that minimizes the total cover time of edges. In particular, n vertices of the graph are visited according to an ordering, and for each edge this induces the first time it is covered. The goal of the problem is to find the ordering which minimizes the sum of the cover times over all edges in the graph. In this work we give the first explicit hardness of approximation result for Minimum Sum Vertex Cover. In particular, assuming the Unique Games Conjecture, we show that the Minimum Sum Vertex Cover problem cannot be approximated within 1.014. The best approximation ratio for Minimum Sum Vertex Cover as of now is 16/9, due to a recent work of Bansal, Batra, Farhadi, and Tetali. We also revisit an approximation algorithm for regular graphs outlined in the work of Feige, Lovász, and Tetali, and show that Minimum Sum Vertex Cover can be approximated within 1.225 on regular graphs.

研究の動機と目的

  • ℓ∞-ノルムを目的関数に用いたローカル相関クラスタリングの、最初の近似不能性結果を確立すること。この問題は、各ノードあたりの不一致数の最大値を最小化する。
  • 類似度情報に基づく階層的クラスタリングにおけるダスガプタのコスト関数の最大化版の近似不能性を証明すること。
  • 両問題が標準の複雑性仮定の下でAPX-hardであることを示し、定数要因の近似不能性を示すこと。
  • 既存の近似アルゴリズムと、これらのクラスタリング目的関数の理論的近似限界との間のギャップを埋めること。

提案手法

  • Max-2Lin(q)問題からの還元により、同意確率を制御したローカル相関クラスタリングのインスタンスを構築する。
  • Max-2Lin(q)制約の満たされる割り当てから、バランスの取れた2分木構造を構築し、ノードのラベルを関数値に対応させる。
  • 一意ゲーム予想を用いて、相関に基づく目的関数のGoemans-Williamson型解析を通じて、タイトな近似不能性要因を導出する。
  • 同意確率とノードの部分木サイズに基づいて、エッジ重みを木の各レベルに分割する分析を行う。
  • 幾何級数を用いてYESケースにおける目的関数値の下界を証明し、ρ = −0.7を用いてα = 0.85を達成する。
  • NOケースにおける目的関数値の上界を、最悪ケースの部分木分布を考慮し、Γρ関数の単調性を活用して求める。

実験結果

リサーチクエスチョン

  • RQ1ℓ∞-ノルムを目的関数に用いたローカル相関クラスタリングは、APX-hardであり、定数要因の近似不能性を示唆するか?
  • RQ2階層的クラスタリングにおけるダスガプタのコスト関数の最大化版は、9159/9189より良い要因で近似可能か?
  • RQ3一意ゲーム予想は、類似度情報に基づく階層的クラスタリングに対してタイトな近似不能性閾値を示唆するか?
  • RQ4適切に選ばれた相関パラメータρを用いたMax-2Lin(q)からの還元により、近似の困難性を確立できるか?
  • RQ5標準の複雑性仮定の下で、これらのクラスタリング目的関数の最小近似要因は何か?

主な発見

  • ℓ∞-バージョンのローカル相関クラスタリングは、4/3の要因以内に近似することがNP困難であり、この問題における最初のAPX-hardness結果を確立している。
  • 一意ゲーム予想の下で、階層的クラスタリングにおけるダスガプタのコスト関数の最大化版は、9159/9189の要因以内に近似することが不可能である。
  • YESケースでは、小さなε > 0および大きなqに対して、構築された階層的クラスタリングインスタンスの目的関数値が少なくとも0.9189nである。
  • NOケースでは、目的関数値が0.9159n以下であり、YESケースよりも厳密に小さいため、近似不能性結果を証明するギャップが生じる。
  • 分析はΓρ関数の単調性に依存し、階層的木の各レベルにおける部分木重み寄与の厳密なバウンディングに依存する。
  • ρ = −0.7の選択は、Max-Cutの最適ρ ≈ −0.689に近く、YESケースとNOケースの間のギャップを最大化する。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。