Skip to main content
QUICK REVIEW

[論文レビュー] Graph Clustering in All Parameter Regimes

Junhao Gan, David F. Gleich|arXiv (Cornell University)|Oct 14, 2019
Complex Network Analysis Techniques参考文献 29被引用数 1
ひとこと要約

本稿では、すべての解像度パラメータ λ ∈ (0,1) におけるLambdaPrimeグラフクラスタリング目的関数を近似的に最適化する、小さなクラスタリング族を効率的に計算する手法を提案する。O(log n) 個の戦略的に選ばれた λ 値におけるパrametric線形計画法(LP)緩和を解き、近似アルゴリズムを用いて解を丸めることで、すべての λ に対して (1+ε)-近似を得る。このアプローチは、特定のリンググラフにおいて、定数因子の範囲でこの境界がタイトであることを示している。

ABSTRACT

Resolution parameters in graph clustering control the size and structure of clusters formed by solving a parametric objective function. Typically there is more than one meaningful way to cluster a graph, and solving the same objective function for different resolution parameters produces clusterings at different levels of granularity, each of which can be meaningful depending on the application. In this paper, we address the task of efficiently solving a parameterized graph clustering objective for all values of a resolution parameter. Specifically, we consider a new analysis-friendly objective we call LambdaPrime, involving a parameter λ ∈ (0,1). LambdaPrime is an adaptation of LambdaCC, a significant family of instances of the Correlation Clustering (minimization) problem. Indeed, LambdaPrime and LambdaCC are closely related to other parameterized clustering problems, such as parametric generalizations of modularity. They capture a number of specific clustering problems as special cases, including sparsest cut and cluster deletion. While previous work provides approximation results for a single value of the resolution parameter, we seek a set of approximately optimal clusterings for all values of λ in polynomial time. More specifically, we show that when a graph has m edges and n nodes, there exists a set of at most m clusterings such that, for every λ ∈ (0,1), the family contains an optimal solution to the LambdaPrime objective. This bound is tight on star graphs. We obtain a family of O(log n) clusterings by solving the parametric linear programming (LP) relaxation of LambdaPrime at O(log n) λ values, and rounding each LP solution using existing approximation algorithms. We prove that this is asymptotically tight: for a certain class of ring graphs, for all values of λ, Ω(log n) feasible solutions are required to provide a constant-factor approximation for the LambdaPrime LP relaxation. To minimize the size of the clustering family, we further propose an algorithm that yields a family of solutions of a size no more than twice of the minimum LP-approximating family.

研究の動機と目的

  • 解像度パラメータ λ のすべての値において、LambdaPrimeグラフクラスタリング目的関数を良い近似で最適化する小さなクラスタリング族を求める課題に対処すること。
  • 全パラメータ範囲にわたるLambdaPrimeの正確または近似最適化を達成するために必要なクラスタリングの最小数に関する理論的境界を確立すること。
  • 既存のヒューリスティック手法に欠けるグローバル保証を克服し、パラメトリックグラフクラスタリングに対する厳密な近似保証を提供すること。
  • クラスタリング族のサイズと、すべてのパrameter領域における近似の質との間の根本的トレードオフを明らかにすること。
  • 特に構造的グラフクラス(リンググラフやスターグラフなど)において、必要なクラスタリング数の境界がタイトであることを示すこと。

提案手法

  • 解像度パラメータ λ ∈ (0,1) を持つパラメータ化されたクラスタリング問題としてLambdaPrime目的関数を定式化し、クラスタサイズとエッジ密度のバランスをとる。
  • 連続的な λ 値の範囲にわたる効率的な最適化を可能にするために、LambdaPrime目的関数のパラメトリック線形計画法(LP)緩和を開発する。
  • 全パラメータ範囲をサンプリングするため、対数的離散化戦略を用いて O(log n) 個の重要な λ 値を選択する。
  • 各選択された λ 値においてLP緩和を解き、既存の近似アルゴリズム(例:重み付き相関クラスタリング用)を用いて分数解を有効なクラスタリングに丸める。
  • 結果として得られる O(log n) 個のクラスタリング族が、すべての λ ∈ (0,1) に対して最適LambdaPrime解の (1+ε)-近似を提供することを証明する。
  • 特定のグラフ族(例:リンググラフ)を構築することで下界を確立し、定数因子の範囲で、定数因子近似を達成するために Ω(log n) 個のクラスタリングが必要であることを示し、境界が定数因子の範囲でタイトであることを証明する。

実験結果

リサーチクエスチョン

  • RQ1すべての解像度パラメータ λ の値において、LambdaPrime目的関数に対する定数因子近似を達成するために必要なクラスタリングの最小数は何か?
  • RQ2すべての λ ∈ (0,1) に対して (1+ε)-近似を保証する小さなクラスタリング族を構築することは可能か?
  • RQ3あるグラフクラスにおいて、必要なクラスタリング数が漸近的にタイトであり、このような族の根本的限界は何か?
  • RQ4LambdaPrimeのパラメトリックLP緩和は、すべての λ 値にわたる近似解の効率的計算をどのように可能にするか?
  • RQ5すべてのパラメータ領域でLambdaPrimeを正確または近似的に解くために必要なクラスタリング族のサイズに関する理論的下界は何か?

主な発見

  • O(log n) 個のクラスタリングで十分であり、すべての λ ∈ (0,1) に対して最適LambdaPrime解の (1+ε)-近似が達成可能であり、この境界は定数因子の範囲でタイトである。
  • 特定のリンググラフクラスにおいて、すべての λ 値で定数因子近似を達成するには少なくとも Ω(log n) 個のクラスタリングが必要であり、上界が漸近的にタイトであることを示している。
  • m 個のクラスタリング(m は辺の数)からなる族が存在し、すべての λ ∈ (0,1) に対してLambdaPrime目的関数の正確な解を含む。これは普遍的ではあるが、サイズが大きい可能性がある。
  • 提案手法は、パラメトリックLP緩和と分数解の丸めを活用し、すべてのパラメータ領域で保証された近似保証を達成する。
  • 結果として、ヒューリスティック手法がグローバルな近似境界を持たないのとは対照的に、パラメトリックグラフクラスタリングに厳密な理論的基盤を確立した。
  • 解析により、(1+ε)-近似を達成するための必要なクラスタリング数が n に対して対数的に増加することが示され、特定のグラフ構造ではこの増加率が避けられないことが明らかになった。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。