Skip to main content
QUICK REVIEW

[論文レビュー] Sublinear Algorithms for MAXCUT and Correlation Clustering

Aditya Bhaskara, Samira Daruki|arXiv (Cornell University)|Jan 1, 2018
Complexity and Algorithms in Graphs参考文献 20被引用数 3
ひとこと要約

本稿では、平均次数 $ n^\delta $ のグラフに対してMAXCUTおよび相関クラスタリングのためのサブリニアアルゴリズムを提示する。新たなバイアス付きサンプリング技術を用いて、サイズ $ \tilde{O}(n^{1-\delta}) $ のコアセットを構築する。この手法により、$ \tilde{O}(n^{1-\delta}) $ の空間で $ (1+\varepsilon) $-近似を達成する2パスストリーミングアルゴリズムが可能となり、指数時間仮説(ETH)のもとで最適であることが示される。

ABSTRACT

We study sublinear algorithms for two fundamental graph problems, MAXCUT and correlation clustering. Our focus is on constructing core-sets as well as developing streaming algorithms for these problems. Constant space algorithms are known for dense graphs for these problems, while $Ω(n)$ lower bounds exist (in the streaming setting) for sparse graphs. Our goal in this paper is to bridge the gap between these extremes. Our first result is to construct core-sets of size $ ilde{O}(n^{1-δ})$ for both the problems, on graphs with average degree $n^δ$ (for any $δ>0$). This turns out to be optimal, under the exponential time hypothesis (ETH). Our core-set analysis is based on studying random-induced sub-problems of optimization problems. To the best of our knowledge, all the known results in our parameter range rely crucially on near-regularity assumptions. We avoid these by using a biased sampling approach, which we analyze using recent results on concentration of quadratic functions. We then show that our construction yields a 2-pass streaming $(1+ε)$-approximation for both problems; the algorithm uses $ ilde{O}(n^{1-δ})$ space, for graphs of average degree $n^δ$.

研究の動機と目的

  • 密度の高いグラフ($ O(1) $ の空間)と疎なグラフ($ \Omega(n) $ の空間)におけるサブリニアアルゴリズムのギャップを埋めること。特に $ \delta > 0 $ に対して平均次数 $ n^\delta $ のグラフに焦点を当てる。
  • MAXCUTおよび相関クラスタリングのためのコアセット構築法を開発すること。このコアセットはサイズ最適かつ非正則なグラフ構造に対しても頑健であるべきである。
  • 平均次数 $ n^\delta $ のグラフ上で、$ \tilde{O}(n^{1-\delta}) $ の空間を用いて $ (1+\varepsilon) $-近似を達成する2パスストリーミングアルゴリズムを設計すること。
  • 従来のサブサンプリング手法が近似的に正則性の仮定に依存するという制限を克服するため、バイアス付きサンプリングのアプローチを導入すること。

提案手法

  • 次数に比例する確率で頂点を選択するバイアス付きサンプリング法を提案。近似的に正則性に依存しない。
  • 二次形式の集中不等式を用いて、サンプリングが最適化目的に与える影響を分析。特にベルンシュタイン型不等式を活用。
  • MAXCUTおよび相関クラスタリングの両者に対して、原グラフとサンプリングされたグラフの線形計画緩和の双対を比較する双対ベースの解析を導入。
  • サンプリングされた部分グラフが双対目的関数を $ \varepsilon $-要因以内に保つ「良い条件化」事象を導入。エッジ重みおよび変数の有界性に依存。
  • 双対目的関数の差を制御するため、頂点サンプリングとエッジ重み寄与の項に分けるハイブリッド項分解を適用。
  • 二次関数の集中不等式をブラックボックス的に応用し、サンプリングされた目的関数と元の目的関数との乖離を制御。

実験結果

リサーチクエスチョン

  • RQ1平均次数 $ n^\delta $($ \delta > 0 $)のグラフにおいて、$ o(n) $ の空間を用いて、MAXCUTおよび相関クラスタリングの $ (1+\varepsilon) $-近似を達成できるサブリニアアルゴリズムは存在するか?
  • RQ2サイズ $ \tilde{O}(n^{1-\delta}) $ のコアセットは、このようなグラフにおけるMAXCUTおよび相関クラスタリングの $ (1+\varepsilon) $-近似に十分であり、かつこのサイズは最適か?
  • RQ3バイアス付きサンプリングは、グラフ最適化問題のサブサンプリング解析において、近似的に正則性の仮定を必要としないために克服できるか?
  • RQ4非一様サンプリング下での線形計画緩和の双対目的関数はどのように振る舞い、近似保証を確保するためにどのようにバインドできるか?
  • RQ5コアセット構築法は、サブリニア空間を用いた2パスストリーミングモデルに拡張可能か?

主な発見

  • 本稿では、平均次数 $ n^\delta $ のグラフに対して、サイズ $ \tilde{O}(n^{1-\delta}) $ のコアセットをMAXCUTおよび相関クラスタリングのためのものとして構築する。これは指数時間仮説(ETH)のもとで、対数要因を除いて最適である。
  • 2パスストリーミングアルゴリズムが開発され、$ \tilde{O}(n^{1-\delta}) $ の空間を用いて両問題に対して $ (1+\varepsilon) $-近似を達成する。相関クラスタリングの分野では、半ストリーミング結果を改善する。
  • バイアス付きサンプリングアプローチにより、従来のサブサンプリング解析で必要とされる近似的に正則性の仮定を回避できた。
  • 高い確率で、サンプリングされたグラフの双対目的関数が元のものと $ \tilde{O}(1/\Delta^2) $ 要因以内に保たれることを示した。これにより近似保証が保証される。
  • 非一様サンプリング下でも、ベルンシュタインの不等式を用いて、双対目的関数における二次形式の集中不等式を達成した。
  • コアセットサイズが最適であることを証明した。より小さいサイズでは、ETHが許容する範囲を超えてMAXCUTを高速に解けることになり、この境界のタイトさが確認された。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。