Skip to main content
QUICK REVIEW

[論文レビュー] Approximate Greedy Clustering and Distance Selection for Graph Metrics

David Eppstein, Sariel Har-Peled|arXiv (Cornell University)|Jul 6, 2015
Computational Geometry and Mesh Generation参考文献 32被引用数 6
ひとこと要約

本稿では、グラフ距離空間および高次元ユークリッド空間におけるグリーディーパーミュテーションと距離選択のための効率的な近似アルゴリズムを提示する。スパースなグラフおよび高次元ユークリッドデータに対して、近似度 (1+ε) のグリーディーパーミュテーションを近線形期待時間で計算する確率的アルゴリズムを導入し、有界木幅を持つグラフにおける正確なグリーディーパーミュテーションの決定的アルゴリズムも提示する。主な貢献は、基本的なメトリック問題に対する準二次時間近似スキームの確立であり、大規模データワークロードにおけるスケーラブルなクラスタリングと距離選択を可能にする。

ABSTRACT

$ ewcommand{\eps}{\varepsilon}$ In this paper, we consider two important problems defined on finite metric spaces, and provide efficient new algorithms and approximation schemes for these problems on inputs given as graph shortest path metrics or high-dimensional Euclidean metrics. The first of these problems is the greedy permutation (or farthest-first traversal) of a finite metric space: a permutation of the points of the space in which each point is as far as possible from all previous points. We describe randomized algorithms to find $(1+\eps)$-approximate greedy permutations of any graph with $n$ vertices and $m$ edges in expected time $O(\eps^{-1}(m+n)\log n\log(n/\eps))$, and to find $(1+\eps)$-approximate greedy permutations of points in high-dimensional Euclidean spaces in expected time $O(\eps^{-2} n^{1+1/(1+\eps)^2 + o(1)})$. Additionally we describe a deterministic algorithm to find exact greedy permutations of any graph with $n$ vertices and treewidth $O(1)$ in worst-case time $O(n^{3/2}\log^{O(1)} n)$. The second of the two problems we consider is distance selection: given $k \in [ \binom{n}{2} ]$, we are interested in computing the $k$th smallest distance in the given metric space. We show that for planar graph metrics one can approximate this distance, up to a constant factor, in near linear time.

研究の動機と目的

  • グラフや高次元ユークリッドデータによって定義される大規模メトリック空間におけるグリーディーパーミュテーションおよび距離選択のスケーラビリティを扱う。
  • グリーディーパーミュテーションと距離選択に対して、O(n²) のボトルネックを克服する準二次時間近似アルゴリズムを開発する。
  • 有界木幅を持つグラフにおけるグリーディーパーミュテーションの効率的正確アルゴリズムを提供し、標準的なO(n²)手法を改善する。
  • 平面グラフ距離空間における距離選択のための高速近似スキームを設計し、近線形時間で定数倍近似を達成する。
  • グラフ構造と幾何的性質を活用して、大規模データワークロードにおける効率的かつスケーラブルなクラスタリングと距離計算を実現する。

提案手法

  • スパースなグラフにおけるグリーディーパーミュテーションの近似に、平面セパレータを用いたグラフの階層的分解と確率的サンプリングを用いる。
  • トーラップのフレームワークに基づく (1+ε)-近似距離オラクルを適用し、平面グラフ内での距離を小さな誤差で推定する。
  • 境界集合が小さいパッチにグラフを階層的に分解することで、局所的な距離カウントを効率的に計算する。
  • 境界頂点からディクストラ法を用いて半径r以内の到達可能性を計算し、距離オラクルクエリと組み合わせて全ペアカウントの上限を特定する。
  • O(ε⁻²n log³n) の事前処理時間と O(ε⁻¹) のクエリ時間を持つ距離オラクルを構築し、距離 (1+ε)r 以内のペア数を推定する。
  • 階層的分解におけるすべてのパッチからの局所的カウントを統合して、|P≤r| ≤ α ≤ |P≤(3+ε)r| を満たすグローバル推定値 α を得る。

実験結果

リサーチクエスチョン

  • RQ1スパースなグラフおよび高次元ユークリッド空間において、(1+ε)-近似グリーディーパーミュテーションを近線形期待時間で計算できるか?
  • RQ2準二次時間アルゴリズムを用いた場合、平面グラフ距離空間における距離選択の最良の近似比は何か?
  • RQ3有界木幅を持つグラフにおいて、O(n²) より速く正確なグリーディーパーミュテーションを計算できるか?
  • RQ4階層的グラフ分解と距離オラクルをどのように組み合わせて、与えられた距離範囲内のペア数を推定できるか?
  • RQ5グラフ距離空間の構造をどの程度活用すれば、基本的なメトリック問題に対する準二次時間解法を達成できるか?

主な発見

  • 確率的アルゴリズムにより、n 頂点と m 辺を持つ任意のグラフの (1+ε)-近似グリーディーパーミュテーションが、期待時間 O(ε⁻¹(m + n) log n log(n/ε)) で計算可能である。
  • 高次元ユークリッド空間では、期待時間 O(ε⁻²n¹⁺¹/(1+ε)²⁺ᵒ⁽¹⁾) で (1+ε)-近似グリーディーパーミュテーションを達成する。
  • 決定的アルゴリズムにより、木幅 O(1) のグラフにおける正確なグリーディーパーミュテーションが、最悪計算量 O(n³ᐟ² logᴼ⁽¹⁾ n) で計算可能である。
  • 平面グラフ距離空間では、O(ε⁻²n log³n) 時間で k 番目に小さい距離の定数倍近似が可能である。
  • 距離選択のアルゴリズムは整数 α を返し、|P≤r| ≤ α ≤ |P≤(3+ε)r| を満たす。これにより、真のカウントに対する定数倍近似が保証される。
  • 全体的なアプローチにより、すべての k 同時に O(ε⁻¹m log²n) 時間で (2+ε)-近似 k センタクラスタリングが達成され、従来の手法に比べ顕著な改善が得られる。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。