QUICK REVIEW

[论文解读] Parallel Graph Connectivity in Log Diameter Rounds

Alexandr Andoni, Clifford Stein|arXiv (Cornell University)|May 8, 2018

Parallel Computing and Optimization Techniques参考文献 4被引用 33

一句话总结

本文提出了一种在大规模并行计算（MPC）模型下用于图连通性的新型并行算法，通过使用 $\Theta(m)$ 总内存，在 $O(\log D \cdot \log \log_{m/n}n)$ 轮内完成，其中 $D$ 为图的直径。该方法通过多步约简引入了双重指数加速技术，包括截断广播和基于最小父森林的领导者选择，显著优于经典 PRAM 模型中的 $O(\log n)$ 上界。

ABSTRACT

We study graph connectivity problem in MPC model. On an undirected graph with $n$ nodes and $m$ edges, $O(\log n)$ round connectivity algorithms have been known for over 35 years. However, no algorithms with better complexity bounds were known. In this work, we give fully scalable, faster algorithms for the connectivity problem, by parameterizing the time complexity as a function of the diameter of the graph. Our main result is a $O(\log D \log\log_{m/n} n)$ time connectivity algorithm for diameter-$D$ graphs, using $Θ(m)$ total memory. If our algorithm can use more memory, it can terminate in fewer rounds, and there is no lower bound on the memory per processor. We extend our results to related graph problems such as spanning forest, finding a DFS sequence, exact/approximate minimum spanning forest, and bottleneck spanning forest. We also show that achieving similar bounds for reachability in directed graphs would imply faster boolean matrix multiplication algorithms. We introduce several new algorithmic ideas. We describe a general technique called double exponential speed problem size reduction which roughly means that if we can use total memory $N$ to reduce a problem from size $n$ to $n/k$, for $k=(N/n)^{Θ(1)}$ in one phase, then we can solve the problem in $O(\log\log_{N/n} n)$ phases. In order to achieve this fast reduction for graph connectivity, we use a multistep algorithm. One key step is a carefully constructed truncated broadcasting scheme where each node broadcasts neighbor sets to its neighbors in a way that limits the size of the resulting neighbor sets. Another key step is random leader contraction, where we choose a smaller set of leaders than many previous works do.

研究动机与目标

设计在 MPC 模型下更快、完全可扩展的连通性算法，以超越经典 PRAM 算法。
通过将时间复杂度参数化于图的直径 $D$，将图连通性的轮数复杂度降低至 $O(\log n)$ 以下。
开发一种通用技术，用于在总内存 $N$ 的约束下，快速减少并行图算法中的问题规模。
将该方法扩展到相关问题，如生成森林、DFS 序列和最小生成森林。
建立快速有向可达性与更快布尔矩阵乘法之间的联系。

提出的方法

引入双重指数加速技术：若一个问题规模为 $n$ 的问题可在一轮内通过 $N$ 总内存减少至 $n/k$，且 $k = (N/n)^{\Theta(1)}$，则该问题可在 $O(\log \log_{N/n}n)$ 轮内解决。
采用截断广播方案，即在通信过程中限制邻居集合的增长以控制膨胀。
使用基于最小父森林的领导者选择方法，相比随机采样更高效地减少领导者数量，从而实现更早的快速进展。
应用树收缩和邻居增量操作，以在各轮之间保持连通性信息。
结合多个局部最短路径树和路径生成技术，以支持生成森林的构建。
使用范围最小值查询和 DFS 序列生成，以支持树中最近公共祖先（LCA）和路径查询。

实验结果

研究问题

RQ1在 MPC 模型下，图连通性是否能在 $o(\log n)$ 轮内解决，特别是对于直径较小的图？
RQ2在 MPC 模型中，连通性的内存使用与轮复杂度之间最优权衡是什么？
RQ3双重指数加速技术能否推广到其他图问题？
RQ4在实践中，基于最小父森林的领导者选择与随机领导者采样相比，在连通性问题中表现如何？
RQ5在有向图中实现快速可达性是否意味着能实现更快的布尔矩阵乘法？

主要发现

所提出的算法在使用 $\Theta(m)$ 总内存的情况下，实现了无向图连通性的 $O(\log D \cdot \log \log_{m/n}n)$ 轮复杂度。
当 $r \geq c \cdot \log \log_{m/n}n$ 轮，且常数 $c$ 足够大时，该算法的成功概率至少为 $2/3$，且以高概率避免失败。
基于最小父森林的领导者选择方法相比随机采样能实现更快的早期进展，尤其在 $m = \Theta(n)$ 时表现更优。
该算法可扩展用于计算生成森林、DFS 序列和最小生成森林，且轮复杂度相近。
在 MPC 模型中实现更快的有向可达性算法，将意味着更快的布尔矩阵乘法，从而建立起强有力的复杂性理论联系。
双重指数加速技术实现了问题规模的快速缩减，从而在 $\log \log_{N/n}n$ 的意义上实现了次对数轮复杂度。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。