[论文解读] Beyond BFS: A Comparative Study of Rooted Spanning Tree Algorithms on GPUs
该论文比较 BFS、基于连通性的算法和 PR-RST 在 GPU-rooted spanning trees 上的表现,GConn 搭配 Eulerian Tour 往往获得最佳性能,在高直径图上比优化后的 BFS 快多达 300 倍,挑战将 BFS 作为默认方法。
Rooted spanning trees (RSTs) are a core primitive in parallel graph analytics, underpinning algorithms such as biconnected components and planarity testing. On GPUs, RST construction has traditionally relied on breadth-first search (BFS) due to its simplicity and work efficiency. However, BFS incurs an O(D) step complexity, which severely limits parallelism on high-diameter and power-law graphs. We present a comparative study of alternative RST construction strategies on modern GPUs. We introduce a GPU adaptation of the Path Reversal RST (PR-RST) algorithm, optimizing its pointer-jumping and broadcast operations for modern GPU architecture. In addition, we evaluate an integrated approach that combines a state-of-the-art connectivity framework (GConn) with Eulerian tour-based rooting. Across more than 10 real-world graphs, our results show that the GConn-based approach achieves up to 300x speedup over optimized BFS on high-diameter graphs. These findings indicate that the O(log n) step complexity of connectivity-based methods can outweigh their structural overhead on modern hardware, motivating a rethinking of RST construction in GPU graph analytics.
研究动机与目标
- 通过利用基于连通性的方法,促使对 GPU 上 RST 构造的重新思考,超越 BFS。
- 评估在 GPU 上的、深度更高效的替代方案 PR-RST。
- 研究两阶段(连通性加 Euler tour)在现代 GPU 上的高效性 rooting。
- 量化在真实世界图上的性能并分析直径对 RST 方法的影响。
提出的方法
- 实现从 Cong 与 Bader 的 BFS、基于连通性的 RST(GConn)和 PR-RST 的 GPU 适配。
- 评估一个集成的 GConn 加 Eulerian tour rooting 的方法。
- 将 Eulerian Tour 适配以处理非连通森林,并使用现代 GPU 库(CUDA、CUB)进行优化。
- 使用指针跳跃、连接变体和路径反转优化以维持数据并行性。
- 在 30+ 个真实世界图上,在 NVIDIA L40s GPU 上进行多次尝试并以中位数计时衡量性能。
实验结果
研究问题
- RQ1哪种 RST 构造策略(BFS、基于连通性的方法、PR-RST)在真实世界图上能提供最佳的 GPU 性能?
- RQ2图的直径如何影响结果根树的性能和深度?
- RQ3在结合连通性方法时,现代 GPU 上的 Euler Tour 根植开销是否值得?
- RQ4不同 RST 方法对下游图分析的结构性影响(树深度)有哪些?
主要发现
- 基于 GConn 的 RST 配合 Eulerian Tour 在高直径图上实现了相较于优化后的 BFS 的高达 300x 的加速。
- 基于连通性的方法在不同图直径下几乎保持恒定的性能,而非 BFS 的变化性。
- GConn 基于的 RST 往往比 BFS 产生更深的树,显示出深度–性能的权衡。
- 适用于 GPU 的路径反转 RST 和 PR-RST 的改编在谨慎的指针跳跃与在路径标记下可发挥作用。
- 当现代化(使用 CUDA/CUB) Euler Tour 技术时,在 GPU 上对森林进行根化仍然可行且有益。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。