Skip to main content
QUICK REVIEW

[论文解读] Beyond BFS: A Comparative Study of Rooted Spanning Tree Algorithms on GPUs

Abhijeet Sahu, Srikar Vilas Donur|arXiv (Cornell University)|Mar 12, 2026
Graph Theory and Algorithms被引用 0
一句话总结

该论文比较 BFS、基于连通性的算法和 PR-RST 在 GPU-rooted spanning trees 上的表现,GConn 搭配 Eulerian Tour 往往获得最佳性能,在高直径图上比优化后的 BFS 快多达 300 倍,挑战将 BFS 作为默认方法。

ABSTRACT

Rooted spanning trees (RSTs) are a core primitive in parallel graph analytics, underpinning algorithms such as biconnected components and planarity testing. On GPUs, RST construction has traditionally relied on breadth-first search (BFS) due to its simplicity and work efficiency. However, BFS incurs an O(D) step complexity, which severely limits parallelism on high-diameter and power-law graphs. We present a comparative study of alternative RST construction strategies on modern GPUs. We introduce a GPU adaptation of the Path Reversal RST (PR-RST) algorithm, optimizing its pointer-jumping and broadcast operations for modern GPU architecture. In addition, we evaluate an integrated approach that combines a state-of-the-art connectivity framework (GConn) with Eulerian tour-based rooting. Across more than 10 real-world graphs, our results show that the GConn-based approach achieves up to 300x speedup over optimized BFS on high-diameter graphs. These findings indicate that the O(log n) step complexity of connectivity-based methods can outweigh their structural overhead on modern hardware, motivating a rethinking of RST construction in GPU graph analytics.

研究动机与目标

  • 通过利用基于连通性的方法,促使对 GPU 上 RST 构造的重新思考,超越 BFS。
  • 评估在 GPU 上的、深度更高效的替代方案 PR-RST。
  • 研究两阶段(连通性加 Euler tour)在现代 GPU 上的高效性 rooting。
  • 量化在真实世界图上的性能并分析直径对 RST 方法的影响。

提出的方法

  • 实现从 Cong 与 Bader 的 BFS、基于连通性的 RST(GConn)和 PR-RST 的 GPU 适配。
  • 评估一个集成的 GConn 加 Eulerian tour rooting 的方法。
  • 将 Eulerian Tour 适配以处理非连通森林,并使用现代 GPU 库(CUDA、CUB)进行优化。
  • 使用指针跳跃、连接变体和路径反转优化以维持数据并行性。
  • 在 30+ 个真实世界图上,在 NVIDIA L40s GPU 上进行多次尝试并以中位数计时衡量性能。

实验结果

研究问题

  • RQ1哪种 RST 构造策略(BFS、基于连通性的方法、PR-RST)在真实世界图上能提供最佳的 GPU 性能?
  • RQ2图的直径如何影响结果根树的性能和深度?
  • RQ3在结合连通性方法时,现代 GPU 上的 Euler Tour 根植开销是否值得?
  • RQ4不同 RST 方法对下游图分析的结构性影响(树深度)有哪些?

主要发现

  • 基于 GConn 的 RST 配合 Eulerian Tour 在高直径图上实现了相较于优化后的 BFS 的高达 300x 的加速。
  • 基于连通性的方法在不同图直径下几乎保持恒定的性能,而非 BFS 的变化性。
  • GConn 基于的 RST 往往比 BFS 产生更深的树,显示出深度–性能的权衡。
  • 适用于 GPU 的路径反转 RST 和 PR-RST 的改编在谨慎的指针跳跃与在路径标记下可发挥作用。
  • 当现代化(使用 CUDA/CUB) Euler Tour 技术时,在 GPU 上对森林进行根化仍然可行且有益。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。