[论文解读] Byzantine Consensus Is Θ(n²): The Dolev-Reischuk Bound Is Tight Even in Partial Synchrony!
本文提出 SQad,一种具有最优 O(n²) 通信复杂度和 O(f) 延迟的准同步拜占庭共识协议,填补了分布式系统中长期存在的空白。其通过引入 RareSync 实现,RareSync 是一种视图同步协议,具备二次方通信复杂度和线性延迟,使在部分同步环境中即使存在拜占庭故障,也能实现高效的基于领导者的一致性。
The Dolev-Reischuk bound says that any deterministic Byzantine consensus protocol has (at least) quadratic communication complexity in the worst case. While it has been shown that the bound is tight in synchronous environments, it is still unknown whether a consensus protocol with quadratic communication complexity can be obtained in partial synchrony. Until now, the most efficient known solutions for Byzantine consensus in partially synchronous settings had cubic communication complexity (e.g., HotStuff, binary DBFT). This paper closes the existing gap by introducing SQuad, a partially synchronous Byzantine consensus protocol with quadratic worst-case communication complexity. In addition, SQuad is optimally-resilient and achieves linear worst-case latency complexity. The key technical contribution underlying SQuad lies in the way we solve view synchronization, the problem of bringing all correct processes to the same view with a correct leader for sufficiently long. Concretely, we present RareSync, a view synchronization protocol with quadratic communication complexity and linear latency complexity, which we utilize in order to obtain SQuad.
研究动机与目标
- 解决在准同步系统中是否可实现通信复杂度为 O(n²) 的拜占庭共识这一开放问题。
- 弥合已知的 Dolev-Reischuk 下界(Ω(n²))与部分同步中最佳已知上界(O(n³))之间的差距。
- 设计一种与理论下界匹配的一致性协议,同时保持最优容错能力和低延迟。
- 开发一种新颖的视图同步机制,使在部分同步环境中能够实现高效的基于领导者的一致性。
提出的方法
- 提出 SQad,一种基于双阶段架构(视图核心与视图同步器)的准同步拜占庭共识协议。
- 设计 RareSync,一种视图同步协议,通过 O(n²) 通信和 O(f) 延迟确保所有正确进程收敛到具有正确领导者的同一视图。
- 在 RareSync 中使用基于纪元的协调机制,实现跨视图的进程同步,最大限度减少冗余通信。
- 利用认证阶段验证决策并确保活性,消息中携带密码学证书以防止二义性行为。
- 证明协议在拜占庭故障下仍能保持有效性、一致性和终止性,即使进程以不同时间启动或存在时钟漂移。
- 通过将执行分解为预-GST、GST 和后-GST 阶段,分析通信和延迟复杂度,表明总复杂度分别为 O(n²) 和 O(f)。
实验结果
研究问题
- RQ1确定性拜占庭共识协议是否可在准同步系统中实现 O(n²) 通信复杂度?
- RQ2在部分同步中,通信复杂度的 Dolev-Reischuk 下界 Ω(n²) 是否是紧致的?
- RQ3能否设计一种通信复杂度为 O(n²)、延迟为 O(f) 的视图同步协议,以实现在部分同步环境中的最优一致性?
- RQ4最优视图同步与基于领导者视图核心的结合,是否能产生匹配理论下界的共识协议?
- RQ5此类协议是否可在实现线性延迟的同时保持最优容错能力(容忍最多 f 个故障进程)?
主要发现
- SQad 实现了 O(n²) 最坏情况通信复杂度,与 Dolev-Reischuk 下界一致,证明即使在部分同步中该下界也是紧致的。
- 协议实现了 O(f) 最坏情况延迟,这对于存在 f 个故障进程的拜占庭共识而言是最优的。
- RareSync 视图同步协议确保所有正确进程在 O(f) 时间内收敛到具有正确领导者的同一视图,通信复杂度为 O(n²)。
- 协议具有最优容错能力,可容忍最多 f 个拜占庭故障,同时保持正确性和活性。
- 分析表明,即使进程在 GST 之后才开始执行,由于纪元转换和消息数量的有界性,通信复杂度仍保持为 O(n²)。
- 通过要求所有决策均附带密码学证书,协议维持了有效性和一致性,防止了二义性行为。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。