[论文解读] Federated Learning with Buffered Asynchronous Aggregation
FedBuff 引入缓冲的异步聚合用于联邦学习,在保持与 Secure Aggregation 和 differential privacy 兼容的同时实现高并发,并在光滑非凸设置中具备收敛性证明,并相对于同步和异步基线在实验中展现出效率提升。
Scalability and privacy are two critical concerns for cross-device federated learning (FL) systems. In this work, we identify that synchronous FL - synchronized aggregation of client updates in FL - cannot scale efficiently beyond a few hundred clients training in parallel. It leads to diminishing returns in model performance and training speed, analogous to large-batch training. On the other hand, asynchronous aggregation of client updates in FL (i.e., asynchronous FL) alleviates the scalability issue. However, aggregating individual client updates is incompatible with Secure Aggregation, which could result in an undesirable level of privacy for the system. To address these concerns, we propose a novel buffered asynchronous aggregation method, FedBuff, that is agnostic to the choice of optimizer, and combines the best properties of synchronous and asynchronous FL. We empirically demonstrate that FedBuff is 3.3x more efficient than synchronous FL and up to 2.5x more efficient than asynchronous FL, while being compatible with privacy-preserving technologies such as Secure Aggregation and differential privacy. We provide theoretical convergence guarantees in a smooth non-convex setting. Finally, we show that under differentially private training, FedBuff can outperform FedAvgM at low privacy settings and achieve the same utility for higher privacy settings.
研究动机与目标
- 通过在不牺牲隐私的前提下实现高并发来解决跨设备FL的可扩展性问题。
- 开发一个服务器更新机制,在应用更新之前在一个安全缓冲区中聚合更新。
- 确保与诸如 Secure Aggregation 和 differential privacy 之类的隐私技术兼容。
- 在光滑非凸目标下提供理论收敛性保证。
- 展示相较于现有同步和异步FL方法的经验效率提升。
提出的方法
- 提出 FedBuff,其中客户端更新异步收集,但服务器更新仅在安全缓冲区累积了 K 次更新后才进行。
- 使用缓冲区大小 K 将并发性与服务器更新频率解耦,其中 K = 10 被确定为一个良好的默认值。
- 在安全的可信执行环境(Trusted Execution Environment)或加密缓冲区中聚合更新以保护隐私。
- 给出 FedBuff 在光滑非凸设定下的收敛性分析,考虑局部步数 Q 和时滞。
- 扩展 FedBuff 以通过 SecAgg 和 DP-FTRL 支持差分隐私,从而实现 GDP 隐私保证。
- 引入实用改进,例如时滞缩放和学习率归一化,以帮助训练稳定性。
实验结果
研究问题
- RQ1带缓冲的异步聚合是否能够在不损害隐私的前提下提高跨设备 FL 的可扩展性?
- RQ2在高并发下,FedBuff 的缓冲区大小 K 如何影响收敛性和通信效率?
- RQ3FedBuff 是否与 Secure Aggregation 和差分隐私兼容,DP 如何影响其收敛性?
- RQ4在异步更新下,FedBuff 在光滑非凸目标中的理论收敛性保证是什么?
- RQ5诸如时滞加权和学习率归一化等实用技术如何影响性能?
主要发现
- FedBuff 的效率在实验中比最佳同步基线高出最多 3.8 倍。
- 在所报告的基准测试中,FedBuff 在最近的异步方法上领先多达 2.5 倍。
- 缓冲区大小 K=10 在 CelebA、Sent140 和 CIFAR-10 任务中始终提供强劲的性能。
- FedBuff 仍然与 Secure Aggregation 兼容,并且可以扩展到具有 GDP 保证的差分隐私。
- 在 DP 下,FedBuff 在低隐私设置下可以超越放大 DP-SGD 的同步 FedAvgM,并在较高隐私设置时达到相同的性能。
- 理论结果显示 FedBuff 在光滑非凸性下的遍历收敛率界限。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。