Skip to main content
QUICK REVIEW

[论文解读] Federated Residual Learning

Alekh Agarwal, John Langford|arXiv (Cornell University)|Mar 28, 2020
Privacy-Preserving Technologies in Data参考文献 22被引用 19
一句话总结

本文提出联邦残差学习(FedRes),一种新颖的联邦学习框架,其中客户端训练个性化的本地模型,并与共享的全局模型联合预测。通过将预测建模为全局与本地残差之和,FedRes 降低了通信开销,增强了隐私保护,并在数据异质性和通信延迟方面表现出更优的鲁棒性,在多种数据集上的实验中,其性能优于集中式学习和独立学习基线方法。

ABSTRACT

We study a new form of federated learning where the clients train personalized local models and make predictions jointly with the server-side shared model. Using this new federated learning framework, the complexity of the central shared model can be minimized while still gaining all the performance benefits that joint training provides. Our framework is robust to data heterogeneity, addressing the slow convergence problem traditional federated learning methods face when the data is non-i.i.d. across clients. We test the theory empirically and find substantial performance gains over baselines.

研究动机与目标

  • 为解决联邦学习中数据异质性问题,即非独立同分布(non-i.i.d.)的客户端数据会降低集中式模型的性能。
  • 在保留联合训练优势的同时,降低集中式模型的复杂度和通信成本。
  • 通过允许客户端在不泄露模型结构或特征的前提下训练本地模型,实现隐私保护且可扩展的联邦学习。
  • 设计一种对真实联邦系统中常见的通信延迟具有鲁棒性的算法。
  • 通过实证验证,FedRes 在多样化数据分布和延迟条件下,均优于集中式学习和独立学习基线方法。

提出的方法

  • 将每个客户端的预测建模为全局模型输出与本地模型残差预测之和,实现在不共享完整模型的前提下进行联合学习。
  • 客户端仅通信残差(例如,本地与全局预测之间的差异),将通信量降低至每样本仅几个比特。
  • 该框架采用一种新型的SGD变体,能够处理客户端的延迟反馈,即使在异步更新下仍能保持收敛性。
  • 该方法支持小批量训练,并允许客户端独立设计本地模型和特征,从而支持异构设备。
  • 理论分析推导出遗憾界,表明其对延迟具有鲁棒性,并且性能优于纯粹的全局或本地学习。
  • 该方法具有通用性,可适用于多种模型,包括图像分类、强化学习和机器翻译等任务。

实验结果

研究问题

  • RQ1联邦学习框架能否通过联合利用全局与本地模型,在数据异质性条件下提升性能?
  • RQ2在联邦设置中实现联合学习的同时,如何在保障通信效率和客户端隐私的前提下进行?
  • RQ3在真实部署中常见的通信延迟下,所提出的FedRes框架在多大程度上仍保持鲁棒性?
  • RQ4FedRes 是否在多样化数据分布和延迟条件下,均优于集中式学习和独立学习基线方法?
  • RQ5基于残差的模型解耦方法能否在异构客户端环境中有效平衡模型复杂度与性能?

主要发现

  • 在测试准确率方面,FedRes 在客户端任务相似且数据为非独立同分布的情况下,始终优于集中式学习和独立学习基线方法。
  • 在无延迟情况下,FedRes 在所有数据集上均接近最优性能,尤其在MNIST、SATIMAGE和USPS等数据集中,显著超越基线方法。
  • 在通信延迟(最高达200步)条件下,FedRes 仍保持稳健性能,仅出现适度下降,且在存在延迟时优于集中式学习。
  • 在独立学习表现更优的数据集上(如letter、pendigits),FedRes 仍表现出竞争力,尽管在中等延迟下可能因任务相似性不足而略有性能下降。
  • 随着客户端数量增加,FedRes 能够克服延迟带来的性能损失,展现出在大规模部署中的可扩展性和鲁棒性。
  • 理论遗憾界证实,即使存在有界延迟,FedRes 仍能保持收敛性和性能增益,将先前关于延迟随机优化的研究成果拓展至联邦学习场景。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。