Skip to main content
QUICK REVIEW

[论文解读] DisPFL: Towards Communication-Efficient Personalized Federated Learning via Decentralized Sparse Training

Rongji Dai, Li Shen|arXiv (Cornell University)|Jun 1, 2022
Privacy-Preserving Technologies in Data被引用 47
一句话总结

DisPFL 通过去中心化的稀疏训练实现去中心化、个性化的联邦学习,在非IID数据和异构客户端约束下减少通信和计算,同时提高每个用户的准确性。

ABSTRACT

Personalized federated learning is proposed to handle the data heterogeneity problem amongst clients by learning dedicated tailored local models for each user. However, existing works are often built in a centralized way, leading to high communication pressure and high vulnerability when a failure or an attack on the central server occurs. In this work, we propose a novel personalized federated learning framework in a decentralized (peer-to-peer) communication protocol named Dis-PFL, which employs personalized sparse masks to customize sparse local models on the edge. To further save the communication and computation cost, we propose a decentralized sparse training technique, which means that each local model in Dis-PFL only maintains a fixed number of active parameters throughout the whole local training and peer-to-peer communication process. Comprehensive experiments demonstrate that Dis-PFL significantly saves the communication bottleneck for the busiest node among all clients and, at the same time, achieves higher model accuracy with less computation cost and communication rounds. Furthermore, we demonstrate that our method can easily adapt to heterogeneous local clients with varying computation complexities and achieves better personalized performances.

研究动机与目标

  • 通过在去中心化环境中为每个客户端学习个性化模型来解决数据异质性。
  • 通过持续稀疏掩码和去中心化的八卦式(gossip)更新来降低通信和计算成本。
  • 适应在计算、内存和带宽方面各异的客户端能力。
  • 为稀疏、个性化的去中心化模型提供理论泛化洞见。
  • 在常见的非IID分区下在标准基准上实证验证性能。

提出的方法

  • 将个性化FL表述为带全局密集模型 w 与客户端特定掩码 mk 的形式,优化 f(w, m1,...,mK) = (1/K) sum_k Fk(w ∘ mk).
  • 用从 Erdos-Renyi Kernel 派生的稀疏掩码初始化每个客户端,以匹配容量 c_k。
  • 使用一种修改的 gossip 平均,只聚合相邻节点之间活跃权重的交集。
  • 使用固定稀疏掩码进行局部训练以节省计算。
  • 通过余弦衰减剪枝和梯度信息驱动的恢复来更新每个客户端的掩码,以增强个性化。
  • 通过仅对活跃坐标屏蔽前向和后向传播来确保计算和通信节省。

实验结果

研究问题

  • RQ1在非IID FL 设置下,去中心化稀疏训练框架是否能实现带有更少通信的个性化模型?
  • RQ2所提出的基于掩码的个性化与去中心化 gossip 平均如何互动,以在精度和效率之间取得平衡?
  • RQ3Dis-PFL 在计算、内存和通信方面对异构客户端能力的适应性有多强?
  • RQ4可以为去中心化稀疏个性化模型建立哪些理论泛化界限?
  • RQ5在标准数据集(CIFAR-10/100、Tiny-ImageNet)上的实证结果是否在各种分区和拓扑结构下倾向于 Dis-PFL 相对于集中式/去中心化基线?

主要发现

任务方法Dir Part 准确率Path Part 准确率通信量 (MB)FLOPS (1e12)
CIFAR-10Local61.55 ± 0.286.48 ± 0.2-8.3
CIFAR-10FedAvg78.07 ± 0.554.53 ± 0.6446.98.3
CIFAR-10FedAvg-FT81.20 ± 0.584.96 ± 0.2446.98.3
CIFAR-10D-PSGD79.02 ± 0.458.07 ± 0.5446.98.3
CIFAR-10D-PSGD-FT83.90 ± 0.290.87 ± 0.2446.98.3
CIFAR-10Ditto74.68 ± 0.287.73 ± 0.1446.98.3
CIFAR-10FOMO64.68 ± 0.288.24 ± 0.1446.98.3
CIFAR-10SubFedAvg76.70 ± 0.288.30 ± 0.2278.84.7
CIFAR-10Dis-PFL85.70 ± 0.291.05 ± 0.2223.47.0
CIFAR-100Local29.23 ± 0.252.46 ± 0.2-8.3
CIFAR-100FedAvg41.72 ± 0.533.24 ± 0.6448.78.3
CIFAR-100FedAvg-FT49.19 ± 0.563.53 ± 0.7448.78.3
CIFAR-100D-PSGD41.87 ± 0.435.42 ± 0.2448.78.3
CIFAR-100D-PSGD-FT51.42 ± 0.467.24 ± 0.1448.78.3
CIFAR-100Ditto38.26 ± 0.254.02 ± 0.3448.78.3
CIFAR-100FOMO28.39 ± 0.152.74 ± 0.1448.78.3
CIFAR-100SubFedAvg43.91 ± 0.260.67 ± 0.1346.65.7
CIFAR-100Dis-PFL53.48 ± 0.368.64 ± 0.4224.37.0
Tiny-ImagenetLocal6.76 ± 0.217.68 ± 0.3-66.6
Tiny-ImagenetFedAvg12.30 ± 0.310.40 ± 0.3450.766.6
Tiny-ImagenetFedAvg-FT14.80 ± 0.228.30 ± 0.2450.766.6
Tiny-ImagenetD-PSGD12.13 ± 0.516.50 ± 0.4450.766.6
Tiny-ImagenetD-PSGD-FT15.50 ± 0.328.60 ± 0.3450.766.6
Tiny-ImagenetDitto15.69 ± 0.224.55 ± 0.3450.766.6
Tiny-ImagenetFOMO5.20 ± 0.49.39 ± 0.3450.766.6
Tiny-ImagenetSubFedAvg12.18 ± 0.419.73 ± 0.5290.940.2
Tiny-ImagenetDis-PFL16.95 ± 0.431.71 ± 0.4225.354.5
  • 在 Dirichlet 和 path 分区下,Dis-PFL 在 CIFAR-10、CIFAR-100 和 Tiny-Imagenet 的测试准确率上超过集中和去中心化基线。
  • Dis-PFL 实现了更高的本地个性化准确率(Path Part),并且对等通信量(Comm)更低,FLOPs 方面相当或更低。
  • 方法在达到目标精度的通信轮次方面更少,尤其是在受限拓扑(环、全连接,时间变化连接)下。
  • 通过分配不同的稀疏掩码,可容纳能力各异的客户端,保持较强性能。
  • 学习得到的稀疏掩码与数据分布对齐,并在客户端之间显示出可解释的相似性,支持个性化收益。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。