Skip to main content
QUICK REVIEW

[论文解读] FedAC: An Adaptive Clustered Federated Learning Framework for Heterogeneous Data

Yuxin Zhang, Haoyu Chen|arXiv (Cornell University)|Mar 25, 2024
Privacy-Preserving Technologies in Data被引用 5
一句话总结

FedAC 是一个自适应簇联邦学习框架,将神经网络解耦为子模块以融合全局和簇内知识,使用低秩余弦相似度进行在线聚类,并动态调整簇的数量以处理非IID数据。

ABSTRACT

Clustered federated learning (CFL) is proposed to mitigate the performance deterioration stemming from data heterogeneity in federated learning (FL) by grouping similar clients for cluster-wise model training. However, current CFL methods struggle due to inadequate integration of global and intra-cluster knowledge and the absence of an efficient online model similarity metric, while treating the cluster count as a fixed hyperparameter limits flexibility and robustness. In this paper, we propose an adaptive CFL framework, named FedAC, which (1) efficiently integrates global knowledge into intra-cluster learning by decoupling neural networks and utilizing distinct aggregation methods for each submodule, significantly enhancing performance; (2) includes a costeffective online model similarity metric based on dimensionality reduction; (3) incorporates a cluster number fine-tuning module for improved adaptability and scalability in complex, heterogeneous environments. Extensive experiments show that FedAC achieves superior empirical performance, increasing the test accuracy by around 1.82% and 12.67% on CIFAR-10 and CIFAR-100 datasets, respectively, under different non-IID settings compared to SOTA methods.

研究动机与目标

  • 通过在联邦学习中形成相似客户端的簇来解决数据异质性。
  • 通过神经网络解耦实现全局知识向簇内学习的整合。
  • 提供一种成本高效的在线模型相似性度量,用于动态聚类。
  • 在训练过程中动态调整簇的数量,以获得更好的可扩展性和鲁棒性。
  • 在非IID 的 CIFAR-10/100 数据集上展示优于SOTA方法的性能。

提出的方法

  • 将神经网络解耦为嵌入子模块(phi)和决策子模块(h),并应用不同的聚合策略。
  • 使用全局嵌入 Phi 和簇中心模型 Omega_k,通过 L_global 和 L_intra 项对本地更新进行正则化。
  • 引入基于降维模型的低秩余弦相似度(LrCos)来衡量在线模型相似性。
  • 实现类似 EM 的重新聚类机制,E 步用于客户端到簇的分配,M 步用于更新簇中心。
  • 通过基于簇内/簇间距离 Dist_intra, Dist_inter 的簇数调整(CNT)模块动态调整簇数量 K。
  • 优化一个二层目标,结合监督损失、簇内正则化和全局正则化,通过交替最小化实现。

实验结果

研究问题

  • RQ1如何在 CFL 中有效地将全局知识整合到簇内学习?
  • RQ2是否存在一个成本高效的在线相似性度量来引导动态聚类,而不产生过高开销?
  • RQ3自适应簇数量是否能在异质FL设置中提升性能和鲁棒性?
  • RQ4FedAC 的正则化项中,簇内信息与全局信息之间的权衡是什么?

主要发现

方法CIFAR-10 (alpha=0.1, n=3)CIFAR-10 (alpha=0.1, n=8)CIFAR-100 (alpha=0.1, n=3)CIFAR-100 (alpha=0.1, n=8)
FedAvg64.75 ± 1.2162.73 ± 0.4235.36 ± 0.9233.33 ± 0.42
FedPer70.84 ± 1.4479.36 ± 0.5443.46 ± 1.2762.10 ± 0.63
FeSEM65.65 ± 1.2876.46 ± 0.6331.03 ± 0.8052.15 ± 2.45
FedGroup67.38 ± 1.3476.77 ± 1.0033.26 ± 1.0157.02 ± 0.84
FL+HC67.80 ± 0.8480.22 ± 0.6834.19 ± 1.3357.99 ± 0.66
CGPFL71.19 ± 0.9379.42 ± 0.4641.38 ± 0.6960.26 ± 0.94
IFCA73.06 ± 0.9180.54 ± 0.7438.61 ± 0.7760.18 ± 0.76
FedAC74.88 ± 0.6581.29 ± 0.6151.28 ± 0.3564.53 ± 0.34
  • FedAC 在非IID设置下在 CIFAR-10 和 CIFAR-100 上的测试准确率高于 SOTA 方法(CIFAR-10 提升 1.82%,CIFAR-100 提升 12.67%)。
  • 将嵌入子模块与决策子模块解耦,并采用不同聚合策略,提升全局与簇内知识的整合。
  • 低秩余弦相似度(LrCos)与数据分布相似性对齐良好,且通过降维降低计算。
  • CNT 模块在训练中有效地调整簇数量,提升对初始化和固定 K 设置的鲁棒性。
  • 消融研究显示全局和簇内正则化在 FedAC 的最佳性能中都是必要的。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。