[论文解读] FedAC: An Adaptive Clustered Federated Learning Framework for Heterogeneous Data
FedAC 是一个自适应簇联邦学习框架,将神经网络解耦为子模块以融合全局和簇内知识,使用低秩余弦相似度进行在线聚类,并动态调整簇的数量以处理非IID数据。
Clustered federated learning (CFL) is proposed to mitigate the performance deterioration stemming from data heterogeneity in federated learning (FL) by grouping similar clients for cluster-wise model training. However, current CFL methods struggle due to inadequate integration of global and intra-cluster knowledge and the absence of an efficient online model similarity metric, while treating the cluster count as a fixed hyperparameter limits flexibility and robustness. In this paper, we propose an adaptive CFL framework, named FedAC, which (1) efficiently integrates global knowledge into intra-cluster learning by decoupling neural networks and utilizing distinct aggregation methods for each submodule, significantly enhancing performance; (2) includes a costeffective online model similarity metric based on dimensionality reduction; (3) incorporates a cluster number fine-tuning module for improved adaptability and scalability in complex, heterogeneous environments. Extensive experiments show that FedAC achieves superior empirical performance, increasing the test accuracy by around 1.82% and 12.67% on CIFAR-10 and CIFAR-100 datasets, respectively, under different non-IID settings compared to SOTA methods.
研究动机与目标
- 通过在联邦学习中形成相似客户端的簇来解决数据异质性。
- 通过神经网络解耦实现全局知识向簇内学习的整合。
- 提供一种成本高效的在线模型相似性度量,用于动态聚类。
- 在训练过程中动态调整簇的数量,以获得更好的可扩展性和鲁棒性。
- 在非IID 的 CIFAR-10/100 数据集上展示优于SOTA方法的性能。
提出的方法
- 将神经网络解耦为嵌入子模块(phi)和决策子模块(h),并应用不同的聚合策略。
- 使用全局嵌入 Phi 和簇中心模型 Omega_k,通过 L_global 和 L_intra 项对本地更新进行正则化。
- 引入基于降维模型的低秩余弦相似度(LrCos)来衡量在线模型相似性。
- 实现类似 EM 的重新聚类机制,E 步用于客户端到簇的分配,M 步用于更新簇中心。
- 通过基于簇内/簇间距离 Dist_intra, Dist_inter 的簇数调整(CNT)模块动态调整簇数量 K。
- 优化一个二层目标,结合监督损失、簇内正则化和全局正则化,通过交替最小化实现。
实验结果
研究问题
- RQ1如何在 CFL 中有效地将全局知识整合到簇内学习?
- RQ2是否存在一个成本高效的在线相似性度量来引导动态聚类,而不产生过高开销?
- RQ3自适应簇数量是否能在异质FL设置中提升性能和鲁棒性?
- RQ4FedAC 的正则化项中,簇内信息与全局信息之间的权衡是什么?
主要发现
| 方法 | CIFAR-10 (alpha=0.1, n=3) | CIFAR-10 (alpha=0.1, n=8) | CIFAR-100 (alpha=0.1, n=3) | CIFAR-100 (alpha=0.1, n=8) |
|---|---|---|---|---|
| FedAvg | 64.75 ± 1.21 | 62.73 ± 0.42 | 35.36 ± 0.92 | 33.33 ± 0.42 |
| FedPer | 70.84 ± 1.44 | 79.36 ± 0.54 | 43.46 ± 1.27 | 62.10 ± 0.63 |
| FeSEM | 65.65 ± 1.28 | 76.46 ± 0.63 | 31.03 ± 0.80 | 52.15 ± 2.45 |
| FedGroup | 67.38 ± 1.34 | 76.77 ± 1.00 | 33.26 ± 1.01 | 57.02 ± 0.84 |
| FL+HC | 67.80 ± 0.84 | 80.22 ± 0.68 | 34.19 ± 1.33 | 57.99 ± 0.66 |
| CGPFL | 71.19 ± 0.93 | 79.42 ± 0.46 | 41.38 ± 0.69 | 60.26 ± 0.94 |
| IFCA | 73.06 ± 0.91 | 80.54 ± 0.74 | 38.61 ± 0.77 | 60.18 ± 0.76 |
| FedAC | 74.88 ± 0.65 | 81.29 ± 0.61 | 51.28 ± 0.35 | 64.53 ± 0.34 |
- FedAC 在非IID设置下在 CIFAR-10 和 CIFAR-100 上的测试准确率高于 SOTA 方法(CIFAR-10 提升 1.82%,CIFAR-100 提升 12.67%)。
- 将嵌入子模块与决策子模块解耦,并采用不同聚合策略,提升全局与簇内知识的整合。
- 低秩余弦相似度(LrCos)与数据分布相似性对齐良好,且通过降维降低计算。
- CNT 模块在训练中有效地调整簇数量,提升对初始化和固定 K 设置的鲁棒性。
- 消融研究显示全局和簇内正则化在 FedAC 的最佳性能中都是必要的。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。