[论文解读] Fair Resource Allocation in Federated Learning
该论文提出 q-Fair Federated Learning (q-FFL) 和一个 FedAvg 风格求解器 (q-FedAvg),以在联邦学习中实现更均匀的设备级准确性分布,平衡公平性与整体性能,并展示效率提升。
Federated learning involves training statistical models in massive, heterogeneous networks. Naively minimizing an aggregate loss function in such a network may disproportionately advantage or disadvantage some of the devices. In this work, we propose q-Fair Federated Learning (q-FFL), a novel optimization objective inspired by fair resource allocation in wireless networks that encourages a more fair (specifically, a more uniform) accuracy distribution across devices in federated networks. To solve q-FFL, we devise a communication-efficient method, q-FedAvg, that is suited to federated networks. We validate both the effectiveness of q-FFL and the efficiency of q-FedAvg on a suite of federated datasets with both convex and non-convex models, and show that q-FFL (along with q-FedAvg) outperforms existing baselines in terms of the resulting fairness, flexibility, and efficiency.
研究动机与目标
- 由于数据异质性和系统可变性,在联邦学习中推动设备间的公平性。
- 定义一个灵活的公平性感知目标,在平均准确性与设备间性能统一性之间进行权衡。
- 开发适用于联邦设置的可扩展优化方法,最小化通信开销并处理设备参与度的变化。
- 建立与 alpha-公平性的理论联系,并与现有的联邦学习公平性方法进行比较。
- 通过实证验证 q-FFL 在保持整体准确性的同时实现更均匀的设备性能。
提出的方法
- 提出 q-Fair 联邦学习 (q-FFL),目标为 f_q(w)=sum_k (p_k/(q+1)) F_k(w)^{q+1},用 q 参数化以控制公平性。
- 将 q-FFL 与 alpha-公平性相关联,以实现可调的公平性与准确性权衡。
- 引入 q-FedSGD,一种动态步长的联邦 SGD 方法,利用局部 Lipschitz 常数的上界来更新模型。
- 扩展为 q-FedAvg,一种通信高效的类似 FedAvg 的方法,基于 Lipschitz 上界对本地更新进行动态加权。
- 提供一个实用方案:从 q=0 估计 Lipschitz 常数,并在 q>0 时重复使用,以避免对每个 q 的超参数调优。
- 证明 q-FedAvg 相较于 q-FedSGD 和标准的 FedSGD,在通信轮数上收敛更快,同时求解 q-FFL。
实验结果
研究问题
- RQ1如何在联邦学习中定义模型性能在设备分布中的公平性?
- RQ2一个可调目标 (q-FFL) 是否能够在异质数据分布下在平均准确性与设备级性能的统一性之间进行平衡?
- RQ3可扩展的优化方法 (q-FedAvg, q-FedSGD) 是否在联邦设置中高效地求解 q-FFL 目标?
- RQ4与现有的公平性方法(AFL、均匀设备加权)相比,q-FFL 在准确性和公平性指标上有何差异?
- RQ5q-FFL 是否可以扩展到元学习等领域,以在任务之间实现公平的初始初始化?
主要发现
| Dataset | Objective | Average | Worst 10% | Best 10% | Variance |
|---|---|---|---|---|---|
| Synthetic | q=0 | 80.8 ± 0.9 | 18.8 ± 5.0 | 100.0 ± 0.0 | 724 ± 72 |
| Synthetic | q=1 | 79.0 ± 1.2 | 31.1 ± 1.8 | 100.0 ± 0.0 | 472 ± 14 |
| Vehicle | q=0 | 87.3 ± 0.5 | 43.0 ± 1.0 | 95.7 ± 1.0 | 291 ± 18 |
| Vehicle | q=5 | 87.7 ± 0.7 | 69.9 ± 0.6 | 94.0 ± 0.9 | 48 ± 5 |
| Sent140 | q=0 | 65.1 ± 4.8 | 15.9 ± 4.9 | 100.0 ± 0.0 | 697 ± 132 |
| Sent140 | q=1 | 66.5 ± 0.2 | 23.0 ± 1.4 | 100.0 ± 0.0 | 509 ± 30 |
| Shakespeare | q=0 | 51.1 ± 0.3 | 39.7 ± 2.8 | 72.9 ± 6.7 | 82 ± 41 |
| Shakespeare | q=.001 | 52.1 ± 0.3 | 42.1 ± 2.1 | 69.0 ± 4.4 | 54 ± 27 |
- q-FFL 在不同设备间的准确性方差平均降低 45%,同时保持相同的整体平均准确性。
- q-FedAvg 相较基线在解 q-FFL 目标方面的时间量级更快,显示出更高的通信效率。
- 与 AFL 和均匀采样相比,q-FFL 在不牺牲平均性能的前提下实现了更公平的测试准确性分布。
- 在具有凸和非凸模型的多个联邦数据集上,增大 q 会带来更均匀的设备性能(如方差降低),平均值相当。
- q-FFL 的灵活性:较大的 q 使公平性控制更严格,在某些数据集上的最差设备度量(worst-device metrics)可以超越极小极大公平基线。
- 该方法也扩展到元学习,产生在任务之间方差更小的公平初始初始化。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。