[论文解读] Active Federated Learning
主动联邦学习(AFL)基于从当前模型和客户端数据计算的价值函数来选择客户端 cohorts,训练迭代次数在保持精度的同时减少了 20-70%。
Federated Learning allows for population level models to be trained without centralizing client data by transmitting the global model to clients, calculating gradients locally, then averaging the gradients. Downloading models and uploading gradients uses the client's bandwidth, so minimizing these transmission costs is important. The data on each client is highly variable, so the benefit of training on different clients may differ dramatically. To exploit this we propose Active Federated Learning, where in each round clients are selected not uniformly at random, but with a probability conditioned on the current model and the data on the client to maximize efficiency. We propose a cheap, simple and intuitive sampling scheme which reduces the number of required training iterations by 20-70% while maintaining the same model accuracy, and which mimics well known resampling techniques under certain conditions.
研究动机与目标
- 通过更智能的客户端选择来激励降低联邦学习中的通信和计算成本。
- 介绍将对客户端评估的价值函数用于引导采样的 AFL 框架。
- 显示 AFL 能在显著减少训练轮次(少20-70%轮次)的情况下达到相同的准确性。
- 讨论实际考量,包括隐私(差分隐私)和潜在扩展。
提出的方法
- 定义一个在设备上使用当前模型 w^(t) 来评估客户端数据的价值函数 V。
- 服务器从所选客户端收集估值 {v_k},并将它们转换为用于下一轮的采样分布。
- 一个自然的选择是基于损失的估值 v_k = (1 / sqrt(n_k)) l(x_k, y_k; w^(t))。
- 通过带有调参 α1、α2、α3 的 softmax-like 机制将估值转换为概率。
- 引入差分隐私视角并讨论隐私保护查询(如稀疏向量)以防止信息泄露。
- 在 Reddit 和 Sticker Intent 数据集上将 AFL 与均匀随机客户端选择进行实验比较,显示在类似精度下少 20-70% 的训练轮次。
实验结果
研究问题
- RQ1主动的、模型感知的客户端选择是否可以在不牺牲准确性的情况下减少联邦学习中的训练轮次?
- RQ2应如何在设备端计算估值以最好地反映客户端对模型改进的效用?
- RQ3差分隐私对基于估值的客户端选择及整体性能有何影响?
- RQ4AFL 与标准随机采样和服务器端再采样在实际数据集上的比较?
- RQ5有哪些调参参数控制 AFL 的采样,它们如何影响效率和准确性?
主要发现
- 与均匀客户端选择相比,AFL 以少 20-70% 的训练轮次实现相似的模型精度。
- 使用基于损失的估值与具有更高效用的客户端相关联并加速收敛。
- 在 Reddit 数据上观察到,AFL 的以客户端为中心的采样显著优于服务器端数据点重采样。
- AFL 框架在设备端估值计算和隐私考量方面展示了实际可行性。
- AFL 的收益取决于调参参数 α1、α2、α3 以及所使用的估值函数。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。