Skip to main content
QUICK REVIEW

[論文レビュー] Federated Learning with Unbiased Gradient Aggregation and Controllable Meta Updating

Xin Yao, Tianchi Huang|arXiv (Cornell University)|Oct 18, 2019
Privacy-Preserving Technologies in Data参考文献 33被引用数 50
ひとこと要約

本論文は Unbiased Gradient Aggregation (UGA) と controllable Meta Updating (FedMeta) を導入し FedAvg を改善し、勾配バイアスを低減し、最適化をターゲット分布に合わせる。IID および non-IID の FL 設定で収束が速く、精度が高いことを示す。

ABSTRACT

Federated learning (FL) aims to train machine learning models in the decentralized system consisting of an enormous amount of smart edge devices. Federated averaging (FedAvg), the fundamental algorithm in FL settings, proposes on-device training and model aggregation to avoid the potential heavy communication costs and privacy concerns brought by transmitting raw data. However, through theoretical analysis we argue that 1) the multiple steps of local updating will result in gradient biases and 2) there is an inconsistency between the expected target distribution and the optimization objectives following the training paradigm in FedAvg. To tackle these problems, we first propose an unbiased gradient aggregation algorithm with the keep-trace gradient descent and the gradient evaluation strategy. Then we introduce an additional controllable meta updating procedure with a small set of data samples, indicating the expected target distribution, to provide a clear and consistent optimization objective. Both the two improvements are model- and task-agnostic and can be applied individually or together. Experimental results demonstrate that the proposed methods are faster in convergence and achieve higher accuracy with different network architectures in various FL settings.

研究の動機と目的

  • 複数のローカル更新とクライアントサンプリングを伴う FedAvg における勾配バイアスと目的関数の不整合を特定・分析する。
  • 高い計算オーバーヘッドを伴わず、Unbiased Gradient Aggregation (UGA) を達成する。
  • メタトレーニングセットを介して最適化を定義されたターゲット分布に合わせる Controllable Meta Updating (FedMeta) を導入する。
  • UGA および FedMeta(単独または組み合わせで)が CNN、GRU、IID および non-IID FL 設定全体で収束を加速し、精度を向上させることを示す。

提案手法

  • 局所ステップ全体でパラメータ更新履歴を保存する keep-trace gradient descent を開発する。
  • 初期サーバーモデル上で勾配を評価するステップを介して unbiased local gradients (g_t^k) を得る。
  • サンプルされたクライアントの加重平均を用いてサーバー上で unbiased gradients を集約する (g_t)。
  • 小規模な meta データセット D_meta を用いて集約後にグローバルモデルを更新する meta 学習段階としての FedMeta を導入し、安定した目的関数を強制する。
  • FedAvg および UGAs との互換性を示し、単独または組み合わせ(FedMeta w/ UGA)を可能にする。
  • CNN、GRU、IID および non-IID FL ベンチマーク(CIFAR-10、FEMNIST、Shakespeare)を横断する実験を提供する。

実験結果

リサーチクエスチョン

  • RQ1FedAvg における複数の局所更新は勾配をどのように biased し、ターゲット分布との整合性を崩すか?
  • RQ2unbiased gradient aggregation (UGA) は高い計算コストなしに正しい降下方向を達成できるか?
  • RQ3 controllable meta updating procedure (FedMeta) は一貫した目的関数を強制し性能を改善できるか?
  • RQ4UGA と FedMeta は IID および non-IID の連合学習設定、および異なるモデルアーキテクチャ全体で収束速度と精度を改善するか?

主な発見

MethodsE=2,B=64E=2,B=128E=5,B=128
FedAvg78.5779.2780.45
FedProx79.7780.3181.44
FedShare81.1981.7581.66
FedMeta w/ UGA81.7482.5883.43
  • UGA は FedAvg と互換性のある unbiased gradient aggregation を提供し、局所更新ステップが増えるほど収束と精度を改善する。
  • FedMeta は連合最適化を predefined meta data distribution に向けて導く controllable meta-training 目的を提供する。
  • FedMeta w/ UGA は IID および non-IID 設定で一貫して FedAvg、FedShare、FedProx よりも上回り、通信ラウンドの大幅な削減を実現する。
  • アブレーション研究では、UGA は初期の利得を速く、FedMeta はラウンドを通じてより安定した性能を提供し、FedMeta w/ UGA の組み合わせが多くの設定で最良の結果を示す。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。