Skip to main content
QUICK REVIEW

[論文レビュー] Federated Learning of a Mixture of Global and Local Models

Filip Hanzely, Peter Richtárik|arXiv (Cornell University)|Feb 10, 2020
Privacy-Preserving Technologies in Data参考文献 47被引用数 242
ひとこと要約

要約: 本論文は、グローバルモデルと完全にローカルなモデルをペナルティを通じて融合する新しい連邦学習の定式化を提案し、収束保証を備えたLoopless Local Gradient Descent(Loopless Local GD)系を開発する。これにより、局所ステップが異種データ環境での通信を削減し、個別化を実現できることを示す。

ABSTRACT

We propose a new optimization formulation for training federated learning models. The standard formulation has the form of an empirical risk minimization problem constructed to find a single global model trained from the private data stored across all participating devices. In contrast, our formulation seeks an explicit trade-off between this traditional global model and the local models, which can be learned by each device from its own private data without any communication. Further, we develop several efficient variants of SGD (with and without partial participation and with and without variance reduction) for solving the new formulation and prove communication complexity guarantees. Notably, our methods are similar but not identical to federated averaging / local SGD, thus shedding some light on the role of local steps in federated learning. In particular, we are the first to i) show that local steps can improve communication for problems with heterogeneous data, and ii) point out that personalization yields reduced communication complexity.

研究の動機と目的

  • 生データを集約せずに、異種のエッジデータからのプライバシーを保護した学習を動機づける。
  • グローバル合意に近い状態を保ちつつ、個別化されたローカルモデルを学習する混合FL目的を提案する。
  • 最適解の理論的性質と、個別化が通信に與える影響を分析する。
  • 収束保証と通信複雑性の境界を持つ、SGDベースの効率的なアルゴリズム(L2GD、L2SGD+)を開発する。

提案手法

  • 局所モデル x1,...,xn を最適化する新しいFL目的を導入し、平均からの偏差を測るペナルティ項 ψ(x) を用いて F(x)=f(x)+λψ(x) を形成する。
  • f(x) が局所損失 fi(xi) の平均であり、ψ(x) が局所モデルの分散をコード化することを示し、勾配と滑らかさ・強凸性の性質を導出する。
  • λ を局所解とグローバル解の近さに結びつける理論的結果を導出し、ψ(x(λ)) が λ に対して非増加、f(x(λ)) が非減少であることを含む。
  • Loopless Local Gradient Descent (L2GD) を提案する。これは、通信ラウンドを制御する確率的機構を備えた、局所GDステップと平均化ステップを交互に行う非均一な SGD である。
  • 線形収束とより良い通信性能を達成するため、分散削減型局所 SGD(L2SGD+)へ拡張する。部分参加および局所サブサンプリングを含む一般化について議論する。

実験結果

リサーチクエスチョン

  • RQ1異種データを持つFLにおいて、混合型のグローバル/ローカルモデル目的が個別化を改善しつつ通信を制御できるか。
  • RQ2ペナルティパラメータ λ が、グローバル解とローカル解への収束および関連する通信複雑性にどう影響するか。
  • RQ3Loopless Local GD (L2GD) およびその分散削減版の収束保証と最適な通信ラウンドは何か。
  • RQ4部分参加、局所 SGD、分散削は、ヘテロジニアス性の下でFLの性能を改善するか。
  • RQ5局所ステップは、FLにおける個別化モデルの MAML に似た構造とどのように関係するか。

主な発見

  • 新しい混合型FL定式化は、純粋なローカルモデル(λ→0)からグローバルモデル(λ→∞)へと遷移する一意の解 x(λ) を生み出す。
  • 最適な局所モデルは x_i(λ)=x̄(λ)−(1/λ)∇f_i(x_i(λ))、かつ ∑i ∇f_i(x_i(λ))=0 を満たし、MAML に類似した更新と結びつく。
  • L2GD は、調整されたサンプリング確率 p* により x(λ) への期待距離の境界を達成し、SGD と GD の間を補間する有限の期待通信ラウンド数をもたらす。
  • 系: p*=λ/(L+λ) のとき、期待通信数は (2λ/(λ+L))*(L/μ) log(1/ε) にスケールし、λ→0 で0に近づき、λ→∞ で GD のレートに一致する。
  • L2SGD+(分散削減)は線形収束と向上した通信複雑性を達成し、問題パラメータに依存する明示的な反復回数と通信の境界を持つ。
  • 異種/ローカルデータ分割を用いたロジスティック回帰の実証結果は、理論的主張を裏付け、FL における分散削減と個別化の利点を示している。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。