Skip to main content
QUICK REVIEW

[論文レビュー] Asynchronous Federated Learning with Differential Privacy for Edge Intelligence

Yanan Li, Shusen Yang|arXiv (Cornell University)|Dec 17, 2019
Privacy-Preserving Technologies in Data参考文献 53被引用数 27
ひとこと要約

本稿では、非同期フェデレーテッドラーニング(AFL)における微分プライバシー(DP)を考慮した、プライバシーとモデル効用のバランスを動的に調整する多段階可変プライベートアルゴリズムMAPAを提案する。MAPAは、ノイズスケールと学習率を動的に調整することで、最先端の手法よりも高速な収束と高い精度を達成する。理論的収束解析とシミュレーションおよび実世界のテストベッド実験による検証が行われている。

ABSTRACT

Federated learning has been showing as a promising approach in paving the last mile of artificial intelligence, due to its great potential of solving the data isolation problem in large scale machine learning. Particularly, with consideration of the heterogeneity in practical edge computing systems, asynchronous edge-cloud collaboration based federated learning can further improve the learning efficiency by significantly reducing the straggler effect. Despite no raw data sharing, the open architecture and extensive collaborations of asynchronous federated learning (AFL) still give some malicious participants great opportunities to infer other parties' training data, thus leading to serious concerns of privacy. To achieve a rigorous privacy guarantee with high utility, we investigate to secure asynchronous edge-cloud collaborative federated learning with differential privacy, focusing on the impacts of differential privacy on model convergence of AFL. Formally, we give the first analysis on the model convergence of AFL under DP and propose a multi-stage adjustable private algorithm (MAPA) to improve the trade-off between model utility and privacy by dynamically adjusting both the noise scale and the learning rate. Through extensive simulations and real-world experiments with an edge-could testbed, we demonstrate that MAPA significantly improves both the model accuracy and convergence speed with sufficient privacy guarantee.

研究の動機と目的

  • 異種のエッジ-クラウドシステムにおける微分プライバシー(DP)を適用した非同期フェデレーテッドラーニング(AFL)におけるプライバシー-ユーティリティトレードオフを解決すること。
  • 特にノイズとスタレンネスの影響を考慮した、DP下でのAFLの理論的収束を分析すること。
  • プライバシー保証を損なわずにモデル効用を向上させる実用的で適応的なアルゴリズムを設計すること。
  • CNNモデルを用いた広範なシミュレーションおよび実世界のテストベッド実験を通じて、提案手法を検証すること。

提案手法

  • 勾配の感度とスタレンネスに基づいて、ノイズスケールと学習率を動的に調整する多段階可変プライベートアルゴリズム(MAPA)を提案する。
  • 感度を低減するための勾配クリッピング機構を導入し、これにより微分プライバシーに必要なノイズを削減する。
  • 最大スタレンネス(τ_max)に応じて線形に減少する学習率を採用し、収束効率を向上させる。
  • 理論的解析により、誤差バウンド O(1/√T (σ/√b + ΔS/ε) + τ_max² log T / T) を導出。プライバシー、ノイズ、スタレンネスのトレードオフを捉えたものである。
  • 厳密なプライバシー保証を確保しつつモデル効用を維持するため、プライバシー予算(ε)とδ-近似DPを採用する。
  • 滑らかさ定数(L)とバッチサイズ(b)を用いて、勾配の分散と最適化の安定性を制御する。

実験結果

リサーチクエスチョン

  • RQ1微分プライバシーは、エッジ-クラウドシステムにおける非同期フェデレーテッドラーニングの収束にどのように影響するか?
  • RQ2ノイズスケールと学習率の動的調整は、AFLにおけるプライバシー-ユーティリティトレードオフを改善できるか?
  • RQ3DP下でのAFLの理論的誤差バウンドは何か?また、スタレンネスおよびプライバシーパラメータにどのように依存するか?
  • RQ4プライバシー制約下で、MAPAは既存のAFL手法と比較して収束速度とモデル精度において優れているか?
  • RQ5MAPAは、ε、σ、δ、および削減比といった主要ハイパーパrameterの変動に対してどれほどロバストか?

主な発見

  • MAPAは各段階で収束速度が O(1/T) に達し、特にエッジサーバー数(K)が増加する際、ASGDと比較して顕著に高速化される。
  • K = 1000 の場合、MAPAはASGDと比較して収束において約2のアモニットサバスを達成し、優れた効率性を示す。
  • 実世界のテストベッド実験では、MAPAはAUDPを上回り、MNISTにおけるCNNモデルでは非プライベートなCSGDと同等のモデル精度を達成し、強いプライバシー下でも高い効用性を示す。
  • MAPAはσ(サンプル分散)およびδ(確率損失)の変動に対してロバストであることが確認され、これらのパラメータの推定誤差に対して低感度であることが示された。
  • 過度に積極的な学習率の減少により、削減比が高くなるとモデル精度が低下する傾向にあり、このハイパーパrameterに対する感受性が確認された。
  • 大きなバッチサイズ(b)と小さな滑らかさ定数(L)は初期収束速度を向上させるが、最終的な精度に影響を与えないため、一時的な利点にとどまる。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。