Skip to main content
QUICK REVIEW

[論文レビュー] DisPFL: Towards Communication-Efficient Personalized Federated Learning via Decentralized Sparse Training

Rongji Dai, Li Shen|arXiv (Cornell University)|Jun 1, 2022
Privacy-Preserving Technologies in Data被引用数 47
ひとこと要約

DisPFLは非IIDデータと異質なクライアント制約の下で、通信と計算を削減しつつ、各ユーザーの精度を向上させる分散型の個別化フェデレーテッド学習と分散スパース訓練を実現します。

ABSTRACT

Personalized federated learning is proposed to handle the data heterogeneity problem amongst clients by learning dedicated tailored local models for each user. However, existing works are often built in a centralized way, leading to high communication pressure and high vulnerability when a failure or an attack on the central server occurs. In this work, we propose a novel personalized federated learning framework in a decentralized (peer-to-peer) communication protocol named Dis-PFL, which employs personalized sparse masks to customize sparse local models on the edge. To further save the communication and computation cost, we propose a decentralized sparse training technique, which means that each local model in Dis-PFL only maintains a fixed number of active parameters throughout the whole local training and peer-to-peer communication process. Comprehensive experiments demonstrate that Dis-PFL significantly saves the communication bottleneck for the busiest node among all clients and, at the same time, achieves higher model accuracy with less computation cost and communication rounds. Furthermore, we demonstrate that our method can easily adapt to heterogeneous local clients with varying computation complexities and achieves better personalized performances.

研究の動機と目的

  • 各クライアントの個別モデルを分散設定で学習することによりデータのヘテロogeneityに対応する。
  • 永続的なスパースマスクと分散的ゴシップ型更新により通信・計算コストを削減する。
  • 計算・メモリ・帯域幅が異なる多様なクライアント能力に対応する。
  • スパースで個別化された分散モデルの一般化に関する理論的洞察を提供する。
  • 標準ベンチマークでの一般的な非IIDパーティション下で性能を経験的に検証する。

提案手法

  • グローバルなdenseモデル w とクライアント固有のマスク m_k を用いて、f(w, m1,...,mK) = (1/K) sum_k Fk(w ∘ mk) を最適化する個別化FLを定式化する。
  • 各クライアントを capacity c_k に合わせて Erdos-Renyi Kernel から抽出した sparse mask で初期化する。
  • 近隣ノード間のアクティブなウェイトの交差部分のみを集約する改良版ゴシップ平均を用いる。
  • 計算を節約するため、固定マスクでローカルトレーニングを実行する。
  • 個別化を高めるため、コサインアニーリングプルーニングと勾配情報に基づく回復で各クライアントのマスクを更新する。
  • forwardおよびbackwardパスをアクティブ座標のみにマスキングすることで計算と通信の節約を保証する。

実験結果

リサーチクエスチョン

  • RQ1分散スパース訓練フレームワークは、非IIDFL設定において通信を削減しつつ個別化モデルを達成できるのか。
  • RQ2提案されたマスクベースの個別化は、分散的ゴシップ平均とどのように相互作用して精度と効率のバランスを取るのか。
  • RQ3Dis-PFLは計算・メモリ・通信の観点で異質なクライアント能力にどれだけ適応できるのか。
  • RQ4分散スパース個別化モデルの理論的一般化境界はどのようなものを確立できるのか。
  • RQ5標準データセット(CIFAR-10/100、Tiny-ImageNet)上の経験的結果は、様々なパーティションとトポロジー下でDis-PFLを中央集権/分散ベースラインより有利にするのか。

主な発見

TaskMethodsDir Part AccPath Part AccComm (MB)FLOPS (1e12)
CIFAR-10Local61.55 ± 0.286.48 ± 0.2-8.3
CIFAR-10FedAvg78.07 ± 0.554.53 ± 0.6446.98.3
CIFAR-10FedAvg-FT81.20 ± 0.584.96 ± 0.2446.98.3
CIFAR-10D-PSGD79.02 ± 0.458.07 ± 0.5446.98.3
CIFAR-10D-PSGD-FT83.90 ± 0.290.87 ± 0.2446.98.3
CIFAR-10Ditto74.68 ± 0.287.73 ± 0.1446.98.3
CIFAR-10FOMO64.68 ± 0.288.24 ± 0.1446.98.3
CIFAR-10SubFedAvg76.70 ± 0.288.30 ± 0.2278.84.7
CIFAR-10Dis-PFL85.70 ± 0.291.05 ± 0.2223.47.0
CIFAR-100Local29.23 ± 0.252.46 ± 0.2-8.3
CIFAR-100FedAvg41.72 ± 0.533.24 ± 0.6448.78.3
CIFAR-100FedAvg-FT49.19 ± 0.563.53 ± 0.7448.78.3
CIFAR-100D-PSGD41.87 ± 0.435.42 ± 0.2448.78.3
CIFAR-100D-PSGD-FT51.42 ± 0.467.24 ± 0.1448.78.3
CIFAR-100Ditto38.26 ± 0.254.02 ± 0.3448.78.3
CIFAR-100FOMO28.39 ± 0.152.74 ± 0.1448.78.3
CIFAR-100SubFedAvg43.91 ± 0.260.67 ± 0.1346.65.7
CIFAR-100Dis-PFL53.48 ± 0.368.64 ± 0.4224.37.0
Tiny-ImagenetLocal6.76 ± 0.217.68 ± 0.3-66.6
Tiny-ImagenetFedAvg12.30 ± 0.310.40 ± 0.3450.766.6
Tiny-ImagenetFedAvg-FT14.80 ± 0.228.30 ± 0.2450.766.6
Tiny-ImagenetD-PSGD12.13 ± 0.516.50 ± 0.4450.766.6
Tiny-ImagenetD-PSGD-FT15.50 ± 0.328.60 ± 0.3450.766.6
Tiny-ImagenetDitto15.69 ± 0.224.55 ± 0.3450.766.6
Tiny-ImagenetFOMO5.20 ± 0.49.39 ± 0.3450.766.6
Tiny-ImagenetSubFedAvg12.18 ± 0.419.73 ± 0.5290.940.2
Tiny-ImagenetDis-PFL16.95 ± 0.431.71 ± 0.4225.354.5
  • Dis-PFLはDirichletおよびパスパーティション下でCIFAR-10, CIFAR-100, Tiny-Imagenetのテスト精度で中央集権および分散ベースラインを上回る。
  • Dis-PFLは局所的な個別化精度(Path Part)を高く保ちつつ、ピア間通信(Comm)を低く抑え、FLOPsは同等以下または低い。
  • 対象精度に到達するための通信ラウンド数を削減する効果があり、特にリング、FC、時間変化する接続といった制約付きトポロジーで顕著。
  • 異なる容量を持つヘテロクライアントは、異なるスパース性マスクを割り当てることで対応でき、堅牢な性能を維持する。
  • 学習されたスパースマスクはデータ分布と整合しており、クライアント間で解釈可能な類似性を示し、個別化の恩恵を支持する。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。