Skip to main content
QUICK REVIEW

[論文レビュー] Data-Free Knowledge Distillation for Heterogeneous Federated Learning

Zhuangdi Zhu, Junyuan Hong|PubMed|May 20, 2021
Privacy-Preserving Technologies in Data被引用数 66
ひとこと要約

FeDGenは、代理データを使用せずサーバー上で軽量なジェネレータを学習してアンサンブル知識を局所モデルへ蒸留する、ヘテロジニアスなフェデレーテッドラーニング向けのデータフリー知識蒸留フレームワークを導入します。

ABSTRACT

Federated Learning (FL) is a decentralized machine-learning paradigm in which a global server iteratively aggregates the model parameters of local users without accessing their data. User <i>heterogeneity</i> has imposed significant challenges to FL, which can incur drifted global models that are slow to converge. <i>Knowledge Distillation</i> has recently emerged to tackle this issue, by refining the server model using aggregated knowledge from heterogeneous users, other than directly aggregating their model parameters. This approach, however, depends on a proxy dataset, making it impractical unless such prerequisite is satisfied. Moreover, the ensemble knowledge is not fully utilized to guide local model learning, which may in turn affect the quality of the aggregated model. In this work, we propose a <i>data-free knowledge distillation</i> approach to address heterogeneous FL, where the server learns a lightweight generator to ensemble user information in a data-free manner, which is then broadcasted to users, regulating local training using the learned knowledge as an inductive bias. Empirical studies powered by theoretical implications show that, our approach facilitates FL with better generalization performance using fewer communication rounds, compared with the state-of-the-art.

研究の動機と目的

  • 蒸留用の代理データが利用できないフェデレーテッドラーニングにおけるユーザ間の異質性に対処する。
  • モデル予測から学習したジェネレーターを利用して局所訓練を補強するデータフリーKD手法を提案する。
  • グローバルモデルの改良だけでなく、局所モデルの更新を直接指向する知識蒸留を可能にする。
  • プライバシーに敏感なFLシナリオに適した軽量で通信効率の高いフレームワークを提供する。

提案手法

  • ターゲットラベル y を与えると、局所ユーザーモデルからアンサンブル一貫性のある予測を誘発する潜在表現 z を生成する条件付きジェネレータ G_w を学習する。
  • 式(4)を用いた、ユーザ予測ヘッドのアンサンブル予測とターゲットラベルを揃える損失を最小化して G_w を最適化する。
  • クライアントへ G_w をブロードキャストする; クライアントは z ~ G_w(z|y) をサンプルして局所訓練を追加の蒸留項 (式5) によって補強する。
  • 特徴抽出器をローカルに保ったまま予測層 (θ^p_k) のみ共有することで、柔軟なパラメータ共有を可能にし、プライバシーと通信負荷を低減する。

実験結果

リサーチクエスチョン

  • RQ1代理データを持たずに、データフリー知識蒸留はフェデレーテッドラーニングにおける異質性を効果的に緩和できるか?
  • RQ2アンサンブル知識を局所訓練モデルへ蒸留することで、通信ラウンドを減らしても同等かそれ以上の一般化を達成できるか?
  • RQ3クライアント間でのデータの非IID分布の異なる程度で FeDGen はどのように性能を示すか?
  • RQ4グローバルモデルを単に改良するのではなく、知識を局所モデルへ蒸留することの理論的および実証的な利点は何か?

主な発見

DatasetSettingFedAvgFedProxFedEnsembleFedDistillFedDistill +FedDFusionFeDGen
MnistT=20, α=0.0587.70 ± 2.0787.49 ± 2.0588.85 ± 0.6870.56 ± 1.2486.70 ± 2.2790.02 ± 0.9691.30 ± 0.74
MnistT=20, α=0.190.16 ± 0.5990.10 ± 0.3990.78 ± 0.3964.11 ± 1.3690.28 ± 0.8991.11 ± 0.4393.03 ± 0.32
MnistT=20, α=193.84 ± 0.2593.83 ± 0.2993.91 ± 0.2879.88 ± 0.6694.73 ± 0.1593.37 ± 0.4095.52 ± 0.07
CelebAr=5/1087.48 ± 0.3987.67 ± 0.3988.48 ± 0.2376.68 ± 1.2386.37 ± 0.4187.01 ± 1.0089.70 ± 0.32
CelebAr=5/2589.13 ± 0.2588.84 ± 0.1990.22 ± 0.3174.99 ± 1.5788.05 ± 0.4388.93 ± 0.7989.62 ± 0.34
CelebAr=10/2589.12 ± 0.2089.01 ± 0.3390.08 ± 0.2475.88 ± 1.1788.14 ± 0.3789.25 ± 0.5690.29 ± 0.47
EMnistT=20, α=0.0562.25 ± 2.8261.93 ± 2.3164.99 ± 0.3560.49 ± 1.2761.56 ± 2.1570.40 ± 0.7968.53 ± 1.17
EMnistT=20, α=0.166.21 ± 2.4365.29 ± 2.9467.53 ± 1.1950.32 ± 1.3966.06 ± 3.1870.94 ± 0.7672.15 ± 0.21
EMnistT=20, α=1074.83 ± 0.6974.24 ± 0.8174.90 ± 0.8054.77 ± 0.3375.55 ± 0.9474.36 ± 0.4078.43 ± 0.74
EMnistT=20, α=174.83 ± 0.9974.12 ± 0.8875.12 ± 1.0746.19 ± 0.7075.41 ± 1.0575.43 ± 0.3778.48 ± 1.04
EMnistT=40, α=177.02 ± 1.0975.93 ± 0.9577.68 ± 0.9846.72 ± 0.7378.12 ± 0.9077.58 ± 0.3778.92 ± 0.73
  • FeDGen は MNIST, CelebA, EMNIST の各データセットにおいて、ヘテロジニアスな FL 設定でベースライン(FedAvg, FedProx, FedEnsemble, FedDistill, FedDistill+, FedDFusion)を常に上回る。
  • FeDGen はデータ異質性のさまざまなレベル(Dirichlet α の変化)およびアクティブユーザー比に対して頑健である。
  • 学習されたジェネレータ G_w は、グローバルデータ分布と整合する集約された潜在分布を捉え、局所の帰納バイアスと一般化を改善する。
  • 拡張潜在サンプルを介して局所モデルへ知識を蒸留することは、グローバルモデルのみを改良する方法より有利であり、特に高い異質性下で利点がある。
  • 予測層のみを共有する(全モデルを共有せず)ことでも顕著な利得が得られ、プライバシーと通信効率の利点を際立たせる。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。