Skip to main content
QUICK REVIEW

[論文レビュー] DENSE: Data-Free One-Shot Federated Learning

Jie Zhang, Chen Chen|arXiv (Cornell University)|Dec 23, 2021
Privacy-Preserving Technologies in Data被引用数 33
ひとこと要約

DENSE はデータフリーのワンショットフェデレーテッドラーニングを、異種クライアントモデルのアンサンブルから合成データを生成し、グローバルモデルへ蒸留する二段階プロセスで実現します。

ABSTRACT

One-shot Federated Learning (FL) has recently emerged as a promising approach, which allows the central server to learn a model in a single communication round. Despite the low communication cost, existing one-shot FL methods are mostly impractical or face inherent limitations, \eg a public dataset is required, clients' models are homogeneous, and additional data/model information need to be uploaded. To overcome these issues, we propose a novel two-stage extbf{D}ata-fre extbf{E} o extbf{N}e- extbf{S}hot federated l extbf{E}arning (DENSE) framework, which trains the global model by a data generation stage and a model distillation stage. DENSE is a practical one-shot FL method that can be applied in reality due to the following advantages: (1) DENSE requires no additional information compared with other methods (except the model parameters) to be transferred between clients and the server; (2) DENSE does not require any auxiliary dataset for training; (3) DENSE considers model heterogeneity in FL, \ie different clients can have different model architectures. Experiments on a variety of real-world datasets demonstrate the superiority of our method.For example, DENSE outperforms the best baseline method Fed-ADI by 5.08\% on CIFAR10 dataset.

研究の動機と目的

  • 補助データや敏感情報の共有なしに、実用的なワンショットフェデレーテッド学習を推進する。
  • パラメータ平均化を回避してクライアント間のモデル異種性を実現する。
  • アンサンブルモデルからの合成データ生成とグローバルモデルへの知識蒸留という二段階フレームワークを開発する。
  • 実データを露出させず、プライバシー保護されたデータ生成を保証する。
  • 非IIDの実世界データセットと異種クライアントアーキテクチャでの有効性を実証する。

提案手法

  • Stage 1: 実データを公開せず、クライアントの訓練分布に似た合成データを生成するためにアンサンブルモデルを用いて補助ジェネレーターを訓練する。
  • ジェネレーターを最適化するために、類似度(平均ロジット)、安定性(BN統計)、転移性(境界意識損失)を用いる。
  • KL発散を用いた境界サポート損失を導入し、アンサンブルとグローバルモデルの意思決定境界の間に位置する合成データを促進する。
  • Stage 2: アンサンブル教師モデルからグローバルなスチューデントモデルへ、合成データを用いて知識を蒸留し、アンサンブルのロジットとグローバルモデルの予測とのKL発散を最小化する。
  • パラメータ平均化ではなく平均化ロジットを通じて知識を集約することで、モデル異種性をサポートし、異種クライアントアーキテクチャを可能にする。
  • 不均衡データに対して性能をさらに改善するために、LDAM などの不均衡学習手法と組み合わせて DENSE を適用することも可能。

実験結果

リサーチクエスチョン

  • RQ1データフリーのワンショットフェデレーテッド学習フレームワークは補助データや生データ共有なしで強力なグローバルモデルを訓練できるか?
  • RQ2クライアント間のモデル異種性はパラメータ平均化ではなくアンサンブル蒸留を介してサポートできるか?
  • RQ3合成データ生成と知識蒸留の二段階プロセスは、非 IID 設定で FedAvg やデータフリーベースラインを上回るか?
  • RQ4BNベースの安定性と境界意識損失は合成データと最終的なグローバルモデルの質にどのように影響するか?
  • RQ5クライアント数の変動と不均衡学習技術の適用は DENSE の性能にどのような影響を与えるか?

主な発見

  • DENSE は複数の実データセットと非 IID 設定において、強力なベースライン(例:Fed-ADI)より高い精度を達成する。
  • DENSE は、特に非 IID および異種モデルシナリオで FedAvg を一貫して上回る。
  • 二段階アプローチにより、モデルパラメータの平均化なしに異種クライアントモデルから単一のグローバルモデルへ効果的な知識移転が可能になる。
  • 不均衡データに LDAM を組み込むと、特に高度に歪んだ CIFAR10 および SVHN 設定で性能がさらに向上する。
  • DENSE を複数回の通信ラウンドに拡張すると精度がさらに向上する。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。