[論文レビュー] Better Generative Replay for Continual Federated Learning
この論文はクラスインクリメンタルフェデレートラーニング(CI-FL)を定義し、FedCILを提案する。FedCILはFedCILモデル統合とクライアント側の整合性強制を生成再生と組み合わせ、非IIDの不安定性と忘却を複数タスク・クライアントに跨って緩和するフレームワークである。
Federated learning is a technique that enables a centralized server to learn from distributed clients via communications without accessing the client local data. However, existing federated learning works mainly focus on a single task scenario with static data. In this paper, we introduce the problem of continual federated learning, where clients incrementally learn new tasks and history data cannot be stored due to certain reasons, such as limited storage and data retention policy. Generative replay based methods are effective for continual learning without storing history data, but adapting them for this setting is challenging. By analyzing the behaviors of clients during training, we find that the unstable training process caused by distributed training on non-IID data leads to a notable performance degradation. To address this problem, we propose our FedCIL model with two simple but effective solutions: model consolidation and consistency enforcement. Our experimental results on multiple benchmark datasets demonstrate that our method significantly outperforms baselines.
研究の動機と目的
- CI-FLの実用的な問題設定を紹介:複数クライアントがメモリーバッファなしで新しいクラスを順次学習する。
- 非IIDデータ上でのACGAN生成再生とフェデレーテッドラーニングの単純な統合が不安定であることを示す。
- トレーニングを安定化し忘却耐性を改善するために、サーバー側のモデル統合とクライアント側の整合性強制を用いたFedCILを提案する。
- 複数データセットにわたる標準ベンチマークでFedCILがベースラインより優れていることを実証する。
提案手法
- サーバーとクライアントのベース生成器/分類器としてAuxiliary Classifier GAN (ACGAN)を使用する。
- 非 IIDによる不安定性を特定し、二つの対策を提案する:バランスリプレイのための合成データ生成を伴うサーバーサイドのモデル統合、および異なる生成器からの分布を整合させるクライアントサイドの整合性損失。
- サーバーサイドの統合は統合されたクライアントパラメータからグローバルモデルを初期化し、クライアント生成器からの合成サンプルでそれを豊かにする。
- クライアントサイドの整合性強制は、実データと合成データを横断する出力ロジットをKLダイバージェンスベースの損失で揃え、局所トレーニングを安定化させる。
- 三つの整合性損失(L_c1, L_c2, L_c3)を組み込み、局所のACGAN損失と組み合わせて最終的なクライアント目的を形成する。
- データの代わりにモデルパラメータのみを交換してプライバシーを保護する。
実験結果
リサーチクエスチョン
- RQ1メモリーバッファなしで生成再生ベースのアプローチをCI-FLに効果的に統合できるか、非IIDデータを扱いながら。
- RQ2サーバーサイドのモデル統合とクライアントサイドの整合性強制はCI-FLにおいてトレーニングを安定化し忘却耐性を改善するか。
- RQ3FedCILは複数データセットにわたる従来のFLおよび他のCI-FLベースラインとどう比較されるか。
主な発見
| モデル | MNIST | EMNIST-L | EMNIST-B | CIFAR-10 |
|---|---|---|---|---|
| FedAvg (McMahan et al., 2017) | 72.28\pm 0.82 | 19.36\pm 0.95 | 17.25\pm 0.25 | 27.21\pm 2.39 |
| FedProx (Li et al., 2020) | 72.84\pm 0.73 | 19.69\pm 0.75 | 17.74\pm 0.55 | 27.43\pm 2.46 |
| FedLwF-2T (Usmanova et al., 2021) | 75.61\pm 0.93 | 23.91\pm 0.78 | 17.22\pm 0.90 | 27.02\pm 2.38 |
| FedAvg+DGR | 97.46\pm 0.51 | 71.92\pm 0.74 | 63.55\pm 0.46 | 37.93\pm 2.27 |
| FedProx+DGR | 97.55\pm 0.48 | 71.83\pm 0.65 | 63.55\pm 0.27 | 37.87\pm 2.47 |
| FedAvg+ACGAN Replay | 97.13\pm 0.35 | 73.85\pm 0.17 | 66.87\pm 0.79 | 38.31\pm 2.64 |
| FedProx+ACGAN Replay | 97.38\pm 0.63 | 73.91\pm 0.29 | 66.19\pm 0.92 | 38.34\pm 2.55 |
| FedCIL (Ours) | 99.13\pm 0.34 | 78.15\pm 0.30 | 73.12\pm 0.47 | 45.27\pm 2.42 |
- FedCILは全タスク後のグローバル精度でMNIST, EMNIST-Letters, EMNIST-Balanced, CIFAR-10においてベースラインを大幅に上回る。
- FedCILはFedAvg/FedProxでDGRまたはACGAN Replayを使用したバリアントよりも高いグローバル精度を達成する。
- アブレーション結果は、モデル統合、整合性強制、生成再生の各要素が性能向上に寄与することを示す。
- FedCILの生成器は他の比較法より高品質なデータ(FIDが低い)を生み、分類器のバイアスが小さい。
- 可視化と混同行列は、FedCILがタスク間でよりバランスの取れたクラス性能を生み出すことを示す。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。