Skip to main content
QUICK REVIEW

[論文レビュー] Federated Unlearning: How to Efficiently Erase a Client in FL?

Anisa Halimi, Swanand Kadhe|arXiv (Cornell University)|Jul 12, 2022
Privacy-Preserving Technologies in Data被引用数 28
ひとこと要約

本論文は、ターゲットクライアントが局所的に学習を反転させるプロジェクテッド勾配降下を用いた二相の連合学習の忘却手法を提案し、その後サーバー/他のクライアントが局所的に忘却済みモデルから数回のFLラウンドを実施することで、再訓練に近い性能を、はるかに低い通信コストで達成する。

ABSTRACT

With privacy legislation empowering the users with the right to be forgotten, it has become essential to make a model amenable for forgetting some of its training data. However, existing unlearning methods in the machine learning context can not be directly applied in the context of distributed settings like federated learning due to the differences in learning protocol and the presence of multiple actors. In this paper, we tackle the problem of federated unlearning for the case of erasing a client by removing the influence of their entire local data from the trained global model. To erase a client, we propose to first perform local unlearning at the client to be erased, and then use the locally unlearned model as the initialization to run very few rounds of federated learning between the server and the remaining clients to obtain the unlearned global model. We empirically evaluate our unlearning method by employing multiple performance measures on three datasets, and demonstrate that our unlearning method achieves comparable performance as the gold standard unlearning method of federated retraining from scratch, while being significantly efficient. Unlike prior works, our unlearning method neither requires global access to the data used for training nor the history of the parameter updates to be stored by the server or any of the clients.

研究の動機と目的

  • Federated learningにおける忘れる権利の必要性を動機づけ、サーバーがクライアント更新を保持しない現実的な忘却を扱う。
  • ターゲットクライアントの全データ影響を除去しつつ他のクライアントの性能を保つ二相の忘却手法を開発する。
  • 複数のデータセットとシナリオで、再訓練からゼロからの評価に対して有効性、忠実度、効率を定量的に評価する。

提案手法

  • 忘却を、ターゲットクライアントが参照モデルの周りの ell2 ボール内で局所的な損失を最大化する制約付き最大化としてモデル化する。
  • 参照モデル w_ref を他のクライアントの事前忘却前モデルの平均として計算する。
  • ターゲットクライアントで ell2 ボール内の射影勾配降下を用いて局所忘却を実行し、w_i^u を得る。
  • 訓練後に w_i^u からFLを開始し、残りのクライアントとともに数回のFedAvgラウンドを実行して忘却済みのグローバルモデルを得る。
  • 忘却を界れるように w_i^{T-1} への距離閾値による早期停止を使用する。
  • バックドアと反転画像シナリオを用いて、三つのデータセット(MNIST、EMNIST、CIFAR-10)でオーバーヘッドと性能を評価する。

実験結果

リサーチクエスチョン

  • RQ1サーバーサイドに更新を保持させず、単一のクライアントが自分の局所データの影響をFLモデルから効率的に除去するにはどうすればよいか。
  • RQ2局所的忘却に続く短い連合微調整フェーズが、効果、忠実度、効率の点でゼロからの再訓練に近い性能を達成できるか。
  • RQ3提案手法の通信および計算の節約は、標準的なFLベンチマークにおけるゼロからの再訓練と比較してどの程度か。
  • RQ4この手法は非凸目的や実世界のエンタープライズ(クロス・サイロ)FL設定に一般化するか。

主な発見

  • PGDベースの忘却法はバックドア精度を大幅に低減し、MNIST、EMNIST、CIFAR-10の各データセットで再訓練と同等の性能を達成する。
  • ターゲットクライアントのデータに対するメンバーシップ推論リスクは再訓練と同等であり、FedAvgベースの基準よりはるかに低い。
  • 忘却済みモデルは忠実度を維持し、保持データに対する再訓練後のクリーン精度とほぼ同等を数回のFLラウンド後に達成する。
  • この手法は通信コストを最大で24倍削減し、同等の忠実度を達成するまで再訓練よりはるかに少ないラウンドを必要とする。
  • バックドアシナリオでは、忘却済み初期化後の1ラウンドのポスト訓練でほぼ再訓練と同等の性能を各データセットで達成する。
  • 反転画像シナリオでは、再訓練に対して最大で5.8倍の効率性向上を示し、効果と忠実度は同等である。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。