Skip to main content
QUICK REVIEW

[論文レビュー] Model Sparsity Can Simplify Machine Unlearning

Jinghan Jia, Jiancheng Liu|arXiv (Cornell University)|Apr 11, 2023
Domain Adaptation and Few-Shot Learning被引用数 10
ひとこと要約

この論文は剪定によるモデルのスパース性が近似的なMUと厳密なアンラーニングのギャップを縮小し、 prune-then-unlearn パラダイムと sparsity-aware unlearning を導入して効率と効果を向上させることを示している。

ABSTRACT

In response to recent data regulation requirements, machine unlearning (MU) has emerged as a critical process to remove the influence of specific examples from a given model. Although exact unlearning can be achieved through complete model retraining using the remaining dataset, the associated computational costs have driven the development of efficient, approximate unlearning techniques. Moving beyond data-centric MU approaches, our study introduces a novel model-based perspective: model sparsification via weight pruning, which is capable of reducing the gap between exact unlearning and approximate unlearning. We show in both theory and practice that model sparsity can boost the multi-criteria unlearning performance of an approximate unlearner, closing the approximation gap, while continuing to be efficient. This leads to a new MU paradigm, termed prune first, then unlearn, which infuses a sparse model prior into the unlearning process. Building on this insight, we also develop a sparsity-aware unlearning method that utilizes sparsity regularization to enhance the training process of approximate unlearning. Extensive experiments show that our proposals consistently benefit MU in various unlearning scenarios. A notable highlight is the 77% unlearning efficacy gain of fine-tuning (one of the simplest unlearning methods) when using sparsity-aware unlearning. Furthermore, we demonstrate the practical impact of our proposed MU methods in addressing other machine learning challenges, such as defending against backdoor attacks and enhancing transfer learning. Codes are available at https://github.com/OPTML-Group/Unlearn-Sparse.

研究の動機と目的

  • データ規制とプライバシーのニーズへの重要な対応として機械的なアンラーニング(MU)を動機付ける。
  • MU の性能を改善するために、スパース性/剪定を導入してモデルベースの視点を開発する。
  • 効率と有効性を高めるために prune-then-unlearn パラダイムとスパース性対応のアンラーニングを提案・評価する。
  • メトリクス(UA、MIA-Efficacy、RA、TA、RTE)と多様なデータセット/モデルを横断するフルスタック評価を提供する。
  • 一般化を保ちつつ MU の利益を最大化する実践的な剪定方法の推奨を提供する。

提案手法

  • 剪定によって誘導されるスパース性と MU 効率の理論的な関連性を示す(Prop. 2)。
  • プリン先行アプローチを提案し、剪定がアンラーニングに先行する(OMP、SynFlow を検討)。
  • 拡張された影響度アンラーニングの定式化を導出(Prop. 1)と逆ヘッセ行列勾配積のために WoodFisher を使用。
  • L1 ペナルティ(式3)を用いたスパース性対応のアンラーニング目的関数を開発し、3つのスパーススケジューラ(定数、線形増加、線形減衰)。
  • CIFAR-10/ResNet-18(付録の追加設定含む)でクラス別忘却とランダム忘却を複数のアンラーニング手法(FT、GA、FF、IU)で評価。
  • スパースモデルと密モデルを UA、MIA-Efficacy、RA、TA、RTE の観点で比較。
Figure 1: Schematic overview of our proposal on model sparsity-driven MU . Evaluation at-a-glance shows the performance of three unlearning methods (retraining-based exact unlearning, finetuning-based approximate unlearning [ 12 ] , and proposed unlearning on 95%-sparse model) under five metrics: un
Figure 1: Schematic overview of our proposal on model sparsity-driven MU . Evaluation at-a-glance shows the performance of three unlearning methods (retraining-based exact unlearning, finetuning-based approximate unlearning [ 12 ] , and proposed unlearning on 95%-sparse model) under five metrics: un

実験結果

リサーチクエスチョン

  • RQ1モデルのスパース性は近似 MU と厳密なアンラーニングのギャップを複数の基準で埋められるか?
  • RQ2prune-first はさまざまな忘却シナリオとモデルで一貫して MU の性能を改善するか?
  • RQ3一般化や効率を損なうことなく MU を支える最良の剪定手法はどれか?
  • RQ4L1 正規化を伴うスパース性対応のアンラーニングは標準的なアプローチと比べて MU の性能にどう影響する?
  • RQ5MU の利益を最大化するためのスパースレベルと剪定戦略の実用的なガイドラインは?

主な発見

  • モデルのスパース性は近似的なアンラーニングと再学習ベースの厳密なアンラーニングのギャップを縮小し、スパース性が高くなるほどより大きな利得をもたらす。
  • FT、GA、FF、IU 全てにおいて、スパース性は一貫してアンラーニングの有効性(UA)と MIA-Efficacy を改善し、忠実性(RA)はしばしば維持される。
  • 95% のスパース性では、CIFAR-10/ResNet-18 のクラス別忘却で FT は UA が約51%、MIA-Efficacy が約8% 向上する。全体的な再学習との格差は減少する。
  • GA はスパース性下で RA が弱い傾向にあり、FT と IU は TA をより良く維持する。剪定法 SynFlow と OMP は MU に対して IMP よりも優れている。
  • 線形に減衰する gamma スケジューラを用いたスパース性対応のアンラーニングは、定数または増加スキームと比べて UA と MIA-Efficacy を改善し、TA を維持する。
  • スパース性対応のアンラーニングを用いた場合、ファインチューニング(FT)の MU 有効性が 77% 向上するとの報告があり、実用的な利得が substantial である。
Figure 5: Performance of sparsity-aware unlearning vs. FT and Retrain on class-wise forgetting and random data forgetting under (CIFAR-10, ResNet-18). Each metric is normalized to $[0,1]$ based on the best result across unlearning methods for ease of visualization, while the actual best value is pro
Figure 5: Performance of sparsity-aware unlearning vs. FT and Retrain on class-wise forgetting and random data forgetting under (CIFAR-10, ResNet-18). Each metric is normalized to $[0,1]$ based on the best result across unlearning methods for ease of visualization, while the actual best value is pro

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。