Skip to main content
QUICK REVIEW

[論文レビュー] Towards Unbounded Machine Unlearning

Meghdad Kurmanji, Peter Triantafillou|arXiv (Cornell University)|Feb 20, 2023
COVID-19 diagnosis using AI被引用数 16
ひとこと要約

tldr: SCRUB は、教師-生徒フレームワークを用いて訓練データのサブセットを忘却しつつ、バイアス、混乱、プライバシーの適用領域全体で有用性を保つスケーラブルなアンラーニング手法として提案される。SCRUB には、プライバシーのために忘却品質を調整するリワインド版も含まれており、プライバシー防御を評価するための LiRA ベースの MIA を適応させた。

ABSTRACT

Deep machine unlearning is the problem of `removing' from a trained neural network a subset of its training set. This problem is very timely and has many applications, including the key tasks of removing biases (RB), resolving confusion (RC) (caused by mislabelled data in trained models), as well as allowing users to exercise their `right to be forgotten' to protect User Privacy (UP). This paper is the first, to our knowledge, to study unlearning for different applications (RB, RC, UP), with the view that each has its own desiderata, definitions for `forgetting' and associated metrics for forget quality. For UP, we propose a novel adaptation of a strong Membership Inference Attack for unlearning. We also propose SCRUB, a novel unlearning algorithm, which is the only method that is consistently a top performer for forget quality across the different application-dependent metrics for RB, RC, and UP. At the same time, SCRUB is also consistently a top performer on metrics that measure model utility (i.e. accuracy on retained data and generalization), and is more efficient than previous work. The above are substantiated through a comprehensive empirical evaluation against previous state-of-the-art.

研究の動機と目的

  • アンラーニングをアプリケーション依存として動機づけ、定式化する。バイアスの除去(RB)、誤ラベリングに起因する混乱の解消(RC)、およびユーザープライバシー(UP)に対するそれぞれ異なる忘却の願望を設定する。
  • 選択的に教師に背いて標的データを忘却しつつ、保持データからの知識を保持する、スケーラブルな教師-生徒アンラーニングフレームワーク(SCRUB)を導入する。
  • 会員推論攻撃に対するプライバシーのための忘却品質を較正するためのリワインディング拡張(SCRUB+R)を提供する。
  • データセット(CIFAR-10, Lacuna-10)およびアーキテクチャ(ResNet, All-CNN)にわたり、RB、RC、および UP タスクで、SCRUB を最先端のベースラインと経験的に評価する。

提案手法

  • アンラーニングを教師-生徒問題として定式化し、学生は教師の重みから始まり、 retain セットの近傍を保ちつつ忘却セットを忘却するように訓練される。
  • retain データ上での教師と学生の出力の KL ダイバージェンスを最小化し、forget データ上で最大化する対比目的と、retain データ上の supervised 損失を組み合わせる:minimize alpha * (d on retain) + gamma * (supervised loss on retain) - (d on forget)。
  • トレーニングを安定させるために、忘却セット更新で最大化ステップ、保持セット更新で最小化ステップを交互に適用する最適化を行い、保持性能を回復する追加の最小化ステップで終了する。
  • プライバシー防御を改善するために、forget-set の誤差が参照忘却点と一致する checkpoint を選択する SCRUB+R のリワインド拡張を追加する。
  • UP パフォーマンスを評価するために LiRA 風のメンバーシップ推論攻撃を適応させ、実用的なプライバシー指標を提供する。
  • SCRUB のオープンソース実装を提供する。

実験結果

リサーチクエスチョン

  • RQ1忘却を異なるアプリケーション(RB、RC、UP)に対してどのように定義し、測定すべきか?
  • RQ2単一のアンラーニングフレームワークが、モデルの有用性を保ちながら多様なアプリケーションで頑健に機能できるか?
  • RQ3教師-生徒形式(SCRUB)は、忘却品質と効率の点で従来のアンラーニング手法を凌駕するか?
  • RQ4忘却品質をどう調整してプライバシー防御と有用性のバランスを取るか(SCRUB+R)?
  • RQ5アンラーニングがメンバーシップ推論攻撃に与える影響はどうか、適応MIAを用いてどのように定量化できるか?

主な発見

  • SCRUB は、RB、RC、UP の指標すべてで忘却性能のトップを一貫して達成し、保持データの精度と一般化を維持する。
  • SCRUB は、CIFAR-5/Lacuna-5 の小規模設定からより大規模な設定において、忘却品質と有用性の面でベースライン(Finetune、NegGrad+、CF-k、EU-k、NTK/Fisher など)を上回る。
  • SCRUB+R(リワインド)は、忘却セットの誤差がプライバシーに関連する参照点と一致する checkpoint を選択することで、メンバーシップ推論攻撃に対する防御を改善できる。
  • RC 実験(CIFAR-5/Lacuna-5 で)において、SCRUB は、保持/テスト性能への最小影響でクラス混乱を解消する最も強力な performer。
  • UP 実験では、SCRUB+R は MIAs に対して効果的に防御し、忘却誤差が再訓練時と近い場合がある;プライバシー防御を評価するために LiRA ベースの MIA 適応を使用。
  • 全体として、SCRUB の境界のない設計は、従来手法と比較して、アプリケーション横断でのスケーラビリティと性能の安定性が高い。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。