Skip to main content
QUICK REVIEW

[论文解读] Descent-to-Delete: Gradient-Based Methods for Machine Unlearning

Seth Neel, Aaron Roth|arXiv (Cornell University)|Jul 6, 2020
Privacy-Preserving Technologies in Data参考文献 14被引用 54
一句话总结

该论文为凸模型开发基于梯度的“去学习”方法,在任意更新序列下保留与重新训练在统计上不可区分的性质,具有强/弱去学习概念以及用于高维数据的分布式方法。

ABSTRACT

We study the data deletion problem for convex models. By leveraging techniques from convex optimization and reservoir sampling, we give the first data deletion algorithms that are able to handle an arbitrarily long sequence of adversarial updates while promising both per-deletion run-time and steady-state error that do not grow with the length of the update sequence. We also introduce several new conceptual distinctions: for example, we can ask that after a deletion, the entire state maintained by the optimization algorithm is statistically indistinguishable from the state that would have resulted had we retrained, or we can ask for the weaker condition that only the observable output is statistically indistinguishable from the observable output that would have resulted from retraining. We are able to give more efficient deletion algorithms under this weaker deletion criterion.

研究动机与目标

  • 在在线设置下,处理凸模型的数据删除问题,支持任意添加/删除更新。
  • 在去学习中定义并比较完美(状态级)与可观测输出不可区分性。
  • 开发具备固定每次更新计算预算的强/弱去学习算法。
  • 利用扰动和分布式优化实现 (ε,δ)-去学习,并在准确性-运行时权衡中获得有利结果。
  • 探索正则化策略以处理非强凸损失,同时保持删除保证。

提出的方法

  • 使用在上一轮初始化的扰动梯度下降(PGD)在每次更新前实现接近最优参数。
  • 通过发布函数添加高斯噪声,以确保输出在最优点附近的 (ε,δ)-不可区分性。
  • 提出一个强去学习框架,其中每次更新的成本最多按更新序列长度对数增长。
  • 引入一个分布式 PGD 变体,将数据分区、对每个分区独立训练、并通过水库采样平均参数,以保持分布式保证。
  • 对凸损失进行正则化以诱导强凸性,使在强凸性下仍能获得相同的去学习保证,同时在正则化强度与准确性之间进行权衡。
  • 将该方法与水库采样和子采样与聚合技术联系起来,在更新之间保持删除保证。

实验结果

研究问题

  • RQ1我们如何删除凸模型中的数据,使得到的输出在统计上与重新训练不可区分?
  • RQ2在机器去学习中,完美(状态级)与可观测输出不可区分性之间的权衡是什么?
  • RQ3梯度基方法是否能在每次更新的计算成本不随更新序列长度增长的情况下提供强(ε,δ)去学习?
  • RQ4在重复更新下,分布式分区训练方法是否能改善高维数据的准确性-运行时权衡?
  • RQ5为强凸性强制正则化如何影响删除保证和模型准确性?

主要发现

  • 在使用高斯扰动时,我们获得对强凸且光滑损失的强、完美去学习,且每次更新的计算量随更新索引对数增长。
  • 对于凸或非强凸损失,我们仍可通过保持秘密状态或通过正则化以诱导强凸性来实现强或完美去学习。
  • 一种带水库采样的分布式 PGD 方法在任意长的更新序列中保持分布保证,并在高维数据中改善准确性-运行时权衡。
  • 所提出的方法实现了 (ε,δ)-去学习,公开输出具有差分隐私性,降低成员身份推断风险。
  • 我们提供详细界限,显示更新预算、噪声水平与在各类凸性/光滑性假设下的结果准确度之间的关系。
  • 该工作将去学习保证与差分隐私及子采样与聚合方法的概念联系起来,将其置于更广泛的隐私学习文献之中。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。