[论文解读] Selective Amnesia: A Continual Learning Approach to Forgetting in Deep Generative Models
本论文提出 Selective Amnesia,一种利用持续学习来可控地忘记预训练深度生成模型中的概念的方法,包括 VAE 和扩散模型,覆盖多种概念与提示。
The recent proliferation of large-scale text-to-image models has led to growing concerns that such models may be misused to generate harmful, misleading, and inappropriate content. Motivated by this issue, we derive a technique inspired by continual learning to selectively forget concepts in pretrained deep generative models. Our method, dubbed Selective Amnesia, enables controllable forgetting where a user can specify how a concept should be forgotten. Selective Amnesia can be applied to conditional variational likelihood models, which encompass a variety of popular deep generative frameworks, including variational autoencoders and large-scale text-to-image diffusion models. Experiments across different models demonstrate that our approach induces forgetting on a variety of concepts, from entire classes in standard datasets to celebrity and nudity prompts in text-to-image models. Our code is publicly available at https://github.com/clear-nus/selective-amnesia.
研究动机与目标
- 通过实现对有害或不想要的概念的可控遗忘,推动对大型文本到图像模型滥用的防护措施。
- 开发一种能够忘记预训练条件变分似然模型中特定概念的技术。
- 确保在包括 VAE 和文本到图像扩散模型在内的多样化生成框架中具有适用性。
提出的方法
- 提出 Selective Amnesia,一种受持续学习启发的方法,用于在预训练生成模型中有选择性地忘记概念。
- 将该方法应用于条件变分似然模型,使在概念层面上实现遗忘。
- 展示在从标准数据集中的整类到文本到图像模型中诸如名人或裸体等具体提示的多种概念上的遗忘。
- 表明遗忘可被控并有针对性地实现,而不导致模型整体性能下降。
实验结果
研究问题
- RQ1是否有一种受持续学习启发的机制能够在预训练生成模型中实现对特定概念的可控遗忘?
- RQ2Selective Amnesia 是否与多样的条件生成框架(例如 VAE 和扩散模型)兼容,并在不同概念严重性下有效?
- RQ3在针对整类与文本到图像生成中的单个提示时,遗忘的范围和质量如何?
主要发现
- Selective Amnesia 在包括 VAE 和大规模扩散模型在内的多种模型家族中引发对各种概念的遗忘。
- 在标准数据集的整类以及文本到图像设置中的名人和裸体提示上,展示了遗忘。
- 该方法实现了可控的遗忘,影响目标概念,同时力求保留模型的整体功能。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。