QUICK REVIEW

[论文解读] Continual Learning in Generative Adversarial Nets

Ari Seff, Alex Beatson|arXiv (Cornell University)|May 23, 2017

Generative Adversarial Networks and Image Synthesis参考文献 12被引用 98

一句话总结

本文通过对生成器 G 应用弹性权重巩固（elastic weight consolidation），提出一种用于 GAN 的持续学习框架，从而实现对新数据分布的序列学习而不忘记已学过的分布。它在 MNIST 和 SVHN 的类别条件 GAN 上进行了演示。

ABSTRACT

Developments in deep generative models have allowed for tractable learning of high-dimensional data distributions. While the employed learning procedures typically assume that training data is drawn i.i.d. from the distribution of interest, it may be desirable to model distinct distributions which are observed sequentially, such as when different classes are encountered over time. Although conditional variations of deep generative models permit multiple distributions to be modeled by a single network in a disentangled fashion, they are susceptible to catastrophic forgetting when the distributions are encountered sequentially. In this paper, we adapt recent work in reducing catastrophic forgetting to the task of training generative adversarial networks on a sequence of distinct distributions, enabling continual generative modeling.

研究动机与目标

在序列分布转变下为深度生成模型的持续学习提供动机。
将遗忘预防技术适配到 GANs，以避免从头重新训练。
证明单一生成器能够随时间遇到的多种分布建模，而无需存储所有历史数据。
在 MNIST 上使用 MLP GAN、在 SVHN 上使用 DCGAN 进行评估以展示其实用性。

提出的方法

使用一个增强的生成器目标函数，对通过 Fisher 信息识别为对先前任务关键的参数的变化进行惩罚。
基于判别器输出计算经验 Fisher 信息以识别 G 的显著参数。
在对新任务进行训练时，对 G 的参数应用类似 EWC 的二次惩罚，以保留先前任务的性能。
在条件 GAN 设置中工作，在可能的情况下将每个分布与一个不同的条件输入 y 关联。
将该方法视为可扩展到一系列任务的方案，在没有先前数据或重新生成的历史数据的情况下。

实验结果

研究问题

RQ1在没有访问先前数据且不发生灾难性遗忘的情况下，GAN 是否能够对新分布进行顺序训练？
RQ2对生成器应用 EWC 风格的惩罚是否在学习新分布的同时保留早先学习的分布？
RQ3该方法在不同数据集上的条件 GAN（MNIST 与 SVHN）中是否有效？

主要发现

结合 Fisher 基惩罚的增强目标在遗忘方面优于标准 GAN 训练。
在 MNIST 的 MLP GAN 中，该方法在按顺序学习新数字时防止遗忘。
在 SVHN 的 DCGAN 中，该方法在新增数字的同时保留先前学到的数字。
该方法对惩罚参数 lambda 的取值范围表现出鲁棒性，维持了视觉保真度和多样性。
结果表明，使用条件框架有助于在任务随时间变化时维持从 (z,y) 到数据的稳定映射。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。