[论文解读] Generative Adversarial Network Training is a Continual Learning Problem
本文将 GAN 训练重新构架为持续学习问题,其中由于生成器分布的演化,判别器会因灾难性遗忘而忘记先前生成的样本。通过在判别器中应用弹性权重巩固(EWC)和智能突触(IS),该方法保留了对过去伪造样本的识别能力,从而在计算开销极小的情况下,将 FID(最高达 10.92)、ICP(最高达 7.58)和 BLEU 分数(最高达 0.934)均得到提升。
Generative Adversarial Networks (GANs) have proven to be a powerful framework for learning to draw samples from complex distributions. However, GANs are also notoriously difficult to train, with mode collapse and oscillations a common problem. We hypothesize that this is at least in part due to the evolution of the generator distribution and the catastrophic forgetting tendency of neural networks, which leads to the discriminator losing the ability to remember synthesized samples from previous instantiations of the generator. Recognizing this, our contributions are twofold. First, we show that GAN training makes for a more interesting and realistic benchmark for continual learning methods evaluation than some of the more canonical datasets. Second, we propose leveraging continual learning techniques to augment the discriminator, preserving its ability to recognize previous generator samples. We show that the resulting methods add only a light amount of computation, involve minimal changes to the model, and result in better overall performance on the examined image and text generation tasks.
研究动机与目标
- 为解决 GAN 训练中长期存在的模式崩溃和振荡问题,认识到由于生成器分布的演化,判别器面临持续学习问题。
- 评估 GAN 训练是否比传统数据集更能提供持续学习的真实基准,因为传统数据集往往无法反映现实世界中的灾难性遗忘动态。
- 通过将持续学习正则化整合到判别器中,提升 GAN 训练的稳定性和性能,保持其对先前生成样本的识别能力。
- 证明现有持续学习方法(如 EWC 和 IS)可被有效适配到 GAN 中,且仅需极少的架构或训练修改。
- 展示该方法在多个基准测试中(包括 CelebA、CIFAR-10 和 MS COCO Captions)均能提升图像和文本生成质量。
提出的方法
- 将弹性权重巩固(EWC)和智能突触(IS)方法适配到 GAN 的判别器中,利用费舍尔信息识别对过去生成器分布重要的参数。
- 通过在判别器损失中添加正则化项来修改 GAN 训练目标,以惩罚参数偏离先前重要权重的大幅变化。
- 在保持生成器和训练调度不变的前提下,对判别器应用 EWC 和 IS 正则化,确保架构改动最小。
- 使用与基线 GAN(如 DCGAN、WGAN-GP、SN-DCGAN)相同的超参数和学习率,仅在判别器中增加 EWC/IS 损失项。
- 在图像数据集(CelebA、CIFAR-10)上训练,使用 Fréchet Inception 距离(FID)和 Inception Score(ICP)进行评估;在文本生成任务(MS COCO Captions)上,使用 BLEU 和 Self-BLEU 分数进行评估。
- 在多种 GAN 变体(包括 TTUR、WGAN-GP 和 SN-DCGAN)上评估性能,以检验该方法的泛化能力。
实验结果
研究问题
- RQ1由于生成器分布的演化和判别器中的灾难性遗忘,GAN 训练是否本质上构成一个持续学习问题?
- RQ2像 EWC 和 IS 这类持续学习技术是否可被有效适配以稳定 GAN 训练并缓解模式崩溃?
- RQ3在图像和文本生成基准上,向判别器添加 EWC 或 IS 正则化是否能提升 FID、ICP 和 BLEU 分数?
- RQ4与最先进 GAN 训练方法相比,该方法在生成样本的质量和多样性方面表现如何?
- RQ5GAN 生成的数据能否作为比传统数据集更真实的持续学习基准?
主要发现
- 在 CelebA 上,向判别器添加 EWC 后,FID 从 12.52 降低至 10.92;在 CIFAR-10 上,FID 从 41.44 降低至 34.84,表明图像质量和多样性得到提升。
- 在 CIFAR-10 上,ICP 从 6.97 ± 0.05 提升至 7.58 ± 0.07,表明类别表示和样本质量更优。
- 在 MS COCO Captions 文本生成任务中,EWC/IS + textGAN 的 BLEU-2 得分为 0.934,优于基线 textGAN(0.926)和大多数最先进方法。
- EWC/IS 变体的 BLEU-4 得分为 0.594,超过基线 textGAN(0.567),并接近 LeakGAN,同时自 BLEU 分数更低(0.388 vs. 0.689),表明生成样本更具多样性。
- 该方法无需修改生成器架构或学习率,仅通过增加 EWC/IS 正则化项带来极小的计算开销。
- 结果表明,采用持续学习正则化的 GAN 训练可实现更稳定的训练过程,减少模式崩溃,并在图像和文本生成任务中均提升样本质量。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。