Skip to main content
QUICK REVIEW

[论文解读] Improving Generalization and Stability of Generative Adversarial Networks

Hoang Thanh-Tung, Truyen Tran|arXiv (Cornell University)|Feb 11, 2019
Generative Adversarial Networks and Image Synthesis被引用 82
一句话总结

本文翻译的简要摘要

ABSTRACT

Generative Adversarial Networks (GANs) are one of the most popular tools for learning complex high dimensional distributions. However, generalization properties of GANs have not been well understood. In this paper, we analyze the generalization of GANs in practical settings. We show that discriminators trained on discrete datasets with the original GAN loss have poor generalization capability and do not approximate the theoretically optimal discriminator. We propose a zero-centered gradient penalty for improving the generalization of the discriminator by pushing it toward the optimal discriminator. The penalty guarantees the generalization and convergence of GANs. Experiments on synthetic and large scale datasets verify our theoretical analysis.

研究动机与目标

  • 证明使用原始 GAN 损失训练的判别器泛化性差,可能导致生成器产生模式崩溃。
  • 提出一个零中心梯度惩罚(0-GP)以提升判别器泛化性和 GAN 的收敛性。
  • 证明 0-GP 将判别器容量分布以防止模式崩溃,并在超参数、优化器和体系结构之间提高鲁棒性。
  • 在合成数据和大规模数据集上提供理论与实证验证。

提出的方法

  • 引入 0-GP:一种在真实样本与伪样本之间的连线上最小化判别器梯度范数的惩罚。
  • 将 0-GP 与 1-GP 和 0-GP-sample 进行比较,并论证 0-GP 更好地将经验判别器推向理论最优的 D*。
  • 证明经验最优判别器 hat{D}* 不近似理论上的最优 D*,从而为该惩罚提供动机。
  • 将带有 0-GP 的 GAN 目标公式化为 L^{0-GP} = L - lambda E_{tilde{x}}[||grad D_{tilde{x}}||^2]。
  • 论证 0-GP 有助于在数据区域之间均衡判别器容量并减少模式崩溃。
  • 提供收敛性与泛化洞察,并将其与 TTUR 和梯度爆炸分析联系起来。

实验结果

研究问题

  • RQ1原始 GAN 损失是否会导致判别器在离散数据集上的泛化差?
  • RQ2零中心梯度惩罚(0-GP)是否能将经验判别器推向理论最优判别器并改善 GAN 收敛?
  • RQ30-GP 是否能减少模式崩溃并提高对超参数变化和结构选择的鲁棒性?

主要发现

  • 使用原始 GAN 损失训练的判别器泛化性差,并对训练数据标注错误过拟合,妨碍生成器。
  • 原始 GAN 目标在判别器中鼓励梯度爆炸,可能导致生成器的模式崩溃。
  • 0-GP 将判别器推向理论最优的 D*,提升泛化性和收敛性。
  • 0-GP 将判别器容量在各区域之间分配,减少模式崩溃,在超参数和架构上表现更鲁棒。
  • 在合成数据、MNIST 和 ImageNet 上的实验表明 GAN-0-GP 的表现优于基线,并对训练设置更鲁棒。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。