Skip to main content
QUICK REVIEW

[论文解读] Generalization and Equilibrium in Generative Adversarial Nets (GANs)

Sanjeev Arora, Rong Ge|arXiv (Cornell University)|Mar 2, 2017
Generative Adversarial Networks and Image Synthesis被引用 211
一句话总结

论文表明在标准度量下 GAN 泛化可能失败,但在神经网络距离下成立,通过生成器混合证明近似均衡的存在,并引入 MIX+GAN 作为实用稳定化技术。

ABSTRACT

We show that training of generative adversarial network (GAN) may not have good generalization properties; e.g., training may appear successful but the trained distribution may be far from target distribution in standard metrics. However, generalization does occur for a weaker metric called neural net distance. It is also shown that an approximate pure equilibrium exists in the discriminator/generator game for a special class of generators with natural training objectives when generator capacity and training set sizes are moderate. This existence of equilibrium inspires MIX+GAN protocol, which can be combined with any existing GAN training, and empirically shown to improve some of them.

研究动机与目标

  • 证明在标准分布距离下 GAN 训练可能无法泛化。
  • 引入神经网络距离作为可行的 GAN 泛化度量。
  • 证明通过生成器混合在 GAN 博弈中存在近似纯均衡。
  • 提出并在实证中验证 MIX+GAN 作为一个实用的训练框架。

提出的方法

  • 用带有神经网络判别器和生成器以及常见目标函数来定义 GAN 训练。
  • 引入 F-distance 和神经网络距离作为统一的发散度量。
  • 证明神经网络距离的泛化保证,具有多项式样本复杂度。
  • 证明在 GAN 博弈中无限制的生成器混合可以实现接近最优的均衡。
  • 提出一个有限混合构造,以实现近似纯均衡并推导网络规模界限。
  • 将 MIX+GAN 作为一个实用的训练协议,结合混合与现有 GAN 目标,并采用熵正则化以鼓励多样性。

实验结果

研究问题

  • RQ1在多项式样本下,GAN 训练是否可在标准距离度量(JS、Wasserstein)下泛化?
  • RQ2是否存在一个更弱的度量(神经网络距离)能为 GAN 提供泛化保证?
  • RQ3在 GAN 博弈中是否存在均衡,且是否能以实际的网络规模实现?
  • RQ4混合生成器是否能达到近似均衡,且能否以单一网络实现(纯均衡)?
  • RQ5MIX+GAN 框架是否能稳定训练并在经验中提升性能?

主要发现

方法分数
SteinGAN ( Wang and Liu, 2016 )6.35
Improved GAN ( Salimans et al., 2016 )8.09 ± 0.07
AC-GAN ( Odena et al., 2016 )8.25 ± 0.07
S-GAN (best variant in Huang et al., 2017)8.59 ± 0.12
DCGAN (as reported in Wang and Liu, 2016)6.58
DCGAN (best variant in Huang et al., 2017)7.16 ± 0.10
DCGAN (5x size)7.34 ± 0.07
MIX+DCGAN (Ours, with 5 components)7.72 ± 0.09
Wasserstein GAN3.82 ± 0.06
MIX+WassersteinGAN (Ours, with 5 components)4.04 ± 0.07
  • 标准的 JS 散度和 Wasserstein 距离在多项式样本下无法泛化。
  • 神经网络距离拥有多项式样本的泛化性,为 GAN 训练提供了代理保证。
  • 通过有限的生成器混合存在近似均衡,并且可以在 modest 的网络规模增加下实现类似纯均衡的构造。
  • MIX+GAN 框架稳定训练,并在 CIFAR-10、MNIST、CelebA 等数据集上取得改进。
  • 经验结果表明 MIX+DCGAN 在 Inception 分数上高于若干基线。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。