[论文解读] Generalization and Equilibrium in Generative Adversarial Nets (GANs)
论文表明在标准度量下 GAN 泛化可能失败,但在神经网络距离下成立,通过生成器混合证明近似均衡的存在,并引入 MIX+GAN 作为实用稳定化技术。
We show that training of generative adversarial network (GAN) may not have good generalization properties; e.g., training may appear successful but the trained distribution may be far from target distribution in standard metrics. However, generalization does occur for a weaker metric called neural net distance. It is also shown that an approximate pure equilibrium exists in the discriminator/generator game for a special class of generators with natural training objectives when generator capacity and training set sizes are moderate. This existence of equilibrium inspires MIX+GAN protocol, which can be combined with any existing GAN training, and empirically shown to improve some of them.
研究动机与目标
- 证明在标准分布距离下 GAN 训练可能无法泛化。
- 引入神经网络距离作为可行的 GAN 泛化度量。
- 证明通过生成器混合在 GAN 博弈中存在近似纯均衡。
- 提出并在实证中验证 MIX+GAN 作为一个实用的训练框架。
提出的方法
- 用带有神经网络判别器和生成器以及常见目标函数来定义 GAN 训练。
- 引入 F-distance 和神经网络距离作为统一的发散度量。
- 证明神经网络距离的泛化保证,具有多项式样本复杂度。
- 证明在 GAN 博弈中无限制的生成器混合可以实现接近最优的均衡。
- 提出一个有限混合构造,以实现近似纯均衡并推导网络规模界限。
- 将 MIX+GAN 作为一个实用的训练协议,结合混合与现有 GAN 目标,并采用熵正则化以鼓励多样性。
实验结果
研究问题
- RQ1在多项式样本下,GAN 训练是否可在标准距离度量(JS、Wasserstein)下泛化?
- RQ2是否存在一个更弱的度量(神经网络距离)能为 GAN 提供泛化保证?
- RQ3在 GAN 博弈中是否存在均衡,且是否能以实际的网络规模实现?
- RQ4混合生成器是否能达到近似均衡,且能否以单一网络实现(纯均衡)?
- RQ5MIX+GAN 框架是否能稳定训练并在经验中提升性能?
主要发现
- 标准的 JS 散度和 Wasserstein 距离在多项式样本下无法泛化。
- 神经网络距离拥有多项式样本的泛化性,为 GAN 训练提供了代理保证。
- 通过有限的生成器混合存在近似均衡,并且可以在 modest 的网络规模增加下实现类似纯均衡的构造。
- MIX+GAN 框架稳定训练,并在 CIFAR-10、MNIST、CelebA 等数据集上取得改进。
- 经验结果表明 MIX+DCGAN 在 Inception 分数上高于若干基线。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。