[论文解读] On Convergence and Stability of GANs
本文将GAN训练重新表述为后悔最小化,分析导致模式崩溃的非凸动力学,并引入DRAGAN,一种梯度惩罚方法,在多种架构和目标下提升稳定性和建模性能。
We propose studying GAN training dynamics as regret minimization, which is in contrast to the popular view that there is consistent minimization of a divergence between real and generated distributions. We analyze the convergence of GAN training from this new point of view to understand why mode collapse happens. We hypothesize the existence of undesirable local equilibria in this non-convex game to be responsible for mode collapse. We observe that these local equilibria often exhibit sharp gradients of the discriminator function around some real data points. We demonstrate that these degenerate local equilibria can be avoided with a gradient penalty scheme called DRAGAN. We show that DRAGAN enables faster training, achieves improved stability with fewer mode collapses, and leads to generator networks with better modeling performance across a variety of architectures and objective functions.
研究动机与目标
- 提出将GAN训练动力学视为后悔最小化的观点,作为发散最小化的替代方法。
- 分析凸-凹与非凸GAN设置下的收敛性,并识别模式崩溃的原因。
- 将模式崩溃描述为来自于真实数据点周围判别器梯度尖锐的情况。
- 引入DRAGAN,一种局部梯度惩罚方法,以缓解模式崩溃并提升稳定性和建模性能。
提出的方法
- 将GAN训练建模为一个重复博弈,生成器和判别器都使用无后悔算法。
- 提供带交替梯度更新的GAN训练与后悔最小化之间的理论联系。
- 分析非凸博弈动力学以解释可能的坏局部均衡和模式崩溃。
- 将真实数据点周围的判别器梯度尖锐确认为模式崩溃的特征。
- 提出DRAGAN:一种梯度惩罚方案,在真实数据周围对判别器梯度进行局部约束,从而提高稳定性。
实验结果
研究问题
- RQ1是否可以通过后悔最小化来分析GAN训练动力学以解释收敛性质?
- RQ2非凸GAN博弈中模式崩溃的机制是什么,如何缓解?
- RQ3在真实数据点周围局部约束判别器梯度是否可以在不损害建模性能的前提下防止退化的局部均衡?
- RQ4DRAGAN 相较于其他梯度惩罚方法在不同架构和目标函数下如何比较?
主要发现
- 将GAN视为后悔最小化的博弈可在不要求判别器在每一步都最优的情况下提供收敛洞察。
- 模式崩溃与非凸GAN博弈中的不良局部均衡以及真实数据点附近判别器梯度尖锐相关。
- DRAGAN的梯度惩罚降低模式崩溃,并在多种架构中提升训练稳定性和建模性能。
- DRAGAN在稳定性方面与WGAN-GP等最先进的梯度惩罚方法相当或更优,同时保持更快的训练速度。
- 局部梯度惩罚(围绕真实数据)被证明是有效的,且对不同GAN目标具有更广泛的适用性。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。