[论文解读] Multi-objective training of Generative Adversarial Networks with multiple discriminators
本文提出了一种用于训练生成对抗网络(GANs)的多目标优化框架,采用多个判别器,并将每个判别器的损失视为独立的目标。通过使用超体积最大化动态调整来自每个判别器的梯度权重,该方法在样本质量和多样性方面优于平均损失最小化或多梯度下降法,同时计算效率高于后者,且保持了高性能。
Recent literature has demonstrated promising results for training Generative Adversarial Networks by employing a set of discriminators, in contrast to the traditional game involving one generator against a single adversary. Such methods perform single-objective optimization on some simple consolidation of the losses, e.g. an arithmetic average. In this work, we revisit the multiple-discriminator setting by framing the simultaneous minimization of losses provided by different models as a multi-objective optimization problem. Specifically, we evaluate the performance of multiple gradient descent and the hypervolume maximization algorithm on a number of different datasets. Moreover, we argue that the previously proposed methods and hypervolume maximization can all be seen as variations of multiple gradient descent in which the update direction can be computed efficiently. Our results indicate that hypervolume maximization presents a better compromise between sample quality and computational cost than previous methods.
研究动机与目标
- 通过将多判别器训练重新表述为多目标优化问题,解决 GAN 训练不稳定性和模式崩溃问题。
- 通过利用多个判别器并采用自适应梯度加权,提升 GAN 的样本质量和多样性。
- 为多目标 GAN 训练开发一种计算效率优于多梯度下降(MGD)的替代方法。
- 评估增加判别器数量对生成器鲁棒性、样本质量和多样性的影。
- 证明超体积最大化在计算成本与样本质量之间提供了优于现有方法的更好权衡。
提出的方法
- 生成器使用超体积最大化(HV)进行训练,该方法优化多个判别器损失的加权组合,权重根据每个判别器的表现动态调整。
- 该方法使用共享的劣化点 $\bm{\eta}^{*}$ 作为损失的上界,以定义目标空间中的超体积。
- 梯度更新通过聚合所有判别器的梯度并按其对超体积提升的贡献加权计算。
- 该方法与平均损失最小化、MGD 和 GMAN 进行比较,实验在 MNIST 和 CIFAR-10 上使用 DCGAN、LSGAN 和 HingeGAN 架构进行。
- 训练采用大小为 64 的小批量样本,共 150 个周期,判别器更新可并行化,实现在单张 GPU 上高效计算。
- 该方法被证明是多梯度下降的一种变体,其中更新方向通过基于超体积的加权高效计算。
实验结果
研究问题
- RQ1当使用多个判别器时,多目标优化能否提升 GAN 训练的稳定性和样本多样性?
- RQ2与平均损失最小化和多梯度下降相比,超体积最大化在样本质量和计算成本方面表现如何?
- RQ3增加判别器数量是否能增强生成器的鲁棒性和模式覆盖能力?
- RQ4判别器数量的增加对堆叠 MNIST 和 CIFAR-10 中的 FID 分数和模式覆盖有何影响?
- RQ5超体积最大化能否在计算开销低于 MGD 的情况下实现最先进性能?
主要发现
- 在 MNIST 上,超体积最大化在使用 24 个判别器时实现了 1.89 的 FID-ResNet 分数,优于平均损失最小化和 GMAN,且计算效率高于 MGD。
- 在 CIFAR-10 上,所提方法生成的样本质量优于基线 GAN,且随着判别器数量增加,FID 分数持续改善。
- 在堆叠 MNIST 上使用 24 个判别器时,该方法实现了 1000.0 ± 0.0 个覆盖的模式和 0.084 ± 0.002 的反向 KL 散度,优于 DCGAN、ALI、未卷积 GAN 和 VEEGAN。
- 将判别器数量从 8 增加到 24,使模式覆盖从 679.2 ± 5.9 提升至 1000.0 ± 0.0,表明多样性与鲁棒性显著增强。
- 当使用 8 或 16 个判别器时,该方法的每轮迭代耗时低于 WGAN-GP,表明其在单 GPU 环境下具有出色的实用性。
- 与 MGD 或平均损失最小化相比,超体积最大化对超参数的敏感性更低,且在计算成本与样本质量之间表现出更优的权衡。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。