Skip to main content
QUICK REVIEW

[论文解读] On Self Modulation for Generative Adversarial Networks

Ting Chen, Mario Lučić|arXiv (Cornell University)|Oct 2, 2018
Model Reduction and Neural Networks参考文献 40被引用 44
一句话总结

Self-modulation 调制生成器特征图,使用输入噪声向量,提升 GAN 在不同数据集、架构、损失函数和超参数下的性能,无需额外标签。它在 5-35% 相对 FID 降幅方面取得结果,在 124/144 设置中实现提升。

ABSTRACT

Training Generative Adversarial Networks (GANs) is notoriously challenging. We propose and study an architectural modification, self-modulation, which improves GAN performance across different data sets, architectures, losses, regularizers, and hyperparameter settings. Intuitively, self-modulation allows the intermediate feature maps of a generator to change as a function of the input noise vector. While reminiscent of other conditioning techniques, it requires no labeled data. In a large-scale empirical study we observe a relative decrease of $5\%-35\%$ in FID. Furthermore, all else being equal, adding this modification to the generator leads to improved performance in $124/144$ ($86\%$) of the studied settings. Self-modulation is a simple architectural change that requires no additional parameter tuning, which suggests that it can be applied readily to any GAN.

研究动机与目标

  • 稳定 GAN 训练并在不依赖外部条件信息的情况下提升样本质量。
  • 展示一种简单架构修改在跨数据集、架构、损失和超参数上的通用适用性。
  • 比较无条件生成和有条件生成场景,并分析与可用标签的交互。
  • 提供诊断工具,理解调制如何影响生成器的条件化和训练动态。

提出的方法

  • 通过一个小型 MLP 使 BN 的缩放和偏移参数依赖于生成器输入 z 来引入自调制。
  • 对于有条件生成,先通过简单的双线性交互将 z 与标签信息组合,然后再应用调制。
  • 在两种损失(非饱和和 hinge)、两种归一化/正则化方案(梯度惩罚和谱归一化)、两种架构(类似 DCGAN 与残余)、以及多组超参数上进行评估。
  • 在 CIFAR-10、CelebA-HQ、LSUN-bedroom 以及 ImageNet 上训练 100k 步(ImageNet 更长训练为 500k 步)并使用 FID 与 IS 进行评估。
  • 将自调制与基线 BN 进行比较,在无配对(无标签)和配对(有标签)设置下,报告跨超参数的最佳模型。

实验结果

研究问题

  • RQ1自调制是否在多样数据集、架构以及损失/正则化设置下提升 GAN 性能?
  • RQ2自调制能否在无条件和有条件 GAN 中带来收益?在可用标签存在时如何与标签信息交互?
  • RQ3调制在生成器的哪一层最有益?是否需要对所有层进行调制?
  • RQ4自调制如何影响诊断指标,如生成器雅可比矩阵的条件数以及精度/召回?

主要发现

  • 采用自调制的设置中 FID 提升介于 4% 到 33% 之间。
  • 在无配对设置中,自调制在 32 种配置中有 30 种超过基线。
  • 在有配对(有条件)设置中,自调制在多数据集上对 FID 获得显著提升,在 IS 方面也有可观提升。
  • 应用于 resnet 架构时,自调制在损失、正则化或归一化的使用与否下均能持续改进性能。
  • 使用更长的训练(500k 步)显示持续改进(无条件 FID 降幅 11%,有条件 13%)。
  • 自调制在应用于后期层时往往提供最大的收益,且对每一层进行调制能获得最佳结果。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。