Skip to main content
QUICK REVIEW

[论文解读] Spectral Normalization for Generative Adversarial Networks

Takeru Miyato, Toshiki Kataoka|arXiv (Cornell University)|Feb 16, 2018
Generative Adversarial Networks and Image Synthesis参考文献 24被引用 2,304
一句话总结

Introduce spectral normalization to stabilize GAN training by constraining each layer’s spectral norm, yielding robust performance across datasets like CIFAR-10, STL-10, and ImageNet. SN-GANs achieve competitive or superior image quality with simple integration and low overhead.

ABSTRACT

One of the challenges in the study of generative adversarial networks is the instability of its training. In this paper, we propose a novel weight normalization technique called spectral normalization to stabilize the training of the discriminator. Our new normalization technique is computationally light and easy to incorporate into existing implementations. We tested the efficacy of spectral normalization on CIFAR10, STL-10, and ILSVRC2012 dataset, and we experimentally confirmed that spectrally normalized GANs (SN-GANs) is capable of generating images of better or equal quality relative to the previous training stabilization techniques.

研究动机与目标

  • 通过对判别器进行约束来动机化并解决GAN训练中的不稳定性。
  • 提出一种轻量级归一化,使各层的谱范数设为1,从而限制判别器的 Lipschitz 常数。
  • 证明谱归一化 (SN) 在多种数据集上的有效性,并与现有正则化方法进行比较。

提出的方法

  • 将判别器定义为线性层与非线性的组合;通过对每个权重矩阵 W 进行谱范数归一化来约束 Lipschitz 常数:W_bar_SN = W / sigma(W)。
  • 用幂迭代法高效估计 sigma(W),以保持计算轻量化。
  • 在谱归一化下分析梯度流,显示对主特征值分量的自适应正则化效果。
  • 在理论和经验上将 SN 与权重归一化、权重裁剪、梯度惩罚和正交正则化进行比较。
  • 在 CIFAR-10、STL-10 和 ImageNet 上使用标准 GAN 目标和铰链损失变体评估 SN-GANs;报告 Inception Score 和 FID 作为评估指标。

实验结果

研究问题

  • RQ1谱归一化是否在不产生过高计算成本的情况下可靠地束缚判别器的 Lipschitz 常数?
  • RQ2在图像质量和训练稳定性方面,SN 与其他正则化技术(权重归一化、权重裁剪、梯度惩罚、正交正则化)相比如何?
  • RQ3SN 在不同架构和数据集(CIFAR-10、STL-10、ImageNet)以及不同优化设置下是否具有鲁棒性?
  • RQ4谱归一化对判别器的权重谱和特征利用的影响是什么?

主要发现

  • SN 通过对每一层的谱范数归一化来约束判别器的 Lipschitz 常数,保持梯度有界并提高稳定性。
  • 经验证的结果表明,SN-GANs 在 CIFAR-10、STL-10 和 ImageNet 上实现的图像质量通常高于或等同于先前的稳定化方法,且训练时间通常更快或相当。
  • 谱归一化相比权重裁剪/归一化,产生更广泛分布的层特征值,表明早期层更丰富的特征利用。
  • SN-GANs 对于积极的学习率和动量设置具有鲁棒性,在多种设置下优于 WGAN-GP。
  • 与正交正则化相比,SN-GANs 在不同特征图维度和架构下仍保持性能,表明更强的架构鲁棒性。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。