Skip to main content
QUICK REVIEW

[论文解读] Progressive Growing of GANs for Improved Quality, Stability, and Variation

Tero Karras, Timo Aila|arXiv (Cornell University)|Oct 27, 2017
Generative Adversarial Networks and Image Synthesis参考文献 34被引用 1,557
一句话总结

本文提出对生成器和判别器的渐进式生长,用于从低分辨率到高分辨率训练GANs,从而提升图像质量、训练稳定性和多样性,在 CelebA、LSUN 和 CIFAR-10 上取得显著结果。

ABSTRACT

We describe a new training methodology for generative adversarial networks. The key idea is to grow both the generator and discriminator progressively: starting from a low resolution, we add new layers that model increasingly fine details as training progresses. This both speeds the training up and greatly stabilizes it, allowing us to produce images of unprecedented quality, e.g., CelebA images at 1024^2. We also propose a simple way to increase the variation in generated images, and achieve a record inception score of 8.80 in unsupervised CIFAR10. Additionally, we describe several implementation details that are important for discouraging unhealthy competition between the generator and discriminator. Finally, we suggest a new metric for evaluating GAN results, both in terms of image quality and variation. As an additional contribution, we construct a higher-quality version of the CelebA dataset.

研究动机与目标

  • 提出一种稳定化GAN以实现高分辨率图像合成的训练方法。
  • 提出逐步增长生成器和判别器以学习粗到细的表示。
  • 在训练过程中在防止模式崩溃的同时提升输出多样性。
  • 引入归一化技术和训练策略以平衡生成器与判别器的动态。
  • 提供能在不同尺度上捕捉图像质量和变化性的评估指标。

提出的方法

  • 通过在训练中逐步添加层并逐步淡入,將生成器和判别器从 4x4 提升到更高分辨率。
  • 使用带镜像的生成器G和判别器D的共享架构,使其同步增长。
  • 在训练中应用均衡学习率以标准化每层权重的尺度。
  • 在生成器中应用逐像素特征向量归一化以约束幅度并稳定训练。
  • 在判别器中引入小批量标准差以提高输出的变化。
  • 使用 WGAN-GP 或 LS GAN 损失进行评估,并引入基于拉普拉斯金字塔和切片沃瑟斯坦距离的多尺度统计相似性度量。

实验结果

研究问题

  • RQ1渐进式生长是否能稳定GAN训练并实现高分辨率图像合成?
  • RQ2哪些技术在避免模式崩溃的同时最有助于提升生成图像的变化性?
  • RQ3不同的归一化和初始化策略如何影响GAN的训练动态和收敛?
  • RQ4单一的GAN架构是否能够跨多数据集和分辨率同时实现高保真度和多样性输出?
  • RQ5哪些指标最能捕捉GAN在跨尺度上的质量与变化性?

主要发现

  • 渐进式增长显著加快训练速度并提升稳定性,使百万像素级图像合成成为可能。
  • 该方法在 CelebA 上以 1024x1024 获得高质量图像,在 LSUN 上以 256x256 获得具有竞争力的结果。
  • 在 CIFAR-10 上,未监督的 Inception Score 提高至 8.80,超越了之前的未监督结果。
  • 判别器中一个简单的小批量标准差层在不增加额外可学习参数的情况下提升了变化性。
  • 均衡学习率和逐像素特征向量归一化有助于抑制信号的上升并稳定训练。
  • 多尺度统计相似性(SWD)指标在分布相似性上显示出改进,与定性提升一致。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。