Skip to main content
QUICK REVIEW

[论文解读] Progressive Growing of GANs for Improved Quality, Stability, and Variation

Tero Karras, Timo Aila|arXiv (Cornell University)|Oct 27, 2017
Generative Adversarial Networks and Image Synthesis被引用 2,871
一句话总结

本文提出对生成器和判别器进行渐进式生长来稳定GAN训练并生成高分辨率图像,在质量和多样性方面显示出提升,包括 CelebA-HQ 1024^2 和 CIFAR-10 无监督的 8.80 分数。

ABSTRACT

We describe a new training methodology for generative adversarial networks. The key idea is to grow both the generator and discriminator progressively: starting from a low resolution, we add new layers that model increasingly fine details as training progresses. This both speeds the training up and greatly stabilizes it, allowing us to produce images of unprecedented quality, e.g., CelebA images at 1024^2. We also propose a simple way to increase the variation in generated images, and achieve a record inception score of 8.80 in unsupervised CIFAR10. Additionally, we describe several implementation details that are important for discouraging unhealthy competition between the generator and discriminator. Finally, we suggest a new metric for evaluating GAN results, both in terms of image quality and variation. As an additional contribution, we construct a higher-quality version of the CelebA dataset.

研究动机与目标

  • 激发并解决高分辨率下GAN训练中的不稳定性和有限的变化性。
  • 提出一种训练方案,使生成器和判别器从低分辨率逐步增长到高分辨率。
  • 引入简单技术在不增加额外超参数的情况下增加输出的多样性。
  • 展示高质量的百万像素级生成(CelebA 1024^2)以及强劲的CIFAR-10无监督的inception分数。
  • 提供实际实现细节以降低G与D之间的不健康竞争,并提出用于评估质量与多样性的新的评价指标。

提出的方法

  • 通过在转换阶段添加层并渐隐它们,将G和D从低分辨率(4x4)逐步增长到高分辨率(1024x1024)。
  • 使用等学习率以在各层之间保持学习速率的平衡。
  • 在生成器中应用逐像素特征向量归一化以限制信号幅度。
  • 在判别器中引入一个小批量标准差特征,以在不增加额外可学习参数的情况下促进多样性。
  • 采用一种简化的小批量判别概念,不增加可学习参数或超参数。
  • 利用基于Laplacian金字塔的多尺度统计相似性度量(SWD)来评估图像分布与训练集的相似性。

实验结果

研究问题

  • RQ1是否可以通过生成器和判别器的共同逐步增长在高分辨率下稳定GAN训练?
  • RQ2与非渐进式GAN相比,渐进式增长是否提高了图像质量和训练速度?
  • RQ3在不引入额外超参数或复杂正则化器的情况下,如何增加生成图像的多样性?
  • RQ4哪些指标在跨尺度上最好地量化GAN输出的质量和多样性?

主要发现

  • 渐进式增长显著加快训练并稳定高分辨率图像生成(例如达到1024^2)。
  • 在CelebA、LSUN和CIFAR-10设置下实现更好的收敛和更高质量的图像。
  • 小批量标准差和等学习率有助于减少模态崩溃并输出更多样的图像。
  • 在 1024^2 的 CelebA-HQ 数据集被创建以支持高分辨率评估。
  • CIFAR-10 无监督的inception分数达到8.80,超过了之前的无监督结果。
  • 基于SWD的多尺度评估与定性改进相一致,并能区分超出MS-SSIM的配置。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。