Skip to main content
QUICK REVIEW

[论文解读] Discriminator Rejection Sampling

Samaneh Azadi, Catherine Olsson|arXiv (Cornell University)|Oct 16, 2018
Domain Adaptation and Few-Shot Learning被引用 27
一句话总结

本文提出判别器拒绝采样(DRS),一种后处理方法,利用训练好的 GAN 判别器作为拒绝采样器以提升生成样本质量。通过利用判别器的置信度分数,DRS 在 ImageNet 上显著提升了 FID 和 Inception Score,使改进后的 SAGAN 基线模型的 Inception Score 达到 76.08,FID 降低至 13.75。

ABSTRACT

We propose a rejection sampling scheme using the discriminator of a GAN to approximately correct errors in the GAN generator distribution. We show that under quite strict assumptions, this will allow us to recover the data distribution exactly. We then examine where those strict assumptions break down and design a practical algorithm - called Discriminator Rejection Sampling (DRS) - that can be used on real data-sets. Finally, we demonstrate the efficacy of DRS on a mixture of Gaussians and on the SAGAN model, state-of-the-art in the image generation task at the time of developing this work. On ImageNet, we train an improved baseline that increases the Inception Score from 52.52 to 62.36 and reduces the Frechet Inception Distance from 18.65 to 14.79. We then use DRS to further improve on this baseline, improving the Inception Score to 76.08 and the FID to 13.75.

研究动机与目标

  • 为解决 GAN 生成器在对抗训练后仍无法完全匹配真实数据分布的长期问题。
  • 探究训练好的判别器中是否仍包含可用于纠正生成器分布误差的有用信息。
  • 开发一种实用的、训练后处理方法,无需重新训练生成器即可提升样本质量。
  • 在合成高斯混合分布与使用 SOTA GAN 的真实世界 ImageNet 数据上,对方法进行实证验证。

提出的方法

  • 该方法将训练好的判别器输出用作拒绝采样的评分函数,根据样本的置信度决定接受或拒绝。
  • 采用动态阈值策略,将接受阈值设为每批次中判别器分数的第 80 百分位数。
  • 在严格假设下具有理论依据,即当判别器最优时,可实现真实数据分布的精确恢复。
  • 在实际应用中,该方法考虑了理论假设的失效情况,如模型容量有限和优化非理想化。
  • 在判别器顶部增加一个 Sigmoid 输出层,以确保与拒绝采样的兼容性,特别是在使用 hinge 损失时。
  • 该方法为训练后处理,无需修改生成器或训练过程。

实验结果

研究问题

  • RQ1是否可以利用训练好的判别器在不重新训练的情况下纠正 GAN 生成器的分布误差?
  • RQ2在何种理论条件下,判别器能够实现真实数据分布的精确恢复?
  • RQ3理论假设的违反在实践中如何影响此类拒绝采样方案的性能?
  • RQ4DRS 在真实世界数据集(如 ImageNet)上能将样本质量提升到何种程度?

主要发现

  • 在 ImageNet 上,DRS 将 Inception Score 从改进后的 SAGAN 基线的 62.36 提升至 76.08,FID 从 14.79 降低至 13.75。
  • 与基线相比,Inception Score 相对提升了 23.5%,FID 相对降低了 12.5%。
  • 接受概率高的样本在视觉上更连贯,且更清晰地可识别为特定物体类别。
  • 拒绝采样过程在潜在空间插值路径上表现出接受概率单调下降,表明判别器编码了有意义的质量信号。
  • 定性分析表明,高接受度样本比低接受度样本更真实、更少噪声。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。