Skip to main content
QUICK REVIEW

[论文解读] AdaGAN: Boosting Generative Models

Ilya Tolstikhin, Sylvain Gelly|arXiv (Cornell University)|Jan 9, 2017
Generative Adversarial Networks and Image Synthesis被引用 146
一句话总结

AdaGAN 是一种提升式元算法,通过对重新加权的数据迭代训练 GAN 组成部分,构建一个可加混合的强生成模型,覆盖更多数据模态并在最佳步骤下收敛至真实分布。它在收敛性上提供理论保证,并实用性地解决 GAN 的缺失模态问题。

ABSTRACT

Generative Adversarial Networks (GAN) (Goodfellow et al., 2014) are an effective method for training generative models of complex data such as natural images. However, they are notoriously hard to train and can suffer from the problem of missing modes where the model is not able to produce examples in certain regions of the space. We propose an iterative procedure, called AdaGAN, where at every step we add a new component into a mixture model by running a GAN algorithm on a reweighted sample. This is inspired by boosting algorithms, where many potentially weak individual predictors are greedily aggregated to form a strong composite predictor. We prove that such an incremental procedure leads to convergence to the true distribution in a finite number of steps if each step is optimal, and convergence at an exponential rate otherwise. We also illustrate experimentally that this procedure addresses the problem of missing modes.

研究动机与目标

  • 以加性混合的方式,提出一个原则性、自动化的方法来解决 GAN 的缺失模态问题。
  • 开发一个提升式元算法,增量地添加在重新加权数据上训练的生成组件。
  • 在 f-divergence 下,为混合方法提供理论收敛性保证。

提出的方法

  • 提出 AdaGAN:对重新加权的数据分布迭代训练一个新的生成器,并使用混合权重 beta_t 将其与先前的生成器形成混合。
  • 将问题建模为最小化数据分布与组件分布的加法混合之间的 f-散度。
  • 推导上界及最优性条件,以指导新组件 Q_beta* 或 Q_beta^† 的选择以及权重 beta 的取值。
  • 在每一步达到完全最优化的前提下,证明混合模型收敛至真实分布,在某些条件下收敛速率呈指数级。
  • 将训练视为对重新加权样本的 GAN 风格过程,并解释整体模型通过选择组件索引并从该组件采样来进行采样。

实验结果

研究问题

  • RQ1一系列重新加权的 GAN 能否作为加法混合的形式近似真实数据分布?
  • RQ2在一般 f-divergence 下,AdaGAN 混合的收敛性理论保证是什么?
  • RQ3应如何选择混合权重 beta_t 与重新加权方案,以确保快速改进并避免对重新加权数据的过拟合?
  • RQ4AdaGAN 是否有效缓解标准 GAN 的缺失模态问题?

主要发现

  • AdaGAN 通过对重新加权数据训练生成器并组成混合来覆盖之前未捕捉到的模态。
  • 框架提供收敛性保证:若每一步都是最优的,则在有限步内收敛至真实分布;否则,收敛速率为指数级。
  • 上界展示添加新组件如何改进 f-散度,并且可通过无依赖于具体 f-散度的 Q_beta* 或 Q_beta^† 来刻画最优性。
  • 实证示例表明该方法通过重新加权训练样本以强调困难样例来解决缺失模态问题。
  • 该方法被展示为一个元算法,可以与各种基生成器配对,虽然讨论聚焦于 GANs。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。