Skip to main content
QUICK REVIEW

[论文解读] Approximation and Convergence Properties of Generative Adversarial Learning

Shuang Liu, Olivier Bousquet|arXiv (Cornell University)|May 24, 2017
Generative Adversarial Networks and Image Synthesis参考文献 12被引用 60
一句话总结

本文引入了一个广义的对抗性发散框架,用于GANs,证明在判别器类别受到限制或目标函数为严格时,会涉及矩匹配和收敛的含义,并将这些结果与现有的GAN变体联系起来。

ABSTRACT

Generative adversarial networks (GAN) approximate a target data distribution by jointly optimizing an objective function through a "two-player game" between a generator and a discriminator. Despite their empirical success, however, two very basic questions on how well they can approximate the target distribution remain unanswered. First, it is not known how restricting the discriminator family affects the approximation quality. Second, while a number of different objective functions have been proposed, we do not understand when convergence to the global minima of the objective function leads to convergence to the target distribution under various notions of distributional convergence. In this paper, we address these questions in a broad and unified setting by defining a notion of adversarial divergences that includes a number of recently proposed objective functions. We show that if the objective function is an adversarial divergence with some additional conditions, then using a restricted discriminator family has a moment-matching effect. Additionally, we show that for objective functions that are strict adversarial divergences, convergence in the objective function implies weak convergence, thus generalizing previous results.

研究动机与目标

  • 表征支撑GAN目标函数的对抗性发散(包括GAN、f-GAN、MMD-GAN、WGAN、WGAN-GP以及正则化的OT).
  • 分析对判别器类别的限制如何在生成分布中诱导广义的矩匹配。
  • 证明对于严格的对抗性发散,目标函数的收敛性蕴含对目标分布的弱收敛。
  • 给出判别器为神经网络时仍保持矩匹配性质的条件。
  • 将对抗性发散中的收敛性与分布收敛的标准概念(弱收敛、Wasserstein)联系起来。

提出的方法

  • 将对抗性发散定义为 tau(mu||nu) = sup_{f ∈ F} E_{mu×nu}[f(x,y)].
  • 引入 opt_{tau,mu*} 的概念,作为 tau(mu*||nu) 的最小化解的集合。
  • 定义严格的对抗性发散,其中对所有 mu*,opt_{tau,mu*} = {mu*}。
  • 证明广义的矩匹配:在某些条件下,受限的判别器意味着 E_mu[v_theta] = E_mu*[v_theta],对于 θ ∈ Θ(定理4)。
  • 若 theta^{mu}_{nu} 位于 Θ 的内点且具有适当的可微性,则 opt_{tau,mu*} = M_{mu*}(定理5)。
  • 讨论线性 f-GAN 与神经网络 f-GAN,证明在受限/神经网络判别器下仍成立矩匹配(推论6)。
  • 建立在严格对抗性发散中的收敛性蕴含对 mu* 的弱收敛(定理10)。
  • 将严格发散与Wasserstein距离联系起来,指出Wasserstein在严格发散中属于最弱之一(推论12)。

实验结果

研究问题

  • RQ1限制判别器族如何影响GAN对目标分布的逼近?
  • RQ2在何种条件下,最小化GAN目标意味着在标准收敛概念下收敛到目标分布?
  • RQ3不同对抗性发散及其驱动收敛强度之间的关系?
  • RQ4当判别器是受限类别或部分训练时,神经网络判别器是否仍保持矩匹配性质?
  • RQ5结果如何在如 f-GAN、MMD-GAN 和 WGAN 家族等GAN变体中泛化?

主要发现

  • 在某些条件下的对抗性发散使受限判别器在 mu 与 mu* 之间诱导广义矩匹配。
  • 在线性 f-GAN 中,以及把神经网络 GAN 视为线性 GAN 上确界的情况,生成分布必须满足广义矩 E_mu[psi] = E_mu*[psi]。
  • 对于严格的对抗性发散,目标收敛到最小值蕴含生成分布对 mu* 的弱收敛。
  • Wasserstein-GAN 在严格发散中的目标最弱,将 tau 的收敛与弱收敛对齐。
  • 该框架在对抗性发散概念下统一了若干GAN目标(GAN、f-GAN、MMD-GAN、WGAN、WGAN-GP、正则化OT)。
  • 一个平凡的严格对抗性发散是可能的最强者,而Wasserstein和MMD在框架内对应最弱的严格发散。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。