Skip to main content
QUICK REVIEW

[论文解读] Variational Inference using Implicit Distributions

Ferenc Huszár|arXiv (Cornell University)|Feb 27, 2017
Generative Adversarial Networks and Image Synthesis参考文献 27被引用 70
一句话总结

这篇论文综述并统一使用隐式分布的变分推断方法,将VI与类似GAN的方法和去噪基技术联系起来,并提出一个先验-与联合对比形式的框架,以及实用算法。

ABSTRACT

Generative adversarial networks (GANs) have given us a great tool to fit implicit generative models to data. Implicit distributions are ones we can sample from easily, and take derivatives of samples with respect to model parameters. These models are highly expressive and we argue they can prove just as useful for variational inference (VI) as they are for generative modelling. Several papers have proposed GAN-like algorithms for inference, however, connections to the theory of VI are not always well understood. This paper provides a unifying review of existing algorithms establishing connections between variational autoencoders, adversarially learned inference, operator VI, GAN-based image reconstruction, and more. Secondly, the paper provides a framework for building new algorithms: depending on the way the variational bound is expressed we introduce prior-contrastive and joint-contrastive methods, and show practical inference algorithms based on either density ratio estimation or denoising.

研究动机与目标

  • 在变分推断中使用隐式分布的动机,以克服显式 VI 的可处理性极限。
  • 在一个 VI 框架下统一现有的类似 GAN 的推断方法和基于去噪的推断方法。
  • 引入先验对比与联合对比变分边界的分类法。
  • 在密度不可解时,提供估计密度比或梯度的实用算法。
  • 讨论在先验或似然隐式时的学习扩展,并勾勒未来的方向。

提出的方法

  • 将 ELBO 表达为两种形式:先验对比 (r) 与联合对比 (s) 的潜变量/后验分布之间的密度比。
  • 提出通过对抗判别器进行密度比估计(PC-Adv、JC-Adv),以及通过去噪自编码器进行梯度估计(PC-Den、JC-Den)。
  • 提供两种推断模式的算法:PC-Adv/JC-Adv(显式隐式分布的推断)和 PC-Den/JC-Den(基于梯度的 VI)。
  • 展示在 q_psi 是隐式时,如何使用生成器对采样进行重参数化以实现 SGD 更新(等价的重参数化技巧)。
  • 讨论将对抗与去噪方法结合以提高收敛性和稳定性。
  • 概述一个基于 RMD 的变体(JC-Adv-RMD),在所有分布都是隐式时实现潜在的全变分学习。

实验结果

研究问题

  • RQ1当先验、似然或后验是隐式且不可处理时,如何进行变分推断?
  • RQ2先验对比与联合对比的 ELBO 形式如何与现有的 VI 与基于 GAN 的方法相关?
  • RQ3通过对抗方法的密度比估计或基于去噪的梯度是否能为隐式模型提供有效的 VI 更新?
  • RQ4推断中的对抗与去噪策略之间的权衡是什么,是否可以结合以获得更好的性能?
  • RQ5是否可以将这些方法扩展到具有完全隐式的模型并实现完整的变分学习(例如 JC-Adv-RMD)?

主要发现

  • 一个统一的视角将 VAE、对抗推断、OPVI 以及基于 GAN 的图像重建通过以密度比表达的 ELBO 连接起来。
  • 出现两条实用路径:通过判别器进行密度比估计(PC-Adv/JC-Adv)和基于梯度的去噪(PC-Den/JC-Den),两者均可用于隐式分布。
  • 在 KL 基础的 VI 背景下,PC-Adv 与 AVB 等价,而 JC-Adv 与带 KL 敦引约束的 ALI/BiGAN 公式相关。
  • 基于去噪的 VI(PC-Den)提供了一种灵活的替代方案,可估计类似于分数的梯度,并且可以与对抗方法结合以实现更好的收敛性。
  • 本文概述了如何对隐式组件执行推断,并讨论了通过 JC-Adv-RMD 进行潜在的完全学习的可能性,尽管需要理论方面的考虑。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。