Skip to main content
QUICK REVIEW

[论文解读] Variational Inference with Normalizing Flows

Danilo Jimenez Rezende, Shakir Mohamed|arXiv (Cornell University)|May 21, 2015
Model Reduction and Neural Networks参考文献 34被引用 1,425
一句话总结

本文提出使用归一化流(normalizing flows)构建高度灵活且可扩展的变分推断近似后验分布,从而实现比传统均值场或结构化方法更丰富的后验近似。通过将可逆、自回归变换应用于简单基密度,该方法在MNIST和CIFAR-10数据集上实现了更紧致的变分下界和系统性提升的测试似然,且性能随流深度增加而单调改善。

ABSTRACT

The choice of approximate posterior distribution is one of the core problems in variational inference. Most applications of variational inference employ simple families of posterior approximations in order to allow for efficient inference, focusing on mean-field or other simple structured approximations. This restriction has a significant impact on the quality of inferences made using variational methods. We introduce a new approach for specifying flexible, arbitrarily complex and scalable approximate posterior distributions. Our approximations are distributions constructed through a normalizing flow, whereby a simple initial density is transformed into a more complex one by applying a sequence of invertible transformations until a desired level of complexity is attained. We use this view of normalizing flows to develop categories of finite and infinitesimal flows and provide a unified view of approaches for constructing rich posterior approximations. We demonstrate that the theoretical advantages of having posteriors that better match the true posterior, combined with the scalability of amortized variational approaches, provides a clear improvement in performance and applicability of variational inference.

研究动机与目标

  • 解决变分推断中简单后验近似(如均值场)限制模型精度并难以捕捉复杂后验结构的问题。
  • 开发一种可扩展且灵活的后验近似框架,能够匹配真实后验的复杂性。
  • 在归一化流形式化框架下统一现有丰富的后验估计方法。
  • 证明增加流深度可系统性提升后验近似质量,并在基准数据集上改善似然性能。

提出的方法

  • 使用归一化流——一系列可逆、可微变换——将简单基密度(如高斯分布)转换为复杂且灵活的后验近似。
  • 采用摊销变分推断与推理网络参数化流变换,实现高效、可扩展的训练。
  • 推导出包含雅可比行列式对数项的修改版变分下界,以确保变换下概率密度的有效性。
  • 通过连续归一化流引入无穷小流,实现在足够深度下渐近收敛至真实后验。
  • 使用耦合层(如RealNVP风格)实施流变换,以保持计算效率和可逆性。
  • 采用蒙特卡洛梯度估计实现基于流的后验近似的端到端训练。

实验结果

研究问题

  • RQ1归一化流能否作为均值场和结构化变分近似在后验估计中的可扩展且灵活的替代方案?
  • RQ2增加归一化流的深度是否能系统性提升后验近似质量并改善模型似然?
  • RQ3无穷小归一化流能否在渐近条件下恢复真实后验分布,从而克服经典变分推断的关键局限?
  • RQ4在测试似然和推理质量方面,基于流的后验与NICE、HVI或DARN等先进方法相比表现如何?

主要发现

  • 在二值化MNIST数据集上,将流深度从K=10增加到K=80,测试集负对数似然从≤87.5降低至≤85.1,表明复杂度提升带来持续改进。
  • DLGM+NF模型在K=80时达到测试负对数似然≤85.1,优于基于NICE的基线(≤87.2)和HVI基线(85.51,使用8次跳跃步长)。
  • 在CIFAR-10上,将流深度从K=0增加到K=10,测试负对数似然从-293.7降低至-320.7,显示出强烈的单调改善趋势。
  • 该方法在K=10流步长下于CIFAR-10上达到测试似然-320.7,优于使用相似模型架构的DARN模型(自适应噪声设置下为84.13)。
  • 理论分析表明,无穷小流在渐近条件下可恢复真实后验,解决了变分推断长期存在的批评。
  • 该框架在单一归一化流形式化框架下统一了多种灵活后验近似方法,揭示了其共享的结构原理。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。