Skip to main content
QUICK REVIEW

[论文解读] Variational Sequential Monte Carlo

Christian A. Naesseth, Scott W. Linderman|arXiv (Cornell University)|May 31, 2017
Gaussian Processes and Bayesian Inference参考文献 47被引用 49
一句话总结

本文提出了变分顺序蒙特卡洛(vSMC),一种新颖的变分推断框架,将变分推断与顺序蒙特卡洛相结合,实现了灵活、精确且可扩展的贝叶斯推断。通过将SMC提议参数视为变分参数,并通过在下界上的随机梯度上升进行优化,vSMC在复杂序列模型(尤其是长时序范围)中实现了比基线方法(如IWAE和结构化VI)更紧的证据下界。

ABSTRACT

Many recent advances in large scale probabilistic inference rely on variational methods. The success of variational approaches depends on (i) formulating a flexible parametric family of distributions, and (ii) optimizing the parameters to find the member of this family that most closely approximates the exact posterior. In this paper we present a new approximating family of distributions, the variational sequential Monte Carlo (VSMC) family, and show how to optimize it in variational inference. VSMC melds variational inference (VI) and sequential Monte Carlo (SMC), providing practitioners with flexible, accurate, and powerful Bayesian inference. The VSMC family is a variational family that can approximate the posterior arbitrarily well, while still allowing for efficient optimization of its parameters. We demonstrate its utility on state space models, stochastic volatility models for financial data, and deep Markov models of brain neural circuits.

研究动机与目标

  • 开发一种适用于复杂序列模型(如状态空间模型和深度马尔可夫模型)的灵活且精确的变分推断方法。
  • 通过改进后验近似保真度,解决标准变分推断和重要性加权自编码器(IWAE)在长时序时间序列中的局限性。
  • 通过粒子数量实现计算成本与近似精度之间的合理权衡,且方法具有原则性。
  • 利用变分原理优化SMC中的提议分布,提升收敛性与后验估计性能。

提出的方法

  • 提出一种新的变分族vSMC,其中每个分布对应一次使用参数化提议分布的SMC运行。
  • 将SMC提议的参数视为需通过变分下界上的随机梯度上升进行优化的变分参数。
  • 推导出vSMC的可微下界(ELBO),该下界推广了IWAE下界,支持端到端训练。
  • 使用SMC中的加权粒子轨迹作为变分近似中的样本,最终根据最终权重选择一个粒子。
  • 采用重参数化梯度,实现在存在随机性情况下的提议参数高效优化。
  • 支持摊销与非摊销推断,可在深度模型中实现复杂提议分布的可扩展学习。

实验结果

研究问题

  • RQ1基于SMC的变分族是否能在序列模型中实现比IWAE和结构化VI等现有方法更紧的证据下界?
  • RQ2vSMC的性能如何随粒子数量变化?随着序列长度增加,其是否仍保持对IWAE的优势?
  • RQ3在随机波动率模型和深度马尔可夫模型中,vSMC能否学习到比基线方法更高效、更精确的提议?
  • RQ4在真实世界时间序列数据上,vSMC在ELBO和计算效率方面相较于IWAE的优越程度如何?
  • RQ5vSMC能否有效应用于具有非线性动力学和高维观测的复杂神经回路模型?

主要发现

  • 在包含119个月汇率数据的随机波动率模型中,vSMC在N=16个粒子时达到ELBO为6936.6,优于IWAE(6913.3)和结构化VI(6905.1)。
  • 随着粒子数量增加,vSMC的ELBO显著提升,而IWAE的性能迅速趋于饱和,表明vSMC在N增大时具有更优的可扩展性。
  • 在猕猴运动皮层数据的深度马尔可夫模型中,vSMC达到与IWAE相同的ELBO,但收敛速度更快,证明其训练效率更高。
  • 在长序列中,vSMC保持了多样化的高权重粒子,避免了标准重要性采样和IWAE中常见的粒子退化问题。
  • 在一个简单的高斯状态空间模型中,vSMC几乎达到了真实的边缘似然,证明其能精确近似复杂后验分布。
  • vSMC推广了IWAE下界,表明当省略重采样时,IWAE是vSMC下界的一个特例。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。