Skip to main content
QUICK REVIEW

[论文解读] NeuTra-lizing Bad Geometry in Hamiltonian Monte Carlo Using Neural Transport

Matthew D. Hoffman, Pavel Sountsov|arXiv (Cornell University)|Mar 9, 2019
Markov Chains and Monte Carlo Methods参考文献 28被引用 65
一句话总结

NeuTra HMC 学习一个神经传输映射以扭曲目标分布,通过改善几何形状和混合性实现更快的哈密顿蒙特卡洛;在墙钟时间和有效样本量方面通常优于原生 HMC。

ABSTRACT

Hamiltonian Monte Carlo is a powerful algorithm for sampling from difficult-to-normalize posterior distributions. However, when the geometry of the posterior is unfavorable, it may take many expensive evaluations of the target distribution and its gradient to converge and mix. We propose neural transport (NeuTra) HMC, a technique for learning to correct this sort of unfavorable geometry using inverse autoregressive flows (IAF), a powerful neural variational inference technique. The IAF is trained to minimize the KL divergence from an isotropic Gaussian to the warped posterior, and then HMC sampling is performed in the warped space. We evaluate NeuTra HMC on a variety of synthetic and real problems, and find that it significantly outperforms vanilla HMC both in time to reach the stationary distribution and asymptotic effective-sample-size rates.

研究动机与目标

  • 解决慢化 HMC 收敛与混合的不利后验几何。
  • 开发使用反自回归流(IAFs)的可扩展传输映射方法来扭曲目标空间。
  • 利用变分推断训练传输映射,使 HMC 更高效。
  • 在人工合成和真实世界问题上评估 NeuTra HMC,并与 vanilla HMC 进行比较。
  • 在摊销变分推断设置中探索可用性。

提出的方法

  • 通过变分推断拟合一个反自回归流(IAF)以最小化 KL(q(θ) || p(θ)),定义扭曲 θ = fφ(z)。
  • 在扭曲的 z 空间中运行哈密顿蒙特卡洛,目标 p(z) ∝ p(θ = f(z)) |∂f/∂z|,从 q(z) 的样本出发。
  • 将 z 空间的样本前向传播通过 f,得到 θ 空间的样本来自 p(θ)。
  • 使用多层堆叠的 IAF 以实现灵活、可扩展的传输映射;高效地计算雅可比行列式。
  • 可选择通过条件输入对映射进行辅助性条件化的摊销变分推断。
  • 通过贝叶斯优化自动化 HMC 超参数调节,以优化混合和收敛诊断。

实验结果

研究问题

  • RQ1NeuTra HMC 是否在劣势条件目标上比 vanilla HMC 提高混合和收敛速度?
  • RQ2基于神经传输映射(基于 IAF 的映射)对 HMC 的有效样本量和墙钟时间效率有何影响?
  • RQ3神经传输映射在无条件和有条件(摊销)后验设置中是否都能带来帮助?
  • RQ4传输映射训练时间与 NeuTra HMC 的热身/混合收益之间的权衡是什么?

主要发现

  • NeuTra HMC 在达到平稳性时间和对评估问题的渐近 ESS 速率方面显著优于 vanilla HMC。
  • 基于 IAF 的传输映射比对角线或三列矩阵更好地近似目标几何,改善对具有挑战性的区域的探索(例如漏斗颈部)。
  • 在像 DLGM 和 MNIST 这类条件模型的实验中,NeuTra HMC 改善了摊销后验,通过与 NeuTra 步骤整合后提升了测试 NLL。
  • NeuTra 通过传输映射的雅可比实现了类似 RMHMC 的自适应行为,在不产生完整 RMHMC 复杂性的情况下实现了局部几何的改进。
  • 传输映射的训练时间可以被随后的更快混合所抵消,尽管取舍取决于问题几何形状。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。