Skip to main content
QUICK REVIEW

[论文解读] Underdamped Langevin MCMC: A non-asymptotic analysis

Xiang Cheng, Niladri S. Chatterji|arXiv (Cornell University)|Jul 12, 2017
Markov Chains and Monte Carlo Methods参考文献 22被引用 98
一句话总结

本文分析强对数凹目标的欠阻尼 Langevin MCMC,并证明在 2-Wasserstein 距离下的非渐近收敛,迭代次数为 O(sqrt(d)/ε)。

ABSTRACT

We study the underdamped Langevin diffusion when the log of the target distribution is smooth and strongly concave. We present a MCMC algorithm based on its discretization and show that it achieves $\varepsilon$ error (in 2-Wasserstein distance) in $\mathcal{O}(\sqrt{d}/\varepsilon)$ steps. This is a significant improvement over the best known rate for overdamped Langevin MCMC, which is $\mathcal{O}(d/\varepsilon^2)$ steps under the same smoothness/concavity assumptions. The underdamped Langevin MCMC scheme can be viewed as a version of Hamiltonian Monte Carlo (HMC) which has been observed to outperform overdamped Langevin MCMC methods in a number of application areas. We provide quantitative rates that support this empirical wisdom.

研究动机与目标

  • 通过欠阻尼 Langevin 演化(一个二阶、类似哈密顿的过程)激发从对数光滑、强凸目标中采样的动机。
  • 为离散化算法到不变量分布在 2-Wasserstein 距离下提供非渐进收敛保证。
  • 在相同光滑性/凸性假设下,相较于过阻尼 Langevin MCMC 提高已知的收敛速率。
  • 研究带有噪声梯度信息的稳定性与收敛性。
  • 建立与 Hamiltonian Monte Carlo 的联系以及优化中的加速概念。

提出的方法

  • 用以下动力学方程建模连续时间的欠阻尼 Langevin 演化:dv_t = -γ v_t dt - u∇f(x_t) dt + sqrt(2γu) dB_t 且 dx_t = v_t dt,不变量分布为 p*(x,v) ∝ exp(-(f(x)+||v||^2/(2u))).
  • 将此SDE离散化得到具体的欠阻尼 Langevin MCMC 算法(算法 1),步长 δ,参数设为 γ=2 和 u=1/L。
  • 证明该连续时间过程在 W2 下的指数收缩(定理 5 和推论 7)。
  • 给出连续与离散过程之间的离散化误差界(定理 9)。
  • 结合收缩性与离散化界,推导离散化算法在 W2 下的非渐近收敛(定理 1)。
  • 将结果扩展到带有随机梯度且梯度方差有界的情形(定理 3。)

实验结果

研究问题

  • RQ1欠阻尼 Langevin 动力学是否能够对从强对数凹目标采样提供非渐近收敛保证?
  • RQ2离散化的欠阻尼 Langevin MCMC 在 2-Wasserstein 距离下的有限时间(步数有限)收敛速率是多少?
  • RQ3在相同的光滑性/凸性假设下,欠阻尼方法在维数和精度方面与过阻尼 Langevin 相比较如何?
  • RQ4带有噪声梯度估计如何影响收敛速率,以及如何保持保证?

主要发现

  • 在 f 的光滑性和强凸性条件下,离散化的欠阻尼 Langevin MCMC 在 O(sqrt(d)/ε) 步内达到 W2 误差≤ε。
  • 在相同假设下,这一速率优于 overdamped Langevin MCMC 所需的 O(d/ε^2) 步。
  • 连续时间的欠阻尼 Langevin 演化在 W2 下对不变量分布呈指数收敛(在选择合适参数时)。
  • 连续与离散动力学之间的离散化误差得到控制,并以加性方式贡献于总体误差界。
  • 在有界方差的随机梯度下,非渐近收敛保证仍然成立,并给出明确的步长选择。
  • 理论结果将 MCMC 的加速与二阶动力学联系起来,并与优化中的加速方法具有共同直觉。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。