QUICK REVIEW

[论文解读] Underdamped Langevin MCMC: A non-asymptotic analysis

Xiang Cheng, Niladri S. Chatterji|arXiv (Cornell University)|Jul 12, 2017

Markov Chains and Monte Carlo Methods参考文献 22被引用 98

一句话总结

本文分析强对数凹目标的欠阻尼 Langevin MCMC，并证明在 2-Wasserstein 距离下的非渐近收敛，迭代次数为 O(sqrt(d)/ε)。

ABSTRACT

We study the underdamped Langevin diffusion when the log of the target distribution is smooth and strongly concave. We present a MCMC algorithm based on its discretization and show that it achieves $\varepsilon$ error (in 2-Wasserstein distance) in $\mathcal{O}(\sqrt{d}/\varepsilon)$ steps. This is a significant improvement over the best known rate for overdamped Langevin MCMC, which is $\mathcal{O}(d/\varepsilon^2)$ steps under the same smoothness/concavity assumptions. The underdamped Langevin MCMC scheme can be viewed as a version of Hamiltonian Monte Carlo (HMC) which has been observed to outperform overdamped Langevin MCMC methods in a number of application areas. We provide quantitative rates that support this empirical wisdom.

研究动机与目标

通过欠阻尼 Langevin 演化（一个二阶、类似哈密顿的过程）激发从对数光滑、强凸目标中采样的动机。
为离散化算法到不变量分布在 2-Wasserstein 距离下提供非渐进收敛保证。
在相同光滑性/凸性假设下，相较于过阻尼 Langevin MCMC 提高已知的收敛速率。
研究带有噪声梯度信息的稳定性与收敛性。
建立与 Hamiltonian Monte Carlo 的联系以及优化中的加速概念。

提出的方法

用以下动力学方程建模连续时间的欠阻尼 Langevin 演化：dv_t = -γ v_t dt - u∇f(x_t) dt + sqrt(2γu) dB_t 且 dx_t = v_t dt，不变量分布为 p*(x,v) ∝ exp(-(f(x)+||v||^2/(2u))).
将此SDE离散化得到具体的欠阻尼 Langevin MCMC 算法（算法 1），步长 δ，参数设为 γ=2 和 u=1/L。
证明该连续时间过程在 W2 下的指数收缩（定理 5 和推论 7）。
给出连续与离散过程之间的离散化误差界（定理 9）。
结合收缩性与离散化界，推导离散化算法在 W2 下的非渐近收敛（定理 1）。
将结果扩展到带有随机梯度且梯度方差有界的情形（定理 3。）

实验结果

研究问题

RQ1欠阻尼 Langevin 动力学是否能够对从强对数凹目标采样提供非渐近收敛保证？
RQ2离散化的欠阻尼 Langevin MCMC 在 2-Wasserstein 距离下的有限时间（步数有限）收敛速率是多少？
RQ3在相同的光滑性/凸性假设下，欠阻尼方法在维数和精度方面与过阻尼 Langevin 相比较如何？
RQ4带有噪声梯度估计如何影响收敛速率，以及如何保持保证？

主要发现

在 f 的光滑性和强凸性条件下，离散化的欠阻尼 Langevin MCMC 在 O(sqrt(d)/ε) 步内达到 W2 误差≤ε。
在相同假设下，这一速率优于 overdamped Langevin MCMC 所需的 O(d/ε^2) 步。
连续时间的欠阻尼 Langevin 演化在 W2 下对不变量分布呈指数收敛（在选择合适参数时）。
连续与离散动力学之间的离散化误差得到控制，并以加性方式贡献于总体误差界。
在有界方差的随机梯度下，非渐近收敛保证仍然成立，并给出明确的步长选择。
理论结果将 MCMC 的加速与二阶动力学联系起来，并与优化中的加速方法具有共同直觉。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。