QUICK REVIEW

[论文解读] Non-asymptotic convergence analysis for the Unadjusted Langevin Algorithm

Alain Durmus, Miljko Erić|SPIRE - Sciences Po Institutional REpository|Jul 17, 2015

Markov Chains and Monte Carlo Methods参考文献 33被引用 96

一句话总结

本文在总变差距离下为非调整Langevin算法（ULA）提供了非渐近收敛界，分析了恒定步长和递减步长两种情形。研究建立了针对高维目标分布采样的维度相关收敛速率，通过量化势函数光滑性与曲率对采样精度与效率的影响，改进了先前工作。

ABSTRACT

In this paper, we study a method to sample from a target distribution $π$ over $\mathbb{R}^d$ having a positive density with respect to the Lebesgue measure, known up to a normalisation factor. This method is based on the Euler discretization of the overdamped Langevin stochastic differential equation associated with $π$. For both constant and decreasing step sizes in the Euler discretization, we obtain non-asymptotic bounds for the convergence to the target distribution $π$ in total variation distance. A particular attention is paid to the dependency on the dimension $d$, to demonstrate the applicability of this method in the high dimensional setting. These bounds improve and extend the results of (Dalalyan 2014).

研究动机与目标

为非调整Langevin算法（ULA）在总变差距离下提供非渐近、可计算的收敛界。
分析收敛速率对维度 $ d $、步长 $ \gamma $ 以及势函数 $ U $ 光滑性特征的依赖关系。
通过在高维设置下为恒定步长和递减步长提供更紧的界，拓展现有结果。
在较弱条件下建立对目标分布 $ \pi $ 的收敛性，包括对递减步长下非齐次马尔可夫链的收敛。

提出的方法

本文使用过阻尼Langevin SDE $ \mathrm{d}Y_t = -\nabla U(Y_t)\mathrm{d}t + \sqrt{2}\mathrm{d}B_t^d $ 的Euler-Maruyama半离散化方法定义ULA马尔可夫链。
应用反射耦合技术与基于耦合的论证方法，推导出ULA链的分布与目标测度 $ \pi $ 之间总变差距离的界。
对于恒定步长，推导出 $ V $-一致几何遍历性，并给出平稳分布 $ \pi_\gamma $ 与目标 $ \pi $ 之间 $ V $-总变差距离的界。
对于递减步长，证明了边际分布几乎必然收敛至 $ \pi $，并给出了总变差距离的显式非渐近界。
分析依赖于泛函不等式与漂移条件，特别是利用底层SDE的生成元与半群性质。
引入Lyapunov函数 $ W_{\mathrm{c}} $，并利用指数矩估计控制耦合时间与尾部概率。

实验结果

研究问题

RQ1在恒定步长下，ULA的非渐近收敛界如何随维度 $ d $ 变化？
RQ2在步长 $ \gamma $ 与势函数光滑性下，$ \pi_\gamma $ 与 $ \pi $ 之间总变差距离的显式依赖关系是什么？
RQ3在递减步长下，ULA能否实现在总变差距离下收敛至目标 $ \pi $，其显式界是什么？
RQ4与先前工作相比，收敛速率在高维设置下如何？

主要发现

对于恒定步长，本文建立了 $ \pi_\gamma $ 与 $ \pi $ 之间显式依赖于 $ \gamma $、$ d $ 以及势函数曲率的非渐近 $ V $-总变差界。
在 $ V $-一致遍历性条件下，恒定步长ULA的收敛速率被证明为几何级，当 $ U $ 为强凸函数时，其界在高维下表现良好。
对于递减步长，本文证明了ULA链的边际分布收敛至 $ \pi $，且总变差距离具有显式非渐近界，优于先前结果。
分析得到了维度相关的界，其紧致性优于 [12] 和 [13]，尤其适用于Hessian与梯度增长受控的非对数凹势函数。
本文在收敛界中提供了显式常数，包括对目标测度Poincaré常数与对数Sobolev常数的依赖关系。
本文建立总变差距离在连续时间Langevin扩散中随时间呈指数衰减，并通过耦合与生成元相关论证将其传递至离散ULA。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。