Skip to main content
QUICK REVIEW

[论文解读] Non-asymptotic convergence analysis for the Unadjusted Langevin Algorithm

Alain Durmus, Miljko Erić|SPIRE - Sciences Po Institutional REpository|Jul 17, 2015
Markov Chains and Monte Carlo Methods参考文献 33被引用 96
一句话总结

本文在总变差距离下为非调整Langevin算法(ULA)提供了非渐近收敛界,分析了恒定步长和递减步长两种情形。研究建立了针对高维目标分布采样的维度相关收敛速率,通过量化势函数光滑性与曲率对采样精度与效率的影响,改进了先前工作。

ABSTRACT

In this paper, we study a method to sample from a target distribution $π$ over $\mathbb{R}^d$ having a positive density with respect to the Lebesgue measure, known up to a normalisation factor. This method is based on the Euler discretization of the overdamped Langevin stochastic differential equation associated with $π$. For both constant and decreasing step sizes in the Euler discretization, we obtain non-asymptotic bounds for the convergence to the target distribution $π$ in total variation distance. A particular attention is paid to the dependency on the dimension $d$, to demonstrate the applicability of this method in the high dimensional setting. These bounds improve and extend the results of (Dalalyan 2014).

研究动机与目标

  • 为非调整Langevin算法(ULA)在总变差距离下提供非渐近、可计算的收敛界。
  • 分析收敛速率对维度 $ d $、步长 $ \gamma $ 以及势函数 $ U $ 光滑性特征的依赖关系。
  • 通过在高维设置下为恒定步长和递减步长提供更紧的界,拓展现有结果。
  • 在较弱条件下建立对目标分布 $ \pi $ 的收敛性,包括对递减步长下非齐次马尔可夫链的收敛。

提出的方法

  • 本文使用过阻尼Langevin SDE $ \mathrm{d}Y_t = -\nabla U(Y_t)\mathrm{d}t + \sqrt{2}\mathrm{d}B_t^d $ 的Euler-Maruyama半离散化方法定义ULA马尔可夫链。
  • 应用反射耦合技术与基于耦合的论证方法,推导出ULA链的分布与目标测度 $ \pi $ 之间总变差距离的界。
  • 对于恒定步长,推导出 $ V $-一致几何遍历性,并给出平稳分布 $ \pi_\gamma $ 与目标 $ \pi $ 之间 $ V $-总变差距离的界。
  • 对于递减步长,证明了边际分布几乎必然收敛至 $ \pi $,并给出了总变差距离的显式非渐近界。
  • 分析依赖于泛函不等式与漂移条件,特别是利用底层SDE的生成元与半群性质。
  • 引入Lyapunov函数 $ W_{\mathrm{c}} $,并利用指数矩估计控制耦合时间与尾部概率。

实验结果

研究问题

  • RQ1在恒定步长下,ULA的非渐近收敛界如何随维度 $ d $ 变化?
  • RQ2在步长 $ \gamma $ 与势函数光滑性下,$ \pi_\gamma $ 与 $ \pi $ 之间总变差距离的显式依赖关系是什么?
  • RQ3在递减步长下,ULA能否实现在总变差距离下收敛至目标 $ \pi $,其显式界是什么?
  • RQ4与先前工作相比,收敛速率在高维设置下如何?

主要发现

  • 对于恒定步长,本文建立了 $ \pi_\gamma $ 与 $ \pi $ 之间显式依赖于 $ \gamma $、$ d $ 以及势函数曲率的非渐近 $ V $-总变差界。
  • 在 $ V $-一致遍历性条件下,恒定步长ULA的收敛速率被证明为几何级,当 $ U $ 为强凸函数时,其界在高维下表现良好。
  • 对于递减步长,本文证明了ULA链的边际分布收敛至 $ \pi $,且总变差距离具有显式非渐近界,优于先前结果。
  • 分析得到了维度相关的界,其紧致性优于 [12] 和 [13],尤其适用于Hessian与梯度增长受控的非对数凹势函数。
  • 本文在收敛界中提供了显式常数,包括对目标测度Poincaré常数与对数Sobolev常数的依赖关系。
  • 本文建立总变差距离在连续时间Langevin扩散中随时间呈指数衰减,并通过耦合与生成元相关论证将其传递至离散ULA。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。