Skip to main content
QUICK REVIEW

[论文解读] Piecewise deterministic simulated annealing

Pierre Monmarché|HAL (Le Centre pour la Communication Scientifique Directe)|Oct 7, 2014
Theoretical and Computational Physics参考文献 19被引用 27
一句话总结

本文提出一种基于 ℝᵈ 上速度跃迁过程的分段确定性模拟退火算法,用于采样吉布斯测度。在一维情形下,推导了低温下从局部极小值逃逸时间的 Eyring–Kramers 型公式,并建立了确保收敛至全局极小值的必要且充分冷却调度条件(类比经典扩散过程),在高维情形下通过一个非最优的充分条件加以推广。

ABSTRACT

Given an energy potential on the Euclidian space, a piecewise deterministic Markov process is designed to sample the corresponding Gibbs measure. In dimension one an Eyring-Kramers formula is obtained for the exit time of the domain of a local minimum at low temperature, and a necessary and sufficient condition is given on the cooling schedule in a simulated annealing algorithm to ensure the process converges to the set of global minima. This condition is similar to the classical one for diffusions and involves the critical depth of the potential. In higher dimension a non optimal sufficient condition is obtained.

研究动机与目标

  • 通过利用具有速度跃迁的分段确定性马氏过程(PDMP),开发一种比 Fokker-Planck 扩散过程更高效的模拟退火替代方法。
  • 分析低温区域下的亚稳态行为,利用一种类似动力学的 PDMP 推导局部极小值的逃逸时间估计。
  • 在一维情形下建立确保收敛至全局极小值的必要且充分冷却调度条件,其形式与经典模拟退火结果类比。
  • 将分析结果推广至高维情形,为同一算法框架下提供收敛性的非最优充分条件。
  • 探讨惯性和路径结构在克服随机优化中能量势垒与熵势垒方面的作用。

提出的方法

  • 在 ℝᵈ × 𝕊ᵈ⁻¹ 上设计一个 PDMP,其动力学由 dXₜ = Yₜdt 和 Yₜ 在单位球面上作为跃迁过程演化所决定,确保跃迁之间为确定性运动。
  • 使用形式为 Lf(x,y) = y∂ₓf(x,y) + λ(x,y)(f(x,−y) − f(x,y)) 的生成元定义无穷小生成元,其中跃迁率 λ 的选择使得不变测度与 e⁻ᵁ⁽ˣ⁾dx ⊗ (δ₁ + δ₋₁)/2 成比例。
  • 实施一个随时间递减的冷却调度 εₜ,将齐次 PDMP 转化为适合模拟退火的非齐次过程。
  • 应用离散时间的 Lyapunov 型论证,通过冷却调度的衰减速率来界定过程分布与目标吉布斯测度之间的总变差距离。
  • 采用拉普拉斯方法与路径近似技术,估计从局部极小值逃逸的概率,特别是在低温区域。
  • 借鉴 [19] 和 [15] 的论证方法,利用积分估计与到平衡距离的指数衰减,推导收敛界。

实验结果

研究问题

  • RQ1能否利用具有速度跃迁的分段确定性马氏过程,在模拟退火中高效采样吉布斯测度?
  • RQ2在一维势能景观中,低温下从局部极小值的逃逸时间分布为何?其与临界势垒深度有何关系?
  • RQ3在使用该 PDMP 的一维模拟退火中,何种冷却调度可确保几乎必然收敛至全局极小值集合?
  • RQ4与扩散动力学相比,速度跃迁过程中惯性的存在如何影响亚稳态行为及从局部极小值的逃逸?
  • RQ5在高维情形下,冷却调度的何种充分条件可保证在此 PDMP 基础的退火框架下收敛至全局极小值?

主要发现

  • 在一维情形下,低温下从局部极小值的逃逸时间满足 Eyring–Kramers 型公式,逃逸率取决于势垒深度。
  • 推导出确保收敛至全局极小值的必要且充分冷却调度条件,其形式与经典扩散过程的条件类比,涉及势能的临界深度 E*。
  • 冷却调度必须足够缓慢衰减,使得 ∫(1/εₜ)dt 发散,以确保在每一温度水平下具有足够的混合时间。
  • 在高维情形下,建立了收敛性的非最优充分条件,依赖于相同的 Lyapunov 论证与衰减速率分析。
  • 过程分布与目标吉布斯测度之间的总变差距离以 O(t⁻ᵞ) 的速率衰减,其中 γ > 0,具体取决于冷却调度参数。
  • 启发式证据表明,当路径结构与惯性有利时,速度跃迁过程可能比扩散过程更高效地克服熵势垒。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。