Skip to main content
QUICK REVIEW

[论文解读] Hamiltonian Descent Methods

Chris J. Maddison, Daniel Paulin|arXiv (Cornell University)|Sep 13, 2018
Stochastic Gradient Optimization Techniques参考文献 33被引用 40
一句话总结

作者提出了一类基于离散化的共形哈密顿动力学的一阶优化方法族,通过使用与目标函数的共轭有关的动能,在广泛的凸函数族上实现线性收敛。

ABSTRACT

We propose a family of optimization methods that achieve linear convergence using first-order gradient information and constant step sizes on a class of convex functions much larger than the smooth and strongly convex ones. This larger class includes functions whose second derivatives may be singular or unbounded at their minima. Our methods are discretizations of conformal Hamiltonian dynamics, which generalize the classical momentum method to model the motion of a particle with non-standard kinetic energy exposed to a dissipative force and the gradient field of the function of interest. They are first-order in the sense that they require only gradient computation. Yet, crucially the kinetic gradient map can be designed to incorporate information about the convex conjugate in a fashion that allows for linear convergence on convex functions that may be non-smooth or non-strongly convex. We study in detail one implicit and two explicit methods. For one explicit method, we provide conditions under which it converges to stationary points of non-convex functions. For all, we provide conditions on the convex function and kinetic energy pair that guarantee linear convergence, and show that these conditions can be satisfied by functions with power growth. In sum, these methods expand the class of convex functions on which linear convergence is possible with first-order computation.

研究动机与目标

  • 扩展可通过一阶方法实现线性收敛的凸函数类别。
  • 开发对非光滑或非强凸函数具有鲁棒性的一阶离散化的共形哈密顿动力学。
  • 利用从凸共轭设计的动能来调控收敛性。
  • 给出离散化在何种条件下可线性收敛到极小点的理论保证及条件。

提出的方法

  • 将优化建模为状态为 (x, p) 的共形哈密顿系统,其动力学为 x' = ∇k(p),p' = -∇f(x) - γp。
  • 选择动能 k,使得 k(p) 上界一个以(居中)凸共轭 f_c^*(p) 以实现线性收敛。
  • 分析三种离散化(一个隐式、两个显式),并在凸函数 f 上建立线性收敛的条件。
  • 在特定离散化方案下,证明非凸情形下收敛到驻点。
  • 引入一个类Lyapunov函数 V(x, p) = H(x, p) + β⟨x - x*, p⟩,并推导出能给出线性收敛率的界。
  • 给出一族具有幂增长的动能,其尾部/主体行为与 f 相匹配,以维持固定步长。

实验结果

研究问题

  • RQ1在 f 与动能 k 的配对条件下,共形哈密顿动力学是否能在凸函数上实现线性收敛?
  • RQ2如何通过离散化的连续动力学来保证线性收敛速率,需对 f 和 k 有哪些精确假设?
  • RQ3当 f 非光滑或非强凸时,源自哈密顿下降的一阶方法在固定步长下能否收敛?
  • RQ4凸共轭在塑造动能映射以改善优化条件方面起到怎样的作用?

主要发现

  • 当 k(p) 上界 f 的居中凸共轭时,连续时间的哈密顿下降实现线性收敛。
  • 三种离散化(一个隐式、两个显式)在与之相应的对 f 和 k 的假设下实现线性收敛。
  • 存在具有幂增长的动能,使得对于具有不同尾部/主体行为的函数也能实现线性收敛。
  • 在正确的 k–f 配对下,可以在不做自适应的情况下使用固定步长并保持线性收敛。
  • 使用 V(x, p) 的基于萊雅普諾夫的分析提供了一个可实现的途径来量化并保证收缩率。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。