Skip to main content
QUICK REVIEW

[论文解读] Convergence rate bounds for a proximal ADMM with over-relaxation stepsize parameter for solving nonconvex linearly constrained problems

Max L. N. Gonçalves, Jefferson G. Melo|arXiv (Cornell University)|Feb 7, 2017
Sparse and Compressive Sensing Techniques参考文献 26被引用 34
一句话总结

该论文为带有超松弛参数 θ ∈ (0,2) 的近端 ADMM 变体在非凸线性约束问题上建立了 O(ρ⁻²) 的逐点迭代复杂度界。它将收敛速率分析扩展至标准范围 (0, (1+√5)/2) 之外,证明了在 f(非凸、下确界连续)和 g(具有利普希茨连续梯度)的较弱假设下,全局收敛性和复杂度。

ABSTRACT

This paper establishes convergence rate bounds for a variant of the proximal alternating direction method of multipliers (ADMM) for solving nonconvex linearly constrained optimization problems. The variant of the proximal ADMM allows the inclusion of an over-relaxation stepsize parameter belonging to the interval $(0,2)$. To the best of our knowledge, all related papers in the literature only consider the case where the over-relaxation parameter lies in the interval $(0,(1+\sqrt{5})/2)$.

研究动机与目标

  • 解决在非凸设置下,对于超松弛参数 θ > (1+√5)/2 的近端 ADMM 缺乏收敛速率界的问题。
  • 将迭代复杂度分析扩展至 f 为适当、下确界连续,且 g 具有利普希茨连续梯度的非凸问题。
  • 在对惩罚参数 β 和近端项 G、H 的假设更宽松的条件下,提供逐点迭代复杂度界。
  • 通过使用超松弛 ADMM,为更广泛的非凸线性约束优化问题类建立全局收敛性和复杂度。
  • 通过证明在 θ ∈ (0,2) 范围内 O(ρ⁻²) 的复杂度,填补理论空白,该范围此前在非凸问题中未被文献覆盖。

提出的方法

  • 提出一种带有超松弛参数 θ ∈ (0,2) 的近端 ADMM 变体,通过引入近端项 G 和 H 来稳定子问题。
  • 使用非凸 f 的扩展次微分概念,使其在不依赖凸性的情况下也能建立最优性条件。
  • 定义一个包含原始变量和对偶变量迭代的类李雅普诺夫函数,以追踪进展并建立收敛性。
  • 对类李雅普诺夫函数使用错位求和技巧,推导出对偶变量差值范数的界。
  • 应用矩阵范数不等式和谱界(例如 B*B 的 σ₊(B))来控制迭代间的误差传播。
  • 通过平均化论证和证明在前 k 次迭代中存在一个满足 ρ-最优性的良好迭代点,推导出逐点复杂度。

实验结果

研究问题

  • RQ1能否在非凸问题中为超松弛参数 θ > (1+√5)/2 的近端 ADMM 建立收敛速率界?
  • RQ2f、g、β、G、H 和 θ 的哪些条件能确保全局收敛性和 O(ρ⁻²) 的逐点迭代复杂度?
  • RQ3在非凸设置下,与标准 ADMM 相比,包含超松弛参数 θ ∈ (0,2) 如何影响收敛性和复杂度?
  • RQ4能否在不假设 f 凸性的情况下,通过广义次微分将分析扩展至非凸 f?
  • RQ5惩罚参数 β 和近端项 G、H 在确保收敛性和复杂度界方面起什么作用?

主要发现

  • 该论文为带有超松弛参数 θ ∈ (0,2) 的近端 ADMM 变体在非凸设置下建立了 O(ρ⁻²) 的逐点迭代复杂度界。
  • 收敛性分析在 f 为适当、下确界连续,且 g 具有利普希茨连续梯度的假设下成立。
  • 该界在近端 ADMM 的一个子类中实现,其中 β 足够大,G 为任意半正定矩阵,H 为单位矩阵的较大正倍数。
  • 该分析证明了全局收敛至一个满足最优性条件的点,其原始不可行性、对偶不可行性和次梯度违反的残差范数均 ≤ ρ。
  • 该结果将先前的复杂度界扩展至超出范围 θ ∈ (0, (1+√5)/2) 的区域,此前该范围在所有非凸问题文献中均为极限。
  • 证明依赖于一种新颖的李雅普诺夫函数和错位求和技巧,以界定向量对偶迭代的累积误差,从而得出 O(ρ⁻²) 的复杂度。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。