QUICK REVIEW

[論文レビュー] Convergence Analysis of Proximal Gradient with Momentum for Nonconvex Optimization

Qunwei Li, Yi Zhou|arXiv (Cornell University)|May 14, 2017

Sparse and Compressive Sensing Techniques参考文献 11被引用数 37

ひとこと要約

本稿は、非凸最適化における加速型プロキシマル勾配法（APGnc）の、Kurdyka-Łojasiewicz（KŁ）性質下での最初の厳密な収束解析を提供する。APGncが臨界点に収束し、線形または部分線形の収束速度を達成することを証明している。さらに、動的モーメンタムを備えたAPGnc+を導入し、分散低減型の確率的バージョン（SVRG-APGnc）に対しても線形収束を確立した。これにより、mAPGなどの既存手法に比べて優れた効率性とロバスト性を示した。

ABSTRACT

In many modern machine learning applications, structures of underlying mathematical models often yield nonconvex optimization problems. Due to the intractability of nonconvexity, there is a rising need to develop efficient methods for solving general nonconvex problems with certain performance guarantee. In this work, we investigate the accelerated proximal gradient method for nonconvex programming (APGnc). The method compares between a usual proximal gradient step and a linear extrapolation step, and accepts the one that has a lower function value to achieve a monotonic decrease. In specific, under a general nonsmooth and nonconvex setting, we provide a rigorous argument to show that the limit points of the sequence generated by APGnc are critical points of the objective function. Then, by exploiting the Kurdyka-Łojasiewicz (\KL) property for a broad class of functions, we establish the linear and sub-linear convergence rates of the function value sequence generated by APGnc. We further propose a stochastic variance reduced APGnc (SVRG-APGnc), and establish its linear convergence under a special case of the \KL property. We also extend the analysis to the inexact version of these methods and develop an adaptive momentum strategy that improves the numerical performance.

研究の動機と目的

非凸設定下で、従来の解析が収束速度の結果を欠いていたAPGncアルゴリズムの理論的収束保証を確立すること。
収束速度および計算効率の観点からAPGncとmAPGを比較し、APGncの実用的利点を裏付けること。
APGncの不正確および確率的分散低減型バージョンへの解析を拡張し、数値誤差およびサンプリングノイズ下でもロバスト性を保証すること。
数値的性能を向上させつつ理論的収束性を維持するため、動的モーメンタム戦略を備えたAPGnc+を提案すること。
不正確性および確率性を伴う加速型勾配法におけるKŁ性質の活用に向けた、新たな技術的ツールの開発

提案手法

APGncアルゴリズムは、関数値の減少に基づき、標準的プロキシマル勾配ステップと線形外挿ステップの間で単調な選択を実行し、降下を保証する。
収束解析では、関数値列の部分線形および線形収束速度を確立するために、Kurdyka-Łojasiewicz（KŁ）性質を活用する。
近似誤差が有界であると仮定したAPGncの不正確バージョンを提案し、KŁ仮定の下で収束を証明した。
ミニバッチ勾配を用いて分散を低減し、大規模設定での収束を改善する、分散低減型のSVRG-APGncを導入した。
外挿パラメータを動的に調整することで数値的性能を向上させる、動的モーメンタム戦略を備えたAPGnc+を提案した。
加速、非凸性、不正確性の複合的影響をKŁフレームワーク内で取り扱うための、新たな技術的処理を開発した。

実験結果

リサーチクエスチョン

RQ1一般の非滑らかで非凸な問題に対して、APGncアルゴリズムは臨界点に収束するか？
RQ2Kurdyka-Łojasiewicz（KŁ）性質下で、APGncの収束速度はどのように確立できるか？
RQ3収束速度および計算コストの観点から、APGncとmAPGの性能はどのように比較できるか？
RQ4不正確および確率的バージョンの加速型プロキシマル勾配法において、KŁ性質を効果的に活用できるか？
RQ5APGnc+における動的モーメンタム戦略は、理論的収束保証を損なわずに数値的性能を向上させるか？

主な発見

一般の非滑らかで非凸な設定下で、APGncは、以前の収束保証がなかったにもかかわらず、目的関数の臨界点に収束する。
KŁ性質下では、一般ケースにおいて部分線形収束速度を達成し、KŁ性質の特別なケースでは線形収束速度を達成する。
動的モーメンタムを備えたAPGnc+は、数値実験においてAPGncおよびmAPGを上回り、特に不正確性および確率的設定下で顕著な優位性を示した。
SVRG-APGncはKŁ性質下で線形収束を達成し、非凸加速手法における分散低減の有効性を示した。
不正確APGncおよびSVRG-APGncのバリエーションは、プロキシマル誤差に対してロバストであり、正確な対応物と同様の解に収束した。
確率的アルゴリズムは決定的アルゴリズムよりも誤差に対して感受性が高かったが、APGnc+は中程度の不正確性下でも依然として優れた性能を維持した。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。