QUICK REVIEW

[論文レビュー] Non-Convex Min-Max Optimization: Provable Algorithms and Applications in Machine Learning

Hassan Rafique, Mingrui Liu|arXiv (Cornell University)|Oct 4, 2018

Stochastic Gradient Optimization Techniques参考文献 12被引用数 101

ひとこと要約

本稿では、最小化部が弱凸であり、最大化部が凹である非凸ミニマックス問題に対する、近接的にガイドされた確率的部分勾配法および分散低減手法を提案する。期待値設定および有限和設定の両方において、ほぼ停留在点を求めるための最初の証明可能な計算複雑性を確立し、機械学習における非凸サドルポイント最適化の理論を前進させる。

ABSTRACT

Min-max saddle-point problems have broad applications in many tasks in machine learning, e.g., distributionally robust learning, learning with non-decomposable loss, or learning with uncertain data. Although convex-concave saddle-point problems have been broadly studied with efficient algorithms and solid theories available, it remains a challenge to design provably efficient algorithms for non-convex saddle-point problems, especially when the objective function involves an expectation or a large-scale finite sum. Motivated by recent literature on non-convex non-smooth minimization, this paper studies a family of non-convex min-max problems where the minimization component is non-convex (weakly convex) and the maximization component is concave. We propose a proximally guided stochastic subgradient method and a proximally guided stochastic variance-reduced method for expected and finite-sum saddle-point problems, respectively. We establish the computation complexities of both methods for finding a nearly stationary point of the corresponding minimization problem.

研究の動機と目的

機械学習における非凸ミニマックス問題に対して、期待値または大規模な有限和の設定において、証明可能に効率的なアルゴリズムが不足しているという問題に対処すること。
最小化部が弱凸で、最大化部が凹であるような非凸ミニマックス問題のクラスを研究すること。
このような問題の期待値および有限和の定式化に対して、理論的収束保証を備えた確率的アルゴリズムを開発すること。
これらの設定において、ほぼ停留在点を求めるための計算複雑性バウンズを確立すること。

提案手法

弱凸最小化と凹最大化を伴う期待値型ミニマックス問題に対して、近接的にガイドされた確率的部分勾配法を提案する。
同じ構造的仮定の下で、有限和型ミニマックス問題に対する近接的にガイドされた確率的分散低減手法を導入する。
非凸設定における部分勾配更新の安定化のため、近接正則化を用いることで収束性を向上させる。
有限和設定における収束速度の向上のため、分散低減を伴う確率的近似を採用する。
最小化部の停留性測度に基づいて理論的複雑性バウンズを導出する。
非凸非滑らか最適化の技術を応用し、弱凸性を扱い、近似停留在点への収束を保証する。

実験結果

リサーチクエスチョン

RQ1弱凸最小化と凹最大化を伴う非凸ミニマックス問題において、ほぼ停留在点を求めるための計算複雑性は何か？
RQ2期待値および有限和設定において、収束が保証される確率的アルゴリズムを、このような問題に対して設計できるか？
RQ3近接ガイドは非凸ミニマックス最適化における収束をどのように改善するか？
RQ4有限和型非凸ミニマックス問題における分散低減手法の理論的保証は何か？
RQ5弱凸性の下で、提案手法が最適または近似的最適な複雑性バウンズに達することができるか？

主な発見

近接的にガイドされた確率的部分勾配法は、期待値型ミニマックス問題において、ε-停留在点を求めるための計算複雑性O(1/ε²)を達成する。
近接的にガイドされた確率的分散低減法は、有限和型ミニマックス問題において、nがサンプル数であるとき、複雑性O(n + 1/ε²)を達成する。
両手法とも、弱凸最小化と凹最大化を伴う非凸ミニマックス問題に対して、証明可能な複雑性バウンズを提供する最初の手法である。
理論的分析により、弱凸性および凹性に関する標準的仮定の下で、ほぼ停留在点への収束が確認された。
これらの結果により、分布ロバスト学習や非分解可能な損失最小化といった、挑戦的な機械学習タスクへのミニマックス最適化の適用範囲が拡張された。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。