Skip to main content
QUICK REVIEW

[論文レビュー] Efficient Algorithms for Smooth Minimax Optimization

Kiran Koshy Thekumparampil, Prateek Jain|arXiv (Cornell University)|Jul 2, 2019
Sparse and Compressive Sensing Techniques被引用数 53
ひとこと要約

本稿では、ミラー・プロックスとネステロフの加速勾配降下法(AGD)を組み合わせることで、滑らかなミニマックス最適化のための効率的な1次元アルゴリズムを提案する。強凸性を持つ $g(\cdot,y)$ に対して、グローバル収束速度 $\widetilde{O}(1/k^2)$ を達成し、不正確なプロキシマル点法を用いて非凸性を持つ $g(\cdot,y)$ に対しても $\widetilde{O}(1/k^{1/3})$ を達成する。これは先行研究のレートを顕著に改善する。

ABSTRACT

This paper studies first order methods for solving smooth minimax optimization problems $\min_x \max_y g(x,y)$ where $g(\cdot,\cdot)$ is smooth and $g(x,\cdot)$ is concave for each $x$. In terms of $g(\cdot,y)$, we consider two settings -- strongly convex and nonconvex -- and improve upon the best known rates in both. For strongly-convex $g(\cdot, y), \forall y$, we propose a new direct optimal algorithm combining Mirror-Prox and Nesterov's AGD, and show that it can find global optimum in $\widetilde{O}\left(1/k^2 ight)$ iterations, improving over current state-of-the-art rate of $O(1/k)$. We use this result along with an inexact proximal point method to provide $\widetilde{O}\left(1/k^{1/3} ight)$ rate for finding stationary points in the nonconvex setting where $g(\cdot, y)$ can be nonconvex. This improves over current best-known rate of $O(1/k^{1/5})$. Finally, we instantiate our result for finite nonconvex minimax problems, i.e., $\min_x \max_{1\leq i\leq m} f_i(x)$, with nonconvex $f_i(\cdot)$, to obtain convergence rate of $O(m^{1/3}\sqrt{\log m}/k^{1/3})$.

研究の動機と目的

  • 滑らかで $g(x,\cdot)$ が凹関数である $\min_x \max_y g(x,y)$ のような滑らかなミニマックス問題に対して、より高速な1次元手法を開発すること。
  • すべての $y$ に対して $g(\cdot,y)$ が強凸である場合の収束速度を向上させること。
  • $g(\cdot,y)$ が非凸である可能性がある非凸設定へと、改善されたレートを拡張すること。
  • 非凸関数 $f_i$ を持つ有限ミニマックス問題 $\min_x \max_{1\leq i\leq m} f_i(x)$ に対して、結果を具体化すること。

提案手法

  • 強凸性を持つ $g(\cdot,y)$ の場合に適した、ミラー・プロックスとネステロフのAGDを組み合わせた新しい直接的最適アルゴリズムを提案する。
  • 非凸性を持つ $g(\cdot,y)$ を取り扱うために、提案アルゴリズムを不正確なプロキシマル点法のサブルーチンとして用いる。
  • 加速とミラー降下の原則を活用して、強凸性設定における収束速度 $\widetilde{O}(1/k^2)$ を確立する。
  • 不正確なプロキシマル点フレームワークにおける誤差を精密に制御することで、非凸設定における停留在点の探索に対する $\widetilde{O}(1/k^{1/3})$ レートを導出する。
  • 滑らかさと凹関数性の仮定を $g(x,\cdot)$ に、$g(\cdot,y)$ に凸性を仮定することで、タイトな複雑度バウンズを導出する。

実験結果

リサーチクエスチョン

  • RQ1すべての $y$ に対して $g(\cdot,y)$ が強凸である場合に、$O(1/k)$ よりも速い収束速度を達成できるか?
  • RQ2凸最適化から得た加速手法を、より良いレートを達成するミニマックス設定へと拡張できるか?
  • RQ3非凸的滑らかなミニマックス問題において、停留在点を求める最適な収束速度は何か?
  • RQ4非凸成分を含む有限ミニマックス問題において、提案手法は関数の数 $m$ に対してどのようにスケーリングするか?

主な発見

  • 提案アルゴリズムは、強凸性を持つ $g(\cdot,y)$ を持つ滑らかなミニマックス問題に対して、$\widetilde{O}(1/k^2)$ のグローバル収束速度を達成し、先行研究の $O(1/k)$ レートを上回る。
  • 提案アルゴリズムを不正確なプロキシマル点法に組み合わせることで、非凸設定における停留在点探索の収束速度を $\widetilde{O}(1/k^{1/3})}$ に向上させ、先行研究の $O(1/k^{1/5})$ レートを顕著に上回る。
  • 非凸関数 $f_i$ を持つ有限ミニマックス問題 $\min_x \max_{1\leq i\leq m} f_i(x)$ に対して、収束速度 $O(m^{1/3}\sqrt{\log m}/k^{1/3})$ を達成する。
  • 結果から、凸最適化における加速技術が滑らかさと凹関数性の仮定の下でミニマックス設定に効果的に適応可能であることが示された。
  • 不正確なプロキシマル点反復における近似誤差を巧みにバランスさせることで、タイトな複雑度バウンズを確立した。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。