QUICK REVIEW

[論文レビュー] A Primal-Dual Algorithm for General Convex-Concave Saddle Point Problems

Erfan Yazdandoost Hamedani, Necdet Serhat Aybat|arXiv (Cornell University)|Mar 4, 2018

Sparse and Compressive Sensing Techniques参考文献 26被引用数 46

ひとこと要約

本稿では、一般の凸-凹な鞍点問題における非双線形結合項 $Φ(x,y)$ を持つ場合に、プライマル・デュアル法にモーメンタムを組み込んだアルゴリズムを提案し、$f$ が凸の場合に $Ó(1/k)$ の収束速度、$f$ が強凸で $Ø(x,\cdot)$ が $y$ に関して線形の場合に $Ó(1/k^2)$ の収束速度を達成する。これは、従来の双線形結合に限らない拡張である。本手法はカーネル行列学習において評価され、ミラー・プロックス法や内点法を上回る性能を示した。

ABSTRACT

In this paper we propose a primal-dual algorithm with a momentum term that can be viewed as a generalization of the method proposed by Chambolle and Pock in 2016 to solve saddle point problems defined by a convex-concave function $\mathcal{L}(x,y)=f(x)+\Phi(x,y)-h(y)$ with a general coupling term $\Phi(x,y)$ that is not assumed to be bilinear. Given a saddle point $(x^*,y^*)$, assuming $ abla_y\Phi(\cdot,\cdot)$ is Lipschitz and $ abla_x\Phi(\cdot,y)$ is Lipschitz in $x$ for any fixed $y$, we derive error bounds in terms of $\mathcal{L}(\bar{x}_k,x^*)-\mathcal{L}(y^*,\bar{y}_k)$ for the ergodic sequence $\{\bar{x}_k,\bar{y}_k\}$; in particular, we show $\mathcal{O}(1/k)$ rate that when the problem is merely convex in $x$. Furthermore, assuming $\Phi(x,\cdot)$ is linear in $y$ for each fixed $x$ and $f$ is strongly convex, we can obtain the ergodic convergence rate of $\mathcal{O}(1/k^2)$ - we are not aware of any other work in the related literature showing $\mathcal{O}(1/k^2)$ rate when $\Phi$ is not bilinear. We tested our method for solving kernel matrix learning problem, and compare it against the Mirror-prox algorithm and interior point methods.

研究の動機と目的

凸-凹な鞍点問題における双線形結合項を超える一般化を図るプライマル・デュアル法の開発。
結合関数 $Φ(x,y)$ に対して一般な仮定のもとで、反復列のエルゴディック平均の収束速度の確立。
$f$ が強凸で $Φ(x,\cdot)$ が $y$ に関して線形である場合に $Ó(1/k^2)$ の収束速度を達成すること。これは、非双線形結合においては文献にまだない新規な結果である。
カーネル行列学習におけるアルゴリズムの実験的評価と、ミラー・プロックス法および内点法との比較。

提案手法

アルゴリズムは、チャモベール＝ポック法を非双線形結合に一般化する形で、プライマル・デュアル更新スキームにモーメンタム項を組み込む。
プライマル変数 $x$ とデュアル変数 $y$ に対して、収束を保証するように選ばれたステップサイズを用いたプロキシマル型の更新を行う。
収束のための誤差解析を可能にするために、$\nabla_y\Phi(\cdot,\cdot)$ と固定された $y$ に対する $\nabla_x\Phi(\cdot,y)$ のリプシッツ連続性を仮定する。
最適性ギャップを評価するため、エルゴディック列 $\{\bar{x}_k, \bar{y}_k\}$ は双対ギャップ $\mathcal{L}(\bar{x}_k, y^*) - \mathcal{L}(x^*, \bar{y}_k)$ を用いて分析される。
非双線形結合項を有する鞍点問題として定式化することで、カーネル行列学習に本手法を適用する。
リャプノフ関数のアプローチを用いて収束を解析し、導出された誤差バウンドに至る。

実験結果

リサーチクエスチョン

RQ1プライマル・デュアル法にモーメンタムを組み込んだ場合、非双線形結合項を有する一般の凸-凹な鞍点問題において $Ó(1/k)$ の収束速度を達成できるか？
RQ2$f$ が強凸で $\Phi(x,\cdot)$ が $y$ に関して線形である場合でさえ、双線形性がなくても $Ó(1/k^2)$ の収束速度を達成できるか？
RQ3カーネル行列学習問題において、本手法はミラー・プロックス法や内点法と比較して実際の性能で優れているか？
RQ4非双線形性を考慮した場合、$\Phi(x,y)$ に対してどのような仮定が収束性と収束速度解析を保証するのに十分か？
RQ5非双線形設定において、モーメンタム項が収束の加速に効果的に利用可能か？

主な発見

$f$ が凸で結合項 $\Phi(x,y)$ が弱いリプシッツ条件を満たす場合、エルゴディック列に対して $Ó(1/k)$ の収束速度を達成する。
追加的に $f$ が強凸で $\Phi(x,\cdot)$ が $y$ に関して線形であると仮定すると、$Ó(1/k^2)$ の収束速度を達成する。これは、非双線形結合においては文献にまだ報告のない新規な結果である。
誤差バウンドは双対ギャップ $\mathcal{L}(\bar{x}_k, y^*) - \mathcal{L}(x^*, \bar{y}_k)$ の形で表現され、最適性ギャップを定量化する。
カーネル行列学習において、本手法は実験的に妥当性が確認され、ミラー・プロックス法や内点法を上回る性能を示した。
理論的解析では $\Phi(x,y)$ が双線形である必要がないことが示され、従来のこの制限的仮定に依存する研究を一般化した。
提案手法により、一般の結合項を有するより広範なクラスの鞍点問題にまでプライマル・デュアル法の適用範囲が拡張された。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。