QUICK REVIEW

[論文レビュー] Randomized Methods for Saddle Point Computation

Cong D. Dang, Guanghui Lan|arXiv (Cornell University)|Sep 30, 2014

Stochastic Gradient Optimization Techniques被引用数 2

ひとこと要約

本稿では、複数の凸集合から構成される双対可能領域を有する鞍点問題に対する確率的プライマルデュアルアルゴリズムを提案する。各反復で1つのランダムに選択された双対部分問題を解き、新たな終了基準を用いることで、強い凸性、有界領域、初期距離の推定値を必要とせず、一般の問題ではO(1/N)、滑らかな双線形問題ではO(1/N²)の収束速度を達成する。

ABSTRACT

In this paper, we present novel randomized algorithms for solving saddle point problems whose dual feasible region is given by the direct product of many convex sets. Our algorithms can achieve an ${\cal O}(1/N)$ and ${\cal O}(1/N^2)$ rate of convergence, respectively, for general bilinear saddle point and smooth bilinear saddle point problems based on a new prima-dual termination criterion, and each iteration of these algorithms needs to solve only one randomly selected dual subproblem. Moreover, these algorithms do not require strongly convex assumptions on the objective function and/or the incorporation of a strongly convex perturbation term. They do not necessarily require the primal or dual feasible regions to be bounded or the estimation of the distance from the initial point to the set of optimal solutions to be available either. We show that when applied to linearly constrained problems, RPDs are equivalent to certain randomized variants of the alternating direction method of multipliers (ADMM), while a direct extension of ADMM does not necessarily converge when the number of blocks exceeds two.

研究の動機と目的

合成された双対可能領域を有する鞍点問題を解くための効率的な確率的アルゴリズムの開発。
強い凸性や摂動項に依存せずに、具体的にはO(1/N)およびO(1/N²)の収束速度を達成すること。
プライマルまたは双対の可能領域が有界である必要なし、最適解集合までの初期距離の推定値を必要としないこと。
線形制約付き設定において、提案された確率的プライマルデュアル手法と確率的ADMM変種との等価性を確立すること。
ブロック数が2つを超過する場合、標準ADMMが収束しない理由を明らかにし、代替手法の必要性を強調すること。

提案手法

各反復で、一様にランダムに選択された1つの双対部分問題を解くことで、1ステップあたりの計算コストを低減する。
最適解集合の知識を必要とせず収束を導くために、新たなプライマルデュアル終了基準を導入する。
目的関数の強い凸性を仮定せず、摂動項を追加しない。
プライマルまたは双対の可能領域が無限大であっても適用可能であるように設計されている。
線形制約付き問題に適用した場合、フレームワークは確率的ADMM変種と等価であることが示された。
凸性と問題構造にのみ依存する最小限の仮定の下で収束解析が行われた。

実験結果

リサーチクエスチョン

RQ1強い凸性を仮定せず、部分問題の確率的選択によって、一般の鞍点問題でO(1/N)およびO(1/N²)の収束速度を達成できるか？
RQ2最適解集合の事前知識がなくとも収束を保証するプライマルデュアル終了基準をどのように設計できるか？
RQ3線形制約付き問題において、提案された確率的プライマルデュアル手法と確率的ADMM変種との関係は何か？
RQ4標準ADMMがブロック数が2つを超えると収束しない理由は何か？また、ランダム化によってこの制限を克服できるか？
RQ5有界な可能領域や初期距離の推定値が存在しないという最小限の仮定のもとで、収束をどの程度保証できるか？

主な発見

提案された確率的プライマルデュアルアルゴリズムは、一般の双線形鞍点問題に対してO(1/N)の収束速度を達成する。
滑らかな双線形鞍点問題では、O(1/N²)の改善された収束速度を達成する。
目的関数の強い凸性や強力な凸性を付加する摂動項の追加は不要である。
プライマルまたは双対の可能領域が無限大であっても、アルゴリズムは収束を保つ。
初期点から最適解集合までの距離の推定値を必要としない。
線形制約付き問題に適用した場合、確率的プライマルデュアル手法は確率的ADMM変種と等価である一方で、標準ADMMはブロック数が2つを超えると収束しない。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。