Skip to main content
QUICK REVIEW

[논문 리뷰] Linear Convergence of the Primal-Dual Gradient Method for Convex-Concave Saddle Point Problems without Strong Convexity

Simon S. Du, Wei Hu|arXiv (Cornell University)|2018. 02. 05.
Advanced Optimization Algorithms Research인용 수 50
한 줄 요약

저자들은 바닐라 프라이멀-듀얼 그래디언트 방법이 프라이멀 함수가 강하게 볼록하지 않아도 프라이멀-듀얼 문제의 볼록-오목 안점점에서 선형으로 수렴하며, 결합 행렬 A의 열 전체 랭크가 있을 때 이 성질을 보인다.

ABSTRACT

We consider the convex-concave saddle point problem $\\min_{x}\\max_{y} f(x)+y^\ op A x-g(y)$ where $f$ is smooth and convex and $g$ is smooth and strongly convex. We prove that if the coupling matrix $A$ has full column rank, the vanilla primal-dual gradient method can achieve linear convergence even if $f$ is not strongly convex. Our result generalizes previous work which either requires $f$ and $g$ to be quadratic functions or requires proximal mappings for both $f$ and $g$. We adopt a novel analysis technique that in each iteration uses a "ghost" update as a reference, and show that the iterates in the primal-dual gradient method converge to this "ghost" sequence. Using the same technique we further give an analysis for the primal-dual stochastic variance reduced gradient (SVRG) method for convex-concave saddle point problems with a finite-sum structure.

연구 동기 및 목표

  • 대규모 설정에서 1차 방법으로 볼록-오목 새개점 문제를 해결하는 동기를 제시한다.
  • 프라이멀 강함(강한 볼록성) 없이도, 전체 열랭크 A를 가정할 때 선형 수렴이 가능하다는 것을 보인다.
  • 수렴 분석을 위한 유령 참조 시퀀스(gost 참조 시퀀스)를 사용한 새로운 분석 기법을 제공한다.
  • finite-sum 구조에 대한 프라이멀-듀얼 스토캐스틱 분산 감소 그래디언트(SVRG) 방법으로 분석을 확장한다.

제안 방법

  • f가 매끄럽고 볼록하며, g가 매끄럽고 강하게 볼록한 경우의 f(x) + y^T A x - g(y) 형태의 새개점 문제를 연구한다.
  • 특정 매개변수 선택 하에서 알고리즘 1(프라이멀-듀얼 그래디언트 업데이트)을 사용하고 선형 수렴을 확립한다.
  • 프라이멀 문제의 그래디언트 하강에 해당하는 유령 시퀀스를 도입하여 수렴을 분석한다.
  • P_t = λ a_t + b_t로 정의된 포텐셜 함수에 대해 a_t = ||x_t - x*||, b_t = ||y_t - ∇g^*(Ax_t)||를 두고 기하적 감소를 보인다.
  • 유한 합 문제에 대한 프라이멀-듀얼 SVRG 방법으로 프레임워크를 확장하고 O((n + κ)d log(1/ε))-형 복잡성을 보인다.
  • ε-정확도를 달성하기 위한 반복 복잡도에 대한 코릴러리를 제공한다: O*(log(P_0/ε))

실험 결과

연구 질문

  • RQ1프라이멀 함수 f가 강하게 볼록하지 않아도, g가 강하게 볼록하고 A의 열이 전체 랭크를 가질 때 바닐라 프라이멀-듀얼 그래디언트 방법이 선형 수렴을 달성할 수 있는가?
  • RQ2유한 합 saddle point 문제에 대한 확률적 분산 감소 그래디언트(SVRG) 변형으로 수렴 분석이 어떻게 확장되는가?
  • RQ3스무스성 상수와 A의 condition 수가 선형 수렴 보장 및 스텝 크기 결정에 어떤 역할을 하는가?

주요 결과

  • 완만한 스무스성과 볼록성 가정(f가 ρ-매끄럽고(convex); g가 α-강하게 볼록하고 β-매끄럽다)이며 랭크(A) = d1일 때 프라이멀-듀얼 그래디언트 방법은 (x*, y*)로 선형 수렴한다.
  • 유령-참조 분석은 프라이멀 이터레이가 프라이멀 문제의 그래디언트 하강으로 생성된 유령 시퀀스로 수렴하는 것을 보여주어 프라이멀 강함 없이도 선형 속도를 가능하게 한다.
  • 유한 합 문제의 경우 프라이멀-듀얼 SVRG 방법은 O((n + κ)d log(1/ε)) 반복 복잡도를 달성하여 매끄럽고 강하게 볼록한 목적함수의 표준 SVRG 속도와 일치한다.
  • 실험 결과는 프라이멀-듀얼 그래디언트 방법과 그 SVRG 변형 모두에서 선형 수렴을 확인했고, 조건수가 높을 때 SVRG가 더 빠른 속도를 제공한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.