Skip to main content
QUICK REVIEW

[논문 리뷰] Approximation Methods for Bilevel Programming

Saeed Ghadimi, Mengdi Wang|arXiv (Cornell University)|2018. 02. 06.
Advanced Optimization Algorithms Research참고 문헌 13인용 수 65
한 줄 요약

본 논문은 내부 문제가 강하게 볼록한 bilevel 최적화 문제에 대해 결정적 및 확률적 근사 알고리즘을 제시하고, 다양한 외부 목표의 볼록성 하에서 유한 시간 수렴/복잡도 분석을 제공하며, 수렴 속도를 개선한 가속 변형을 도입한다.

ABSTRACT

In this paper, we study a class of bilevel programming problem where the inner objective function is strongly convex. More specifically, under some mile assumptions on the partial derivatives of both inner and outer objective functions, we present an approximation algorithm for solving this class of problem and provide its finite-time convergence analysis under different convexity assumption on the outer objective function. We also present an accelerated variant of this method which improves the rate of convergence under convexity assumption. Furthermore, we generalize our results under stochastic setting where only noisy information of both objective functions is available. To the best of our knowledge, this is the first time that such (stochastic) approximation algorithms with established iteration complexity (sample complexity) are provided for bilevel programming.

연구 동기 및 목표

  • 내부 문제가 강하게 볼록하고 매끄러운 경우의 bilevel 프로그래밍 연구의 필요성을 동기화한다.
  • 유한 시간 수렴이 보장되는 bilevel 문제 해결을 위한 근사 알고리즘을 개발한다.
  • 외부 목표가 볼록할 때 수렴을 개선하는 가속 변형을 제공한다.
  • 노이즈가 있는 기울기/헤시안 정보를 포함하는 확률적 설정으로 결과를 확장한다.
  • 볼록, 강하게 볼록, 비볼록 외부 목적에 걸친 반복 및 샘플 복잡도 보장을 확립한다.

제안 방법

  • BA (Bilevel Approximation) 방법을 도입하여 내부 y 반복과 외부 x 단계를 기울기 근사를 사용해 교대로 수행한다 2 bar\nabla f 정의는 내부 문제의 암시적 미분에 의해 이루어진다.
  • bar{∇}f(x; y) = ∇_x f(x; y) - M(x,y) ∇_y f(x;y) 와 M(x,y) = ∇_{xy}^2 g(x,y) [∇_{yy}^2 g(x,y)]^{-1} 로 명시적으로 정의한다.
  • 그래디언트 오차 한계 ||bar{∇}f(x; ϟ) - ∇ f(x; y^*(x))|| ≤ C ||y^*(x) - y|| 를 증명하고, y^*(x) 및 ∇f 의 리프시츠 특성을 확립한다.
  • β_t = 2/(μ_g + L_g) 인 스텝으로 g에 대한 그래디언트 하강으로 y를 업데이트하는 내부 루프 수렴을 제공한다.
  • 외부 업데이트는 프록시(Proximal) 유형의 스텝이다: x_{k+1} = argmin_{u ∈ X} { ⟨bar{∇}f(x_k; ϟ_k), u⟩ + (1/(2 α_k)) ||u - x_k||^2 }.
  • f의 서로 다른 볼록성 가정(강하게 볼록, 볼록, 비볼록)에 따른 복잡도 결과를 도출한다.

실험 결과

연구 질문

  • RQ1내부 문제가 강하게 볼록한 경우 bilevel 문제의 유한 시간 수렴 속도는 어느 정도인가?
  • RQ2외부 목표의 볼록성이 bilevel 근사 방법의 반복 복잡도에 어떤 영향을 미치는가?
  • RQ3외부 객체가 볼록할 때 수렴 속도를 개선하는 가속 변형이 존재하는가?
  • RQ4그라디언트/헤시안이 노이즈를 갖는 경우 확률적 복잡도 보장은 어떻게 되는가?
  • RQ5노이즈가 있는 1차/2차 정보로 확률적 bilevel 문제로 결과를 확장할 수 있는가?

주요 결과

  • 결정적 BA 방법은 f와 g가 모두 강하게 볼록할 때 GC(f, ε) = HC(g, ε) = O(log(1/ε)) 및 GC(g, ε) = O(log^2(1/ε))를 달성한다.
  • f가 볼록한 경우 BA 방법은 GC(f, ε) = HC(g, ε) = O(1/ε) 및 GC(g, ε) = O(1/ε^{5/4})를 얻고, f가 가능하면 비볼록인 경우에도 GC(f, ε) = HC(g, ε) = O(1/ε) 및 GC(g, ε) = O(1/ε^{5/4})를 달성한다.
  • 가속화된 BA(ABA) 방법은 외부 목표가 볼록일 때 더 좋은 속도를 제공하여, GC(f, ε) = HC(g, ε) = O(1/√ε) 및 GC(g, ε) = O(1/ε^{3/4})를 얻는다.
  • 확률적 변형은 f와 g가 강하게 볼록한 경우 SHC(g, ε) = O((1/ε) log(1/ε))와 SGC(g, ε) = O(1/ε^2)인 전체 샘플 복잡도 SGC(f, ε) = O(1/ε) 를 달성한다.
  • f가 단지 볼록한 경우 확률적 속도는 SGC(f, ε) = O(1/ε^2), SGC(g, ε) = O(ε^{-4}), SHC(g, ε) = O((1/ε^2) log(1/ε))로 악화된다.
  • 가능한 비볼록 f의 경우 확률적 속도는 SGC(f, ε) = O(1/ε^2), SGC(g, ε) = O(1/ε^3), SHC(g, ε) = O((1/ε^2) log(1/ε))이다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.