Skip to main content
QUICK REVIEW

[論文レビュー] Approximation Methods for Bilevel Programming

Saeed Ghadimi, Mengdi Wang|arXiv (Cornell University)|Feb 6, 2018
Advanced Optimization Algorithms Research参考文献 13被引用数 65
ひとこと要約

この論文は、強凸な内部問題を持つ二重階層問題に対して決定論的および確率的近似アルゴリズムを開発し、様々な外部目的の凸性の下で有限時間の収束/複雑性解析を提供し、外延的に改善された速度を持つ加速変種を導入します。

ABSTRACT

In this paper, we study a class of bilevel programming problem where the inner objective function is strongly convex. More specifically, under some mile assumptions on the partial derivatives of both inner and outer objective functions, we present an approximation algorithm for solving this class of problem and provide its finite-time convergence analysis under different convexity assumption on the outer objective function. We also present an accelerated variant of this method which improves the rate of convergence under convexity assumption. Furthermore, we generalize our results under stochastic setting where only noisy information of both objective functions is available. To the best of our knowledge, this is the first time that such (stochastic) approximation algorithms with established iteration complexity (sample complexity) are provided for bilevel programming.

研究の動機と目的

  • 内問題が強凸かつ滑らかである二階層プログラミングの研究動機を喚起する。
  • 有限時間収束を保証する近似アルゴリズムを開発する。
  • 外部目的が凸である場合に収束を改善する加速的バリアントを提供する。
  • ノイズのある勾配/ヘシアン情報を用いた確率設定へ拡張する。
  • 凸性・強凸性・非凸性を問わず、反復回数・サンプル複雑性の保証を確立する。

提案手法

  • BA (Bilevel Approximation) 法を導入し、内側 y-反復と外側 x-ステップを、内問題の隠微分により定義される勾配近似 bar\nabla f を用いて交互に行う。
  • 勾配近似 bar{∇}f(x; y) = ∇_x f(x; y) - M(x,y) ∇_y f(x;y) を定義し、M(x,y) = ∇_{xy}^2 g(x,y) [∇_{yy}^2 g(x,y)]^{-1}。
  • 勾配誤差境界を証明する: ||bar{∇}f(x; ϱ) - ∇ f(x; y^*(x))|| ≤ C ||y^*(x) - y|| を満たし、y^*(x) と ∇f のリプシッツ性を確立する。
  • 内側ループの収束を、β_t = 2/(μ_g + L_g) による勾配降下法で g を更新することで提供する。
  • 外部更新は近位型のステップであり、 x_{k+1} = argmin_{u ∈ X} { ⟨bar{∇}f(x_k; ϱ_k), u⟩ + (1/(2 α_k)) ||u - x_k||^2 }。
  • f の異なる凸性仮定(強凸・凸・非凸)下での複雑度結果を導く。

実験結果

リサーチクエスチョン

  • RQ1内問題が強凸である場合の二階層問題の有限時間収束率はどうなるか。
  • RQ2外部目的の凸性は二階層近似法の反復複雑度にどう影響するか。
  • RQ3凸外部目的を持つ場合に、加速的バリアントは収束率を改善できるか。
  • RQ4勾配/ヘシアンがノイズを含む場合の確率的複雑度保証は何か。
  • RQ5ノイズのある一次/二次情報を用いる確率的二階層問題へこれらの結果をどう拡張できるか。

主な発見

  • 決定論的 BA 法は、f および g の両方が強凸の場合、GC(f, ε) = HC(g, ε) = O(log(1/ε)) および GC(g, ε) = O(log^2(1/ε)) を達成する。
  • f が凸の場合、BA 法は GC(f, ε) = HC(g, ε) = O(1/ε) および GC(g, ε) = O(1/ε^{5/4}) を与える;f が凹である可能性がある場合でも、GC(f, ε) = HC(g, ε) = O(1/ε) および GC(g, ε) = O(1/ε^{5/4})。
  • 加速的 BA(ABA)法は凸外部目的に対して改善された速度を示し、GC(f, ε) = HC(g, ε) = O(1/√ε) および GC(g, ε) = O(1/ε^{3/4})。
  • 確率的バリアントは、f および g が強凸のとき全体のサンプル複雑度 SGC(f, ε) = O(1/ε) および SGC(g, ε) = O(1/ε^2) で、SHC(g, ε) = O((1/ε) log(1/ε)) を与える。
  • f が強い凸ではない場合、確率的な速度は SGC(f, ε) = O(1/ε^2)、SGC(g, ε) = O(ε^{-4})、SHC(g, ε) = O((1/ε^2) log(1/ε)) に悪化する。
  • f が可能性として非凸の場合の確率的速度は SGC(f, ε) = O(1/ε^2)、SGC(g, ε) = O(1/ε^3)、SHC(g, ε) = O((1/ε^2) log(1/ε))。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。