QUICK REVIEW

[論文レビュー] Smoothed Online Convex Optimization in High Dimensions via Online Balanced Descent

Niangjun Chen, Gautam Goel|arXiv (Cornell University)|Mar 27, 2018

Advanced Bandit Algorithms Research被引用数 34

ひとこと要約

本稿では、スムーズドオンライン凸最適化（SOCO）における次元に依存しない逐次的性能保証を達成するための新規なアルゴリズムフレームワーク、Online Balanced Descent（OBD）を提案する。OBDは、現在のコスト関数の等高線集合への射影によって、スイッチングコストとハイトリングコストのバランスをとる。OBDは局所的ポリハedralコスト関数に対して次元に依存しない競合比 $3 + O(1/\alpha)$ を達成し、次元に依存しないバウンドを有するサブラインアーレジットを達成する。これは、次元が高次元であるSOCO問題に対して、初めての結果である。

ABSTRACT

We study Smoothed Online Convex Optimization, a version of online convex optimization where the learner incurs a penalty for changing her actions between rounds. Given a $\\Omega(\\sqrt{d})$ lower bound on the competitive ratio of any online algorithm, where $d$ is the dimension of the action space, we ask under what conditions this bound can be beaten. We introduce a novel algorithmic framework for this problem, Online Balanced Descent (OBD), which works by iteratively projecting the previous point onto a carefully chosen level set of the current cost function so as to balance the switching costs and hitting costs. We demonstrate the generality of the OBD framework by showing how, with different choices of "balance," OBD can improve upon state-of-the-art performance guarantees for both competitive ratio and regret, in particular, OBD is the first algorithm to achieve a dimension-free competitive ratio, $3 + O(1/\\alpha)$, for locally polyhedral costs, where $\\alpha$ measures the "steepness" of the costs. We also prove bounds on the dynamic regret of OBD when the balance is performed in the dual space that are dimension-free and imply that OBD has sublinear static regret.

研究の動機と目的

次元に依存する競合比の下界 $\Omega(\sqrt{d})$ を示す既存のアルゴリズムに直面する高次元スムーズドオンライン凸最適化（SOCO）における根本的課題に取り組む。
次元依存の性能障壁を克服するため、次元に依存しない性能保証を保証する新しいアルゴリズムフレームワークを導入する。
スイッチングコストとハイトリングコストのバランスを取る新しい射影機構を活用することで、SOCOにおける改善された競合比とレジットバウンドを達成する。
OBDが、行動空間の次元 $d$ に依存しない、サブラインアーレジットとダイナミックレジットの両方のバウンドを同時に達成できることを示す。
統一されたOBDフレームワークを通じて、プライマルおよびデュアル設定の両方で、競合比とレジットの理論的保証を提供する。

提案手法

スイッチングコストとハイトリングコストのバランスを取るために、直前の行動を現在のコスト関数の等高線集合に逐次射影するOBDアルゴリズムを提案する。
強凸なミラー写像 $\Phi$ を用いたポテンシャル関数を用いて、移動コストとコスト関数値のトレードオフを制御する。
プライマル設定では、バランスパラメータによって制御される等高線集合への射影を通じて、ハイトリングコスト $f_t(x_t)$ と移動コスト $\|x_t - x_{t-1}\|$ のバランスを取る。
デュアル設定では、勾配のノルム $\|\nabla f_t(x_t)\|_*$ とデュアル空間におけるスイッチングコストのバランスを取ることで、ダイナミックレジットバウンドを実現する。
バイセクション法を用いて、勾配と移動コストのバランス条件を満たす正しい等高線集合を効率的に求める。
ミラー写像 $\Phi$ に関するブレグマン射影を活用することで、デュアル空間でのバランスアプローチにおける収束性と安定性を保証する。

実験結果

リサーチクエスチョン

RQ1スムーズドオンライン凸最適化のための競合アルゴリズムは、次元に依存しない競合比を高次元設定で達成できるか？
RQ2高次元SOCOにおいてサブラインアーレジットを達成できるコスト関数の条件は何か？また、そのバウンドを次元 $d$ に依存させずに実現できるか？
RQ3プライマルとデュアルのバランスメトリクスの選択が、OBDの競合比とレジットの性能保証に与える影響は何か？
RQ4スイッチングコストとレジットの間にある本質的なトレードオフを考慮しても、OBDが同時に競合比とレジット両方の強力な性能を達成できるか？
RQ5ブレグマン射影とミラー写像を用いることで、SOCOにおけるスイッチングコストとハイトリングコストのバランスに与える理論的影響は何か？

主な発見

OBDは、局所的ポリハedralコスト関数に対して、$\alpha$ がコストの傾きの度合いを表すパラメータであるとき、競合比 $3 + O(1/\alpha)$ を達成し、これは次元 $d$ に依存しない。
連続的に微分可能なコスト関数に対して、デュアル空間でのバランスを用いたOBDは、$L$-制約付きのダイナミックレジットを $\frac{GL}{\eta} + \frac{T\eta}{2m}$ で抑え、これは次元に依存しない。
バランスパラメータ $\eta$ を最適化することで、OBDは $O(\sqrt{T})$ の静的レジットを達成し、スイッチングコストが存在しない場合の既知の下界と一致する。
デュアル空間のOBDバージョンは、オフライン解のハイトリングコストが低い場合にポテンシャル関数が減少することを保証し、非正の1ステップコストを含む総コスト解析を可能にする。
OBDは、高次元SOCOにおいて、次元に依存しない競合比とサブラインアーレジットの両方を同時に達成する最初のアルゴリズムであり、重要な未解決問題を解決する。
理論的解析により、OBDの性能がさまざまなノルムやコスト関数クラスにわたりロバストであることが示され、Bregman散発とミラー写像の強凸性を用いたバウンドが導出されている。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。