QUICK REVIEW

[論文レビュー] Gradient Methods for Submodular Maximization

Hamed Hassani, Mahdi Soltanolkotabi|arXiv (Cornell University)|Aug 13, 2017

Stochastic Gradient Optimization Techniques参考文献 26被引用数 28

ひとこと要約

この論文は、凸制約のもとで連続的サブモジュラー関数を最大化するための投影勾配上昇法が、強力な近似保証を提供することを確立している。単調でDR-サブモジュラーな関数のすべての固定点が、グローバル最適解の1/2近似を与えることを証明し、確率的／投影勾配法が$\epsilon$の誤差内で$\text{OPT}/2$に収束することを示し、$\mathcal{O}(1/\epsilon^2)$回の反復で実現可能である。これにより、連続的リラクゼーションを用いた確率的・離散的サブモジュラー問題の効率的最適化が可能になる。

ABSTRACT

In this paper, we study the problem of maximizing continuous submodular functions that naturally arise in many learning applications such as those involving utility functions in active learning and sensing, matrix approximations and network inference. Despite the apparent lack of convexity in such functions, we prove that stochastic projected gradient methods can provide strong approximation guarantees for maximizing continuous submodular functions with convex constraints. More specifically, we prove that for monotone continuous DR-submodular functions, all fixed points of projected gradient ascent provide a factor $1/2$ approximation to the global maxima. We also study stochastic gradient and mirror methods and show that after $\mathcal{O}(1/ε^2)$ iterations these methods reach solutions which achieve in expectation objective values exceeding $(\frac{ ext{OPT}}{2}-ε)$. An immediate application of our results is to maximize submodular functions that are defined stochastically, i.e. the submodular function is defined as an expectation over a family of submodular functions with an unknown distribution. We will show how stochastic gradient methods are naturally well-suited for this setting, leading to a factor $1/2$ approximation when the function is monotone. In particular, it allows us to approximately maximize discrete, monotone submodular optimization problems via projected gradient descent on a continuous relaxation, directly connecting the discrete and continuous domains. Finally, experiments on real data demonstrate that our projected gradient methods consistently achieve the best utility compared to other continuous baselines while remaining competitive in terms of computational effort.

研究の動機と目的

連続的サブモジュラー関数を最大化する勾配ベースの手法の経験的成功に対する理論的裏付けを提供すること。
凸制約の下で非凸的・サブモジュラーな目的関数に対して、投影勾配上昇法の近似保証を確立すること。
大規模またはノイズのあるサブモジュラー最適化のため、これらの保証を確率的およびミラー降下の変種に拡張すること。
多変数拡張関数への投影勾配降下が、プロバイブルに良い解をもたらすことを示すことにより、離散的および連続的サブモジュラー最適化を橋渡しすること。
$L_2$、$L_*$、およびサブモジュラー比$\gamma$に関する滑らかさの依存関係を考慮した収束速度の分析。

提案手法

有界な凸集合$\mathcal{K}$上での連続的・単調的・DR-サブモジュラー関数に対する投影勾配上昇法を用いる。
このような関数のすべての定常点が、グローバル最適解の$1/2$近似を与えることを証明するが、関数は非凸である。
不偏勾配推定値を用いた確率的勾配降下を適用し、$\mathcal{O}(L_2/\epsilon + \sigma^2/\epsilon^2)$回の反復で$\text{OPT}/2 - \epsilon$に収束することを示す。
Bregman発散を用いたミラー降下を導入し、同じ近似に対して$\mathcal{O}(L_*/\epsilon + \sigma^2/\epsilon^2)$回の反復を達成する。
滑らかさと弱いDR-サブモジュラー性（パラメータ$\gamma$で定義）を用いて、弱いサブモジュラー関数に対して$1/2$の保証を$\gamma^2/(1+\gamma^2)$に一般化する。
強い凸性を持つポテンシャル関数$\Phi$を活用し、Bregman発散と期待される非最適性を用いて収束境界を導出する。

実験結果

リサーチクエスチョン

RQ1投影勾配法は、凸制約のもとで連続的サブモジュラー関数を最大化する際に、保証された近似保証を提供できるか？
RQ2連続的サブモジュラー最大化における確率的投影勾配上昇法の収束速度はどの程度か？
RQ3弱いサブモジュラー関数におけるサブモジュラー比$\gamma$は、近似品質にどのように影響するか？
RQ4$L_2$に基づく勾配法と比較して、Bregman発散を用いたミラー降下は滑らかさパラメータにおいてより優れた収束を達成できるか？
RQ5連続的勾配法を、多変数拡張関数を用いたリラクゼーションによって、離散的サブモジュラー最適化問題をどの程度正確に近似できるか？

主な発見

有界な凸集合$\mathcal{K}$上での単調で連続的DR-サブモジュラー関数のすべての固定点が、グローバル最大値の$1/2$近似を与える。
小さなステップサイズ（勾配フロー）を用いた投影勾配上昇法は、$1/2$近似解に収束する。
確率的投影勾配上昇法は、期待される目的関数値が$\text{OPT}/2 - \epsilon$以上になるように、$\mathcal{O}(L_2/\epsilon + \sigma^2/\epsilon^2)$回の反復で収束する。
同じ$\text{OPT}/2 - \epsilon$の保証を達成するため、投影ミラー上昇法は$\mathcal{O}(L_*/\epsilon + \sigma^2/\epsilon^2)$回の反復を要するが、$L_*$は$L_2$よりも著しく小さい場合がある。
サブモジュラー比$\gamma$を有する弱いDR-サブモジュラー関数に対しては、近似保証が$\gamma^2/(1 + \gamma^2)$に一般化される。これは$1/2$の結果を一般化する。
この手法により、多変数拡張関数の連続的リラクゼーションを用いて、離散的単調サブモジュラー最適化問題を効率的に近似できる。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。