QUICK REVIEW

[論文レビュー] Log-concave sampling: Metropolis-Hastings algorithms are fast

Raaz Dwivedi, Yuansi Chen|arXiv (Cornell University)|Jan 8, 2018

Markov Chains and Monte Carlo Methods参考文献 53被引用数 88

ひとこと要約

この論文は、強対数凹性の密度からサンプルを取る場合の MALA および MRW の非漸近的混合時間境界を証明し、ウォームスタートから MALA が O(kappa d log(1/delta)) ステップで混合することを示し、ULA を上回る。

ABSTRACT

We consider the problem of sampling from a strongly log-concave density in $\mathbb{R}^d$, and prove a non-asymptotic upper bound on the mixing time of the Metropolis-adjusted Langevin algorithm (MALA). The method draws samples by simulating a Markov chain obtained from the discretization of an appropriate Langevin diffusion, combined with an accept-reject step. Relative to known guarantees for the unadjusted Langevin algorithm (ULA), our bounds show that the use of an accept-reject step in MALA leads to an exponentially improved dependence on the error-tolerance. Concretely, in order to obtain samples with TV error at most $δ$ for a density with condition number $κ$, we show that MALA requires $\mathcal{O} \big(κd \log(1/δ) \big)$ steps, as compared to the $\mathcal{O} \big(κ^2 d/δ^2 \big)$ steps established in past work on ULA. We also demonstrate the gains of MALA over ULA for weakly log-concave densities. Furthermore, we derive mixing time bounds for the Metropolized random walk (MRW) and obtain $\mathcal{O}(κ)$ mixing time slower than MALA. We provide numerical examples that support our theoretical findings, and demonstrate the benefits of Metropolis-Hastings adjustment for Langevin-type sampling algorithms.

研究の動機と目的

R^d 上の強い対数凹性密度からのサンプリングを、 Langevin ベースの MCMC 法を用いて動機付け、分析する。
次元 d、条件数 kappa、許容誤差 delta に関して、MALA と MRW の明示的な非漸近的混合時間境界を提供する。
Metropolis-補正スキームと調整なしの Langevin アルゴリズムを比較して、性能向上を定量化する。
feasible-start および弱対数凹性の設定へ分析を拡張し、実用性を評価する。

提案手法

f が滑らかで強凸な場合、 pi(x) ∝ exp(-f(x)) からのサンプリングのために Metropolis-adjusted Langevin Algorithm (MALA) および Metropolized Random Walk (MRW) を研究する。
全変動距離における明示的な delta-混合時間境界を導出し、MALA が warm start から O(d kappa log(1/delta)) ステップを達成することを示す。
未調整 Langevin アルゴリズム (ULA) と比較し、MRW の境界を O(d kappa^2 log(1/delta)) ステップと提供し、 MH 補正による利得を強調する。
beta-温暖スタートを含む warm-start 分析と、N(x*, L^{-1} I_d) 初期化を含む feasible-start 分析を導入する。
境界における d、kappa、L、m、ステップサイズなど、問題パラメータの依存性を適宜示す。

実験結果

リサーチクエスチョン

RQ1強い対数凹性密度からサンプリングする場合の MALA および MRW の明示的な非漸近的混合時間境界はどのようになるのか？
RQ2Metropolis-Hastings 補正は、次元、条件数、許容度の点で、調整なし Langevin アルゴリズム (ULA) と比べて収束速度にどのような影響を与えるのか？
RQ3warm-start および feasible-start 初期化は、MALA と MRW に対して実用的で多項式時間の混合保証をもたらすことができるか？
RQ4弱対数凹性密度、または勾配情報が部分的にしか利用できない場合にも同様の改善が成り立つか？
RQ5強い対数凹性と弱い対数凹性の設定の双方において、ULA、MRW、MALA の比較スケーリング則はどのようになるか？

主な発見

MALA は強対数凹性ターゲットに対して β-warm スタートから O(d κ log(1/δ)) ステップで混合し、ULA の O(d κ^2 log^2(1/δ)/δ^2) 境界より指数関数的に改善する。
MRW は β-warm スタートから O(d κ^2 log(1/δ)) ステップで混合し、MALA より κ 倍の遅さだが、δ に関しては ULA より指数関数的に改善する。
feasible start μ★ = N(x*, L^{-1} I_d) の場合、MALA は O(d^2 κ log(κ/δ)) ステップ、MRW は O(d^2 κ^2 log^{1.5}(κ/δ)) ステップを達成し、実用的な初期化の利点を確立する。
弱対数凹性密度には、修正された MALA が ULA に対して有利なスケーリングを示し、 δ-混合時間は概ね d^2 L^{1.5} / δ^{1.5}（対数因子を除く）程度。
本論文は、理論的利得を裏付ける数値実験を提供し、Langevin 型サンプラーにおける Metropolis-Hastings 調整の利点を示している。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。