Skip to main content
QUICK REVIEW

[論文レビュー] Rapid Mixing of Hamiltonian Monte Carlo on Strongly Log-Concave Distributions

Oren Mangoubi, Aaron Smith|arXiv (Cornell University)|Aug 23, 2017
Markov Chains and Monte Carlo Methods参考文献 21被引用数 71
ひとこと要約

本論文は、強く対数凸なターゲットに対する Hamiltonian Monte Carlo (HMC) の非漸近的混合境界を確立し、理想的な HMC において次元依存なしの混合速度を示し、実用的な leapfrog 実装では勾配評価コストがほぼ最適なスケーリングである O(d^{1/4}) となることを示している。

ABSTRACT

We obtain several quantitative bounds on the mixing properties of the Hamiltonian Monte Carlo (HMC) algorithm for a strongly log-concave target distribution $π$ on $\mathbb{R}^{d}$, showing that HMC mixes quickly in this setting. One of our main results is a dimension-free bound on the mixing of an "ideal" HMC chain, which is used to show that the usual leapfrog implementation of HMC can sample from $π$ using only $\mathcal{O}(d^{\frac{1}{4}})$ gradient evaluations. This dependence on dimension is sharp, and our results significantly extend and improve previous quantitative bounds on the mixing of HMC.

研究の動機と目的

  • Rd 上の強く対数凸分布に対する HMC の混合特性を動機づけ・定量化する。
  • 理想的な HMC ダイナミクスの次元依存なしの混合境界を導出し、それを実際の数値実装へ翻訳する。
  • HMC の性能を Langevin ダイナミクスおよび球歩法と、強凸性の仮定の下で比較する。
  • 未調整および Metropolis 調整済み HMC の各積分器次数に対する勾配/評価コストの境界を提供する。

提案手法

  • 勾配評価とハミルトニアン流を含むランダムマッピングとして HMC をモデル化する。
  • ポテンシャル U に対する強凸性仮定とミッドドリフト条件を設定して混合境界を導出する。
  • 理想的な HMC カーネルの積分時間 T を (m2/M2)^{-1/2} に比例させることで Wasserstein 距離の収束とスペクトルギャップ境界を証明する。
  • 運動量がステップサイズと探索に及ぼす影響を解析するために ODE 比較とカップリング論を用いる。
  • 分離性と正則性仮定の下で、近似 HMC ダイナミクスを一次および高次の積分器へ拡張する。
  • 未調整および Metropolis 調整済みスキームにおいて、勾配評価の観点から計算コストを定量化する。

実験結果

リサーチクエスチョン

  • RQ1HMC は高次元で強く対数凸な標的分布に対してどれくらい速く混合するのか?
  • RQ2理想的 HMC およびその数値実装における非漸近的混合境界の次元依存性と定数はどうなるのか?
  • RQ3数値積分器(次数 k および分離性)は HMC の混合と計算コストにどのような影響を与えるのか?
  • RQ4同様の凸性仮定の下で、HMC の境界は Langevin ダイナミクスおよび球歩法とどのように比較されるのか?

主な発見

  • 理想的 HMC で積分時間 T = (1/2) sqrt(2) sqrt(m2/M2) の場合、水準距離の収縮は Wk(K(x, ·), K(y, ·)) / ||x−y|| ≤ 1 − (m2/M2)^2 / 64 を満たす。
  • スペクトル緩和時間 τrel(K) は理想的なダイナミクスで (M2/m2)^2 / 64 によって上界付けられる。
  • 第一階 Euler 積分器を用いた未調整 HMC は、適切な θ の下で π からのサンプリングを勾配コスト Od(d^{1/2}) で達成する;高次積分器では分離性の下で Od(d^{1/2k}) に改善する。
  • 高次 HMC (k ≥ 2) も緩い仮定の下で、Prokhorov 距離を π に対して ≤ ε にできるコスト N(Qθ, I) = O∗(d^{1/(2k)} ε^{−2/k}); Metropolis 調整付き HMC も同様の保証を、同等のコスト境界で達成できる。
  • 強凸性の下で前処理は m2/M2 の比を小さくし、実務上の性能を改善できる(前処理に関する注記)。
  • これらの結果は、HMC が Langevin(d^{1/2} または d^{1/3} 種類のコスト)および球歩法の境界より有利になり得ることを示している。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。