Skip to main content
QUICK REVIEW

[論文レビュー] High-dimensional MCMC with a standard splitting scheme for the underdamped Langevin diffusion

Pierre Monmarché|arXiv (Cornell University)|Jul 10, 2020
Markov Chains and Monte Carlo Methods参考文献 37被引用数 25
ひとこと要約

本稿は、非摂動的ランジュヴィン拡散のための標準的な2次スプリットリングスキーム(OBABO)に基づく高次元マルコフ連鎖モンテカルロ(MCMC)サンプラーを提案し、非摂動的およびメトロポリス補正付きの両方の連鎖に対して次元に依存しないウォッシャー形式収束と非漸近的収束速度を証明する。滑らかさの異なる仮定の下で、$\sqrt{d}/\varepsilon$、$\sqrt{d/\varepsilon}$、$d^{1/4}/\sqrt{\varepsilon}$ のオーダーの効率的境界を確立し、HMCおよびキネティックランジュヴィンスキームの既知の結果と一致する。

ABSTRACT

The efficiency of a Markov sampler based on the underdamped Langevin diffusion is studied for high dimensional targets with convex and smooth potentials. We consider a classical second-order integrator which requires only one gradient computation per iteration. Contrary to previous works on similar samplers, a dimension-free contraction of Wasserstein distances and convergence rate for the total variance distance are proven for the discrete time chain itself. Non-asymptotic Wasserstein and total variation efficiency bounds and concentration inequalities are obtained for both the Metropolis adjusted and unadjusted chains. \ v{In particular, for the unadjusted chain,} in terms of the dimension $d$ and the desired accuracy $\\varepsilon$, the Wasserstein efficiency bounds are of order $\\sqrt d / \\varepsilon$ in the general case, $\\sqrt{d/\\varepsilon}$ if the Hessian of the potential is Lipschitz, and $d^{1/4}/\\sqrt\\varepsilon$ in the case of a separable target, in accordance with known results for other kinetic Langevin or HMC schemes.

研究の動機と目的

  • 非摂動的ランジュヴィン拡散のための標準的な2次スプリットリングスキームに基づく高次元MCMCサンプラーの開発。
  • 非摂動的およびメトロポリス補正付きの両方の連鎖について、高次元における非漸近的収束速度と効率的境界の確立。
  • 連続時間解析に依存せずに、離散時間マルコフ連鎖そのものがウォッシャー距離に関して次元に依存しない収縮を示すことを証明すること。
  • サンプリング誤差の次元 $d$ と精度 $\varepsilon$ に関する明示的で濃度不等式と境界の提供。
  • 離散時間で直接解析することで、高次元MCMCにおける理論的ギャップを埋め、広く使われているMDスタイルの積分器を直接的に分析すること。

提案手法

  • 非摂動的ランジュヴィンスデのための標準的な2次時間積分スキームであるOBABOスプリットリングスキームを用いる。1ステップあたり1回の勾配計算で十分。
  • 連続時間収束速度に依存せずに、離散時間マルコフ連鎖そのものを直接解析し、ウォッシャー収縮と全変動収束を証明する。
  • モーメントと収縮行動を制御するため、修正されたエネルギー関数 $\varphi_\star$ を用いたリャプノフ関数アプローチを適用する。
  • 不変測度 $\pi$ と連鎖の不変測度 $\pi_\delta$ 間のバイアスをバウンディングするために、$\mathcal{W}_1$ 距離の双対表現を用いる。
  • Lemma 28 および Proposition 34 を用いてモーメント推定と受容確率の境界を導出し、経験的平均のバイアスと分散を制御する。
  • 直交変換後に座標ごとの独立性を活用することで分離可能なターゲットを扱い、次元ごとの解析を可能にする。

実験結果

リサーチクエスチョン

  • RQ1非摂動的ランジュヴィン拡散のための標準的な2次スプリットリングスキーム(OBABO)は、高次元サンプリングにおいて次元に依存しない収束を達成できるか?
  • RQ2非摂動的およびメトロポリス補正付きの両方の連鎖について、次元 $d$ と精度 $\varepsilon$ に応じた非漸近的効率的境界は何か?
  • RQ3連続時間解析に依存せずに、離散時間マルコフ連鎖そのものがウォッシャー距離に関して収縮するかを示せるか?
  • RQ4勾配評価回数と収束速度の観点から、OBABOスキームの計算コストは他のキネティックMCMC手法と比べてどうか?
  • RQ5非摂動的連鎖の平衡状態におけるバイアスは何か?また、$d$ と $\varepsilon$ に対してどのようにスケーリングされるか?

主な発見

  • $m$-凸性と$L$-スムーズ性の仮定の下で、離散時間OBABO連鎖はウォッシャー距離に関して次元に依存しない収縮を示す。
  • 一般状況では非漸近的ウォッシャー効率的境界が $\sqrt{d}/\varepsilon$、$U$ のヘッセ行列がリプシッツ連続である場合は $\sqrt{d/\varepsilon}$、分離可能なターゲットでは $d^{1/4}/\sqrt{\varepsilon}$ となる。
  • 全変動距離は次元に依存しない速度で収束し、収縮とモーメント推定から明示的な境界が導出される。
  • 経験的平均のための濃度不等式はウォッシャー収縮から直接確立され、非漸近的信頼区間の構築が可能になる。
  • $\mathcal{W}_1$ の双対表現を用いて、真のターゲット $\pi$ と連鎖の不変測度 $\pi_\delta$ 間のバイアスがバウンディングされ、明示的な誤差制御が可能になる。
  • 1ステップあたり1回の勾配計算で済み、ヘッセ行列の計算を回避するにもかかわらず、HMCや他のキネティックランジュヴィンスキームと同等の性能を達成する。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。