QUICK REVIEW

[論文レビュー] Dimensionally Tight Bounds for Second-Order Hamiltonian Monte Carlo

Oren Mangoubi, Nisheeth K. Vishnoi|arXiv (Cornell University)|Feb 24, 2018

Markov Chains and Monte Carlo Methods被引用数 28

ひとこと要約

この論文は、強い対数凸性を持つ分布からのサンプリングにおいて、ヘッセ行列に弱い3階正則性条件を課した場合の2次HMCにおける勾配評価回数について、次元的にタイトなO*(d^{1/4})の境界を確立する。著者らは、従来のリプシッツヘッセ行列に基づく境界よりも高速な収束を可能にする、新たな正則性仮定を導入し、特に非一貫性のあるデータを用いたベイズ回帰分析において顕著な改善を示す。シミュレーションを通じて、精度と勾配効率の両面で優れた性能を確認した。

ABSTRACT

Hamiltonian Monte Carlo (HMC) is a widely deployed method to sample from high-dimensional distributions in Statistics and Machine learning. HMC is known to run very efficiently in practice and its popular second-order "leapfrog" implementation has long been conjectured to run in $d^{1/4}$ gradient evaluations. Here we show that this conjecture is true when sampling from strongly log-concave target distributions that satisfy a weak third-order regularity property associated with the input data. Our regularity condition is weaker than the Lipschitz Hessian property and allows us to show faster convergence bounds for a much larger class of distributions than would be possible with the usual Lipschitz Hessian constant alone. Important distributions that satisfy our regularity condition include posterior distributions used in Bayesian logistic regression for which the data satisfies an "incoherence" property. Our result compares favorably with the best available bounds for the class of strongly log-concave distributions, which grow like $d^{{1}/{2}}$ gradient evaluations with the dimension. Moreover, our simulations on synthetic data suggest that, when our regularity condition is satisfied, leapfrog HMC performs better than its competitors -- both in terms of accuracy and in terms of the number of gradient evaluations it requires.

研究の動機と目的

高次元におけるサンプリングにおいて、ルンゲ・クッタ法を用いたHMCがO*(d^{1/4})の勾配評価回数を必要とするという長年の予想を解消すること。
リプシッツヘッセ行列よりも弱いヘッセ行列の正則性条件を提案し、より広い分布のクラスに対してタイトな境界を得ること。
特に、非一貫性のあるデータを用いたベイズ回帰の事後分布など、重要な統計的モデルにおいて、この正則性条件が自然に満たされることを示すこと。
理論的改善を、合成データおよび実データのシミュレーションにより実証し、精度と勾配効率の両面で優れた性能を示すこと。

提案手法

HMC軌道が通常通過する方向でのみヘッセ行列の変動を制限する、新たな正則性条件（仮定1）を導入する。
確率的カップリング技術を用いて、冷たいまたは温かい初期状態からのHMCチェインの混合時間を制限する。
ODE比較定理とリャプノフ関数を用いて、ルンゲ・クッタ積分器が理想のハミルトニアンフローからどれほど逸脱するかを分析する。
高次元において標準的なユークリッドノルムよりもタイトな、ヘッセ行列差の無限大ノルムリプシッツ条件を用いた、ルンゲ・クッタ積分器の誤差境界を導出する。
新しい正則性条件下で、ルンゲ・クッタHMCアルゴリズムにおける勾配評価回数について、次元的にタイトなO*(d^{1/4})の境界を確立する。
合成データおよびロジスティック回帰における、ユークリッドノルムと無限大ノルムリプシッツ条件の下でのHMC性能をシミュレーションにより比較する。

実験結果

リサーチクエスチョン

RQ1弱いヘッセ行列正則性条件下で、強い対数凸性を持つターゲットに対するルンゲ・クッタHMCアルゴリズムは、O*(d^{1/4})の勾配評価回数を必要とするか？
RQ2この新たな正則性条件は、ベイズ回帰の事後分布など、重要な統計的モデルで満たされるか？
RQ3ヘッセ行列差の無限大ノルムリプシッツ条件は、標準的なユークリッドノルム条件と比較して、積分器誤差と勾配評価コストの境界をどのように改善するか？
RQ4理論的収束速度の向上が、合成データおよび実データの例における実験的性能に反映されるか？

主な発見

本論文は、新しい弱い3階正則性条件を満たす強い対数凸性ターゲットからのサンプリングにおいて、ルンゲ・クッタHMCが最大でO*(d^{1/4})の勾配評価回数で収束することを証明した。
新しい正則性条件は、リプシッツヘッセ行列の性質よりも厳密に弱く、データが非一貫性条件を満たす場合、ベイズ回帰の事後分布においても成立する。
シミュレーションにより、新しい正則性条件下でのHMCが、精度と勾配評価回数の両面で競合手法を上回ることが示された。特に高次元において顕著な優位性を示した。
ヘッセ行列差の無限大ノルムリプシッツ条件は、標準的なユークリッドノルム条件よりも著しくタイトな誤差境界をもたらし、これは中央値√L∞r^{1/4}∥pt∥∞,uが次元とともによりゆっくりと増加することから裏付けられた。
理論的境界は次元的にタイトであり、リプシッツヘッセ行列仮定下でのHMCに対する既存の最良のO*(d^{1/2})の境界を改善した。
結果から、メトロポリス補正付きHMC（MHMC）はε^{-1}に対して多項式対数的勾配評価回数で十分である可能性があるが、受容/拒否ステップにおけるカップリングの困難さにより、この問題は未解決のままである。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。