Skip to main content
QUICK REVIEW

[論文レビュー] Fast MCMC sampling algorithms on polytopes

Yuansi Chen, Raaz Dwivedi|arXiv (Cornell University)|Oct 23, 2017
Markov Chains and Monte Carlo Methods参考文献 45被引用数 31
ひとこと要約

本稿は、多面体上での一様分布からのサンプリングを目的とした、2つの新しいマルコフ連鎖モンテカルロ(MCMC)サンプリングアルゴリズム——バイアディア・ウォークとジョン・ウォーク——を導入する。内点法から得られる体積的対数関数的およびジョンの楕円体のバリア関数を活用し、バイアディア・ウォークは $Θ(n^{0.5}d^{1.5})$ の混合時間を得る。これは、Dikinウォークの $Θ(nd)$ の境界を著しく改善しており、1ステップあたりの計算コストは同程度を維持する。

ABSTRACT

We propose and analyze two new MCMC sampling algorithms, the Vaidya walk and the John walk, for generating samples from the uniform distribution over a polytope. Both random walks are sampling algorithms derived from interior point methods. The former is based on volumetric-logarithmic barrier introduced by Vaidya whereas the latter uses John's ellipsoids. We show that the Vaidya walk mixes in significantly fewer steps than the logarithmic-barrier based Dikin walk studied in past work. For a polytope in $\mathbb{R}^d$ defined by $n >d$ linear constraints, we show that the mixing time from a warm start is bounded as $\mathcal{O}(n^{0.5}d^{1.5})$, compared to the $\mathcal{O}(nd)$ mixing time bound for the Dikin walk. The cost of each step of the Vaidya walk is of the same order as the Dikin walk, and at most twice as large in terms of constant pre-factors. For the John walk, we prove an $\mathcal{O}(d^{2.5}\cdot\log^4(n/d))$ bound on its mixing time and conjecture that an improved variant of it could achieve a mixing time of $\mathcal{O}(d^2\cdot ext{polylog}(n/d))$. Additionally, we propose variants of the Vaidya and John walks that mix in polynomial time from a deterministic starting point. The speed-up of the Vaidya walk over the Dikin walk are illustrated in numerical examples.

研究の動機と目的

  • 多面体上での一様分布に対するより高速なMCMCサンプリングアルゴリズムの開発、特に制約数 $n$ が次元 $d$ よりも大きい場合に有効であることを目的とする。
  • Dikinウォークのような既存のアルゴリズムが $n$ に対して線形にスケーリングするという限界を克服し、$n$ に対して非線形(特にサブラインア)依存性を持つ手法を設計すること。
  • 具体的には、バイアディアの体積的バリア関数とジョンの楕円体という内点法の幾何的構造を活用し、より効率的な提案分布を設計すること。
  • 従来の手法と比較して、特に高次元設定において、より速い混合時間の上限を理論的に確立すること。
  • 決定的初期点から多項式時間で混合する変種を提案し、実用的利便性を高めること。

提案手法

  • バイアディアの体積的対数関数的バリアに基づくランダムウォーク、すなわちバイアディア・ウォークを提案。これは、標準の対数関数的バリアよりも多面体の幾何構造をより正確に局所的に近似可能である。
  • ジョンの楕円体を用いて、ジョン・ウォークの局所的共分散構造を定義し、高次元における等方性の向上と収束速度の向上を実現する。
  • スペクトルギャップ解析と幾何的集中性の議論を用いて、バリア関数と多面体の幾何構造との関係を活用し、混合時間の上限を導出する。
  • 混合時間の上限を、目標分布に近い分布からの開始(ウォームスタート)に制限するフレームワークを適用し、収束保証を強化する。
  • 全変動距離と体積比、バリア関数の性質を結びつけるために、集合 $\mathcal{S}_1', \mathcal{S}_2', \mathcal{S}_3'$ を含む新しいカップリング議論を導入する。
  • 遷移カーネルの対称性および双対性の性質(例:$\Phi(\mathcal{S}) = \Phi(\mathcal{K} \setminus \mathcal{S})$)を確立し、解析における重要な不等式の証明に用いる。

実験結果

リサーチクエスチョン

  • RQ1多面体上でのMCMCサンプリングは、制約数 $n$ に対してサブラインアな混合時間を達成できるか?
  • RQ2より洗練されたバリア関数を用いる場合、バイアディア・ウォークの混合時間は、Dikinウォークの $Θ(nd)$ の境界と比較してどの程度改善されるか?
  • RQ3ジョンの楕円体に基づく提案分布は、標準の対数関数的バリア法に比べてより速い混合を実現できるか?
  • RQ4ジョン・ウォークの理論的混合時間は何か? さらに、$Θ(d^2 \cdot \text{poly-log}(n/d))$ に改善可能か?
  • RQ5提案されたウォークは、ウォームスタートに限らず、決定的初期点からでも多項式時間で混合可能か?

主な発見

  • バイアディア・ウォークはウォームスタートから $Θ(n^{0.5}d^{1.5})$ の混合時間を達成し、Dikinウォークの $Θ(nd)$ の境界を著しく改善する。
  • バイアディア・ウォークの1ステップあたりのコストはDikinウォークと同等であり、定数係数が最大2倍程度に増加するにとどまる。
  • ジョン・ウォークの混合時間の上限は $Θ(d^{2.5} \cdot \log^4(n/d))$ であり、改良されたバージョンが $Θ(d^2 \cdot \text{poly-log}(n/d))$ を達成可能であると仮説されている。
  • バイアディア・ウォークおよびジョン・ウォークの両方の変種を構築し、決定的初期点から多項式時間で混合することを実現した。
  • 数値例により、実際の計算でバイアディア・ウォークがDikinウォークを著しく上回ることが示された。
  • 理論的解析では、新規のカップリング議論と遷移カーネルの対称性の性質に依拠し、体積比と全変動距離を結びつける重要な不等式を確立した。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。