Skip to main content
QUICK REVIEW

[论文解读] Auxiliary-variable Exact Hamiltonian Monte Carlo Samplers for Binary Distributions

Ari Pakman, Liam Paninski|arXiv (Cornell University)|Nov 9, 2013
Markov Chains and Monte Carlo Methods参考文献 13被引用 40
一句话总结

本文通过引入连续辅助变量对二值分布进行扩展,提出了精确的哈密顿蒙特卡洛(HMC)采样器,实现了哈密顿动力学的精确积分而无需步长调优。该方法在稀疏-斯拉布线性回归与截断参数的probit回归中,相较于Metropolis和Gibbs采样器展现出更优的混合性能与效率。

ABSTRACT

We present a new approach to sample from generic binary distributions, based on an exact Hamiltonian Monte Carlo algorithm applied to a piecewise continuous augmentation of the binary distribution of interest. An extension of this idea to distributions over mixtures of binary and possibly-truncated Gaussian or exponential variables allows us to sample from posteriors of linear and probit regression models with spike-and-slab priors and truncated parameters. We illustrate the advantages of these algorithms in several examples in which they outperform the Metropolis or Gibbs samplers.

研究动机与目标

  • 为通用二值分布开发高效的MCMC采样方法,此类问题因离散状态空间及标准MCMC方法混合性能差而具有挑战性。
  • 将精确HMC扩展至混合二值-连续模型,尤其适用于具有稀疏-斯拉布先验的贝叶斯线性与probit回归。
  • 在保持精确哈密顿动力学的前提下,实现对具有参数截断(如正性约束)后验分布的采样。
  • 通过分段二次势能确保运动方程的精确积分,从而消除HMC中对步长调优的需求。
  • 在高维二值与混合模型中,展示该方法相较于Metropolis与Gibbs采样器在采样效率与收敛性方面的改进。

提出的方法

  • 将二值分布 $ p({\bf s}) $ 通过连续变量 $ {\bf y} \in \mathbb{R}^d $ 扩展,其中 $ s_i = \text{sign}(y_i) $,将离散问题转化为连续问题。
  • 定义一个联合分布 $ p({\bf y}) $,其为分段高斯分布,log-密度在由 $ {\bf y} $ 的符号定义的每个卦限内关于 $ {\bf y} $ 为二次型。
  • 构建哈密顿量 $ H({\bf y}, {\bf q}) = U({\bf y}) + \frac{1}{2} {\bf q} \cdot {\bf q} $,其中 $ U({\bf y}) $ 为负对数联合密度,从而实现运动方程的精确求解。
  • 利用三角函数解精确积分哈密顿动力学:$ y_i(t) = y_i(0)\cos(t) + q_i(0)\sin(t) $,该解在每个卦限内有效。
  • 通过能量守恒强制实现 $ y_i = 0 $ 处的不连续性处理,采用动量跳跃机制,满足 $ q_i^2(t_j^+) = \Delta_j + q_i^2(t_j^-) $,其中 $ \Delta_j $ 表示符号变化时势能的跃迁。
  • 通过为二值与连续参数分别引入辅助变量,并为各分量设置独立的哈密顿量与适配卦限的质量矩阵,将方法扩展至混合二值-高斯模型。

实验结果

研究问题

  • RQ1能否通过构造具有分段二次似然的连续辅助变量扩展,将精确HMC应用于二值分布?
  • RQ2所提出的HMC方法中因无需步长调优,是否能提升二值采样问题中的混合性能与收敛性?
  • RQ3该精确HMC框架能否扩展至混合二值-连续模型,如具有截断参数的稀疏-斯拉布回归?
  • RQ4与Metropolis和Gibbs采样器相比,该采样器在有效样本量与收敛速度方面的表现如何?
  • RQ5参数截断(如正性约束)对采样算法的动力学与效率有何影响?

主要发现

  • 所提方法实现了无步长调优的精确哈密顿动力学,由于能量守恒,所有提议移动的接受率均为100%。
  • 在二值分布中,该采样器在有效样本量与收敛速度方面优于Metropolis与Gibbs采样器,尤其在高维情形下表现更优。
  • 在具有截断参数的稀疏-斯拉布线性回归中,该方法通过将混合离散-连续问题转化为具有分段二次势能的连续问题,实现了高效的后验采样。
  • 该算法通过在边界处弹性反射速度,成功处理了参数截断,其机制类似于截断高斯采样技术。
  • 利用辅助变量 $ {\bf y} $ 通过符号约束表示二值变量,使得精确HMC可应用于标准HMC因目标函数非光滑而无法适用的模型。
  • 实验结果表明,采样效率持续提升,混合速度更快,自相关性更低,优于基线MCMC方法。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。