[论文解读] Kernel Adaptive Metropolis-Hastings
本文提出了一种无梯度、自适应的MCMC算法——核自适应Metropolis-Hastings(MCMC Kameleon),该算法将马尔可夫链样本映射到再生核希尔伯特空间(RKHS),以学习局部协方差结构。通过解析地积分掉特征空间的移动,构建出依赖于位置的高斯提议分布,使其能够适应非线性目标分布的支持结构,显著提升了在复杂非线性分布上采样时的混合效率和分位数估计的准确性,相较于固定和自适应采样器表现更优。
A Kernel Adaptive Metropolis-Hastings algorithm is introduced, for the purpose of sampling from a target distribution with strongly nonlinear support. The algorithm embeds the trajectory of the Markov chain into a reproducing kernel Hilbert space (RKHS), such that the feature space covariance of the samples informs the choice of proposal. The procedure is computationally efficient and straightforward to implement, since the RKHS moves can be integrated out analytically: our proposal distribution in the original space is a normal distribution whose mean and covariance depend on where the current sample lies in the support of the target distribution, and adapts to its local covariance structure. Furthermore, the procedure requires neither gradients nor any other higher order information about the target, making it particularly attractive for contexts such as Pseudo-Marginal MCMC. Kernel Adaptive Metropolis-Hastings outperforms competing fixed and adaptive samplers on multivariate, highly nonlinear target distributions, arising in both real-world and synthetic examples. Code may be downloaded at https://github.com/karlnapf/kameleon-mcmc.
研究动机与目标
- 解决在具有复杂支撑结构的高维、强非线性目标分布中实现高效采样的挑战。
- 克服固定和全局自适应提议方法在捕捉目标分布中局部非高斯依赖关系方面的局限性。
- 开发一种计算高效的无梯度MCMC方法,基于局部几何结构自适应提议,而无需使用高阶导数。
- 在似然函数不可计算或存在噪声的伪边缘MCMC设置中实现鲁棒性能。
- 通过核嵌入学习局部协方差结构,提升经验分位数估计和均值范数的准确性。
提出的方法
- 使用核特征映射将输入空间中的样本映射到再生核希尔伯特空间(RKHS)。
- 在RKHS中估计链历史的经验协方差算子,以捕捉局部几何结构。
- 在输入空间中构建提议分布,即以当前状态为均值、协方差由RKHS协方差算子导出的多元正态分布。
- 通过解析积分特征空间移动,得到原始空间中具有闭式表达的、依赖于位置的高斯提议分布。
- 利用目标测度的核嵌入来指导提议自适应,而无需梯度信息。
- 在Metropolis-Hastings框架中应用该算法,根据未归一化目标密度接受或拒绝提议。
实验结果
研究问题
- RQ1基于核的特征空间协方差估计是否能提升非线性目标分布下MCMC的提议自适应性能?
- RQ2在RKHS中进行局部协方差自适应与全局协方差自适应相比,在混合效率和分位数准确性方面表现如何?
- RQ3无梯度、基于核的MCMC采样器是否能在高度非线性的目标分布(如香蕉形和花形分布)上超越现有自适应采样器?
- RQ4在似然函数为估计值的伪边缘MCMC设置中,所提方法是否仍能保持良好性能?
- RQ5该算法的性能在多大程度上依赖于核函数的选择以及链历史的子采样策略?
主要发现
- 在8维强非线性香蕉形目标分布(b=0.1)上,MCMC Kameleon显著优于标准Metropolis(SM)、自适应Metropolis(AM)以及带局部缩放的自适应Metropolis(AM-LS)。
- 在花形目标分布上,尽管AM具有正确的全局协方差估计,但因未能捕捉局部结构,其分位数性能仍劣于MCMC Kameleon,而MCMC Kameleon实现了更优的分位数表现。
- 该方法在保持高接受率(接近最优的0.234)的同时,实现了准确的经验均值范数和分位数,表明其具有快速混合特性并能正确探索目标支撑集。
- SM因呈现随机游走行为,导致均值范数和分位数偏差严重,链被卡在目标分布的某一区域。
- AM采用固定尺度时接受率过低,而AM-LS因提议过小导致分位数性能差,二者均未能有效探索高密度区域。
- 该算法对非高斯、非椭球形目标分布具有鲁棒性,证明其可通过基于核的协方差学习,有效适应局部弯曲支撑结构。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。