[论文解读] Accelerating pseudo-marginal Metropolis-Hastings by correlating auxiliary variables
本文提出通过使用Crank-Nicolson(CN)提议在伪边缘似然马尔可夫链蒙特卡洛(pmMH)算法中对辅助变量进行相关化,以改善马尔可夫链混合性并降低计算成本。通过在迭代间引入辅助变量的正相关性,该方法可在保持或提升采样效率的同时减少每次迭代的粒子数,实验中在σᵤ = 0.55时观察到最优性能。
Pseudo-marginal Metropolis-Hastings (pmMH) is a powerful method for Bayesian inference in models where the posterior distribution is analytical intractable or computationally costly to evaluate directly. It operates by introducing additional auxiliary variables into the model and form an extended target distribution, which then can be evaluated point-wise. In many cases, the standard Metropolis-Hastings is then applied to sample from the extended target and the sought posterior can be obtained by marginalisation. However, in some implementations this approach suffers from poor mixing as the auxiliary variables are sampled from an independent proposal. We propose a modification to the pmMH algorithm in which a Crank-Nicolson (CN) proposal is used instead. This results in that we introduce a positive correlation in the auxiliary variables. We investigate how to tune the CN proposal and its impact on the mixing of the resulting pmMH sampler. The conclusion is that the proposed modification can have a beneficial effect on both the mixing of the Markov chain and the computational cost for each iteration of the pmMH algorithm.
研究动机与目标
- 解决由于辅助变量独立提议导致的伪边缘马尔可夫链蒙特卡洛(pmMH)算法混合性差的问题。
- 通过允许使用更少的辅助变量(如粒子数)来降低pmMH的计算成本,同时不牺牲链的混合性。
- 通过在辅助变量中引入时间相关性,提升具有不可解析似然的模型中的采样效率。
- 提供一种实用且调参较少的替代标准pmMH的方法,用基于CN的相关提议替代独立提议。
提出的方法
- 用Crank-Nicolson(CN)提议替代标准pmMH中对辅助变量的独立提议,以在迭代间诱导正相关性。
- 使用形式为u' = √(1 - σᵤ²) * u + σᵤ * z的CN提议,其中z为标准正态分布变量,以生成相关的辅助变量。
- 对包含θ和相关辅助变量u的扩展目标分布应用标准pmMH算法,似然函数通过粒子滤波或重要性采样进行估计。
- 调节CN提议尺度σᵤ以在接受率与积分自相关时间(IACT)之间取得平衡。
- 通过后验估计、轨迹图和多轮蒙特卡洛模拟下的IACT指标,在动态线性模型上评估性能。
- 将所提方法与使用独立辅助变量的标准pmMH在混合性和计算成本方面进行比较。
实验结果
研究问题
- RQ1通过CN提议在辅助变量中引入相关性,能否改善pmMH算法的混合性?
- RQ2所提方法是否允许在保持或提升链混合性的同时减少每次迭代的粒子数?
- RQ3在实践中,CN提议的最优尺度参数σᵤ是多少,其对性能有何影响?
- RQ4与标准pmMH相比,该方法在计算成本和采样效率方面表现如何?
- RQ5基于CN的相关策略能否有效应用于具有不可解析似然的模型,如动态线性模型?
主要发现
- 与使用独立辅助变量的标准pmMH相比,所提的基于CN的pmMH方法将积分自相关时间(IACT)降低了约1.5倍。
- 在测试的动态线性模型中,σᵤ = 0.55时性能最优,此时各参数的最大IACT被最小化。
- 与独立采样相比,使用CN提议时所有参数的中位接受率和IACT均显著改善。
- 该方法可在保持良好混合性的同时减少粒子数(Nu),从而显著降低每次迭代的计算成本。
- 所提方法的后验估计具有良好校准性,后验均值估计为μ = 0.19,φ = 0.98,σᵥ = 0.18,ρ = -0.70,对应标准差为0.22,0.01,0.04,0.09。
- 对数似然估计器的标准差为1.2,但最优σᵤ远离理论预测值0.9,表明可能需要针对具体模型调参或存在似然估计器的非高斯性。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。