[论文解读] Playing Russian Roulette with Intractable Likelihoods
本文提出了一种新颖的精确-近似 MCMC 方法,用于处理不可行似然函数,通过俄罗斯轮盘抽样对无穷级数展开(麦克劳林级数或几何级数)进行随机截断,从而获得无偏似然估计。尽管在马尔可夫链中引入了带符号测度,该方法通过受量子色动力学启发的技术保持了正确的期望,实现了对大型模型(如在精细网格上的高斯马尔可夫随机场)的精确贝叶斯推断,已在臭氧柱数据上得到验证。
A general scheme to exploit Exact-Approximate MCMC methodology for intractable likelihoods is suggested. By representing the intractable likelihood as an infinite Maclaurin or Geometric series expansion, unbiased estimates of the likelihood can be obtained by finite time stochastic truncations of the series via Russian Roulette sampling. Whilst the estimates of the intractable likelihood are unbiased, for unbounded unnormalised densities they induce a signed measure in the Exact-Approximate Markov chain Monte Carlo procedure which will introduce bias in the invariant distribution of the chain. By exploiting results from the Quantum Chromodynamics literature the signed measures can be employed in an Exact-Approximate sampling scheme in such a way that expectations with respect to the desired target distribution are preserved. This provides a general methodology to construct Exact-Approximate sampling schemes for a wide range of models and the methodology is demonstrated on well known examples such as posterior inference of coupling parameters in Ising models and defining the posterior for Fisher-Bingham distributions defined on the d-Sphere. A large scale example is provided for a Gaussian Markov Random Field model, with fine scale mesh refinement, describing the Ozone Column data. To our knowledge this is the first time that fully Bayesian inference over a model of this size has been feasible without the need to resort to any approximations. Finally a critical assessment of the strengths and weaknesses of the methodology is provided with pointers to ongoing research 1. 1
研究动机与目标
- 解决由于归一化常数不可行而导致似然函数不可行时的精确贝叶斯推断挑战。
- 构建一个通用框架,用于为具有无界未归一化密度的模型构造无偏似然估计器。
- 克服在使用无偏似然估计时,精确-近似 MCMC 中由带符号测度引入的偏差。
- 实现高维模型(如精细网格离散化的高斯马尔可夫随机场)的可扩展、精确后验推断。
- 在典型模型(如 d-球面上的伊辛模型和费舍尔-宾厄姆分布)以及大规模臭氧柱模型上展示该方法。
提出的方法
- 将不可行似然函数表示为无穷麦克劳林级数或几何级数展开。
- 应用俄罗斯轮盘抽样在有限时间内随机截断级数,从而获得无偏似然估计。
- 利用量子色动力学中的结果,处理由无界未归一化密度在马尔可夫链中诱导的带符号测度。
- 构建一种精确-近似 MCMC 算法,即使在存在带符号测度的情况下,也能保持正确的不变分布。
- 将无偏似然估计器集成到梅特罗波利斯-黑斯廷斯框架中,以从目标后验分布中进行抽样。
- 在具有已知不可行后验分布的模型上验证该方法,包括伊辛模型和 d-球面上的费舍尔-宾厄姆分布。
实验结果
研究问题
- RQ1通过无穷级数的随机截断实现无偏似然估计,是否能够实现对具有不可行似然函数的模型的精确贝叶斯推断?
- RQ2在精确-近似 MCMC 中,如何管理由无界未归一化密度引起的带符号测度,以保持期望的正确性?
- RQ3该方法在高维模型(如在大网格上的高斯马尔可夫随机场)中,特别是在精细离散化下,其可扩展性如何?
- RQ4在大规模真实世界应用(如臭氧柱模型)中,该方法是否能实现无近似的确凿推断?
- RQ5与现有近似推断方法相比,该方法在实际应用中的局限性以及计算权衡是什么?
主要发现
- 该方法通过无穷级数的随机截断构造无偏似然估计,实现了对具有不可行似然函数的模型的精确贝叶斯推断。
- 尽管在马尔可夫链中引入了带符号测度,该方法通过借鉴量子色动力学中的技术,仍能保持目标分布下正确的期望。
- 该方法成功应用于 d-球面上伊辛模型和费舍尔-宾厄姆分布的后验推断,展示了其广泛适用性。
- 首次实现了对臭氧柱数据的大规模高斯马尔可夫随机场模型的完全贝叶斯推断,且无需任何近似,即使在精细网格细化下也成立。
- 该方法在大规模场景下实现了精确推断,优于现有方法在如此大规模模型中必须依赖近似才能实现的性能。
- 一项关键评估指出了其在可扩展性和精确性方面的优势,同时指出了计算成本较高以及截断方案调优困难的挑战。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。