Skip to main content
QUICK REVIEW

[论文解读] Approximate Bayesian inference from noisy likelihoods with Gaussian process emulated MCMC

Marko Järvenpää, Jukka Corander|arXiv (Cornell University)|Apr 8, 2021
Gaussian Processes and Bayesian Inference被引用 3
一句话总结

本文提出 GP-MH,一种新颖的近似贝叶斯推断框架,利用高斯过程(GP)模拟来加速当似然评估存在噪声且计算成本高昂时的马尔可夫链蒙特卡洛(MCMC)采样。通过采用局部实验设计策略,按顺序选择具有信息量的似然评估点,GP-MH 模拟了精确 Metropolis-Hastings 采样器的演化过程,在少于 1,000 次对数似然评估下实现了高采样效率和鲁棒性,展示了在似然免费推断设置中优于现有方法的性能。

ABSTRACT

We present a framework for approximate Bayesian inference when only a limited number of noisy log-likelihood evaluations can be obtained due to computational constraints, which is becoming increasingly common for applications of complex models. We model the log-likelihood function using a Gaussian process (GP) and the main methodological innovation is to apply this model to emulate the progression that an exact Metropolis-Hastings (MH) sampler would take if it was applicable. Informative log-likelihood evaluation locations are selected using a sequential experimental design strategy until the MH accept/reject decision is done accurately enough according to the GP model. The resulting approximate sampler is conceptually simple and sample-efficient. It is also more robust to violations of GP modelling assumptions compared with earlier, related "Bayesian optimisation-like" methods tailored for Bayesian inference. We discuss some theoretical aspects and various interpretations of the resulting approximate MH sampler, and demonstrate its benefits in the context of Bayesian and generalised Bayesian likelihood-free inference for simulator-based statistical models.

研究动机与目标

  • 为解决在似然评估计算成本高昂且存在噪声时(尤其是模拟器模型)进行贝叶斯推断的挑战。
  • 克服全局 GP 代理模型在高维或单峰后验设置下的低效问题。
  • 减少在似然免费推断的主动学习策略中对获取函数全局优化的依赖。
  • 开发一种使用 GP 模型模拟精确 MCMC 行为的方法,同时保持鲁棒性和采样效率。
  • 为似然免费推断中的贝叶斯优化类方法提供一种理论基础坚实、样本高效的替代方案。

提出的方法

  • 使用高斯过程(GP)对数似然函数建模,以实现后验密度的概率近似。
  • 采用顺序实验设计策略,基于 GP 模型的预测方差和不确定性选择具有信息量的似然评估位置。
  • 通过 GP 预测候选参数值的接受/拒绝决策,模拟精确 Metropolis-Hastings(MH)采样器的演化过程。
  • 应用一种局部探索策略,聚焦于最高后验密度区域,避免在参数边界附近进行冗余评估。
  • 采用基于阈值的停止准则收集评估,确保在终止前 MH 决策具有足够的准确性。
  • 使用一种新颖的获取函数 EPoE(期望误差概率),以提升样本效率来指导评估选择。

实验结果

研究问题

  • RQ1基于 GP 的 MH 采样器模拟能否在显著少于精确 MCMC 的似然评估次数下实现准确的后验近似?
  • RQ2在似然存在噪声的情况下,GP-MH 与 BLFI 和 BOLFI 等现有方法相比,在样本效率和准确性方面表现如何?
  • RQ3在高维或单峰后验场景中,基于 MH 指导的局部实验设计策略是否优于全局获取函数?
  • RQ4在复杂非线性模型中,GP-MH 对 GP 建模假设的违反在多大程度上仍保持鲁棒性?
  • RQ5GP-MH 能否有效处理通过合成似然方法估计的高噪声水平似然?

主要发现

  • GP-MH 在少于 1,000 次对数似然评估下实现了高后验近似精度,在所有测试案例中均一致地满足 103 次评估的阈值。
  • GP-MH 中基于 EPoE 的评估选择策略在样本效率方面优于朴素策略和 EPoEr 策略,且在准确性上与使用 IMIQR 的 BLFI 相当或更优。
  • 在 Ricker 模型实验中,GP-MH 搭配 EPoE 能够准确估计后验的边缘分布和相关结构,与 MH-BLFI 结果相当。
  • 该方法对噪声似然表现出鲁棒性,并避免了在参数边界附近的冗余评估,而这是先前工作中启发式获取函数的不足之处。
  • 在 theta-Ricker 模型中,EPoE 产生的评估位置分布更均匀、更具多样性,优于朴素策略和 EPoEr,表明其探索能力更优。
  • 评估收集比例随时间的分布表现出稳定的收敛趋势,中位数和 75 百分位数趋势表明在 100 次重复运行中性能可靠且一致。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。