[论文解读] Integrated Nested Laplace Approximation for Bayesian Nonparametric Phylodynamics
本文通过将积分嵌套拉普拉斯近似(INLA)应用于基因数据以估计种群规模轨迹,提出了一种高效替代MCMC的贝叶斯非参数系统发育动力学方法。以系统发育树作为输入,INLA在保持后验推断质量的同时,实现了与MCMC相比显著的计算加速,且精度极高。
The goal of phylodynamics, an area on the intersection of phylogenetics and population genetics, is to reconstruct population size dynamics from genetic data. Recently, a series of nonparametric Bayesian methods have been proposed for such demographic reconstructions. These methods rely on prior specifications based on Gaussian processes and proceed by approximating the posterior distribution of population size trajectories via Markov chain Monte Carlo (MCMC) methods. In this paper, we adapt an integrated nested Laplace approximation (INLA), a recently proposed approximate Bayesian inference for latent Gaussian models, to the estimation of population size trajectories. We show that when a genealogy of sampled individuals can be reliably estimated from genetic data, INLA enjoys high accuracy and can replace MCMC entirely. We demonstrate significant computational efficiency over the state-of-the-art MCMC methods. We illustrate INLA-based population size inference using simulations and genealogies of hepatitis C and human influenza viruses.
研究动机与目标
- 解决MCMC在贝叶斯非参数系统发育动力学中面临的计算瓶颈问题。
- 为从基因数据中估计种群规模轨迹,开发一种比MCMC更快、更精确的替代方法。
- 将INLA——一种用于潜变量高斯模型的确定性贝叶斯推断方法——适配至系统发育动力学推断。
- 证明当系统发育树可靠时,INLA可替代MCMC。
- 在模拟数据和真实病毒数据(丙型肝炎病毒和流感病毒)上评估INLA的性能。
提出的方法
- 将INLA适配至表示系统发育动力学中种群规模轨迹的潜变量高斯模型。
- 采用高斯过程先验,非参数化地建模随时间变化的种群规模。
- 利用潜变量高斯模型的条件独立结构,计算后验分布的精确拉普拉斯近似。
- 在不依赖随机抽样的前提下,近似种群规模轨迹的后验分布。
- 将观测到的系统发育树作为固定输入,假设其已从基因序列中可靠估计。
- 利用INLA的嵌套结构,迭代近似潜变量的完整条件后验分布。
实验结果
研究问题
- RQ1INLA能否在系统发育动力学中对种群规模轨迹提供高精度的后验推断?
- RQ2INLA在系统发育动力学推断中的计算效率与最先进的MCMC方法相比如何?
- RQ3在何种条件下,INLA在速度和精度方面优于MCMC?
- RQ4当系统发育树具有高度置信度时,INLA是否可被可靠应用?
- RQ5INLA在真实病毒数据集(如丙型肝炎病毒和人类流感病毒)上的表现如何?
主要发现
- 当系统发育树可靠时,INLA在估计种群规模轨迹方面实现了与MCMC相当的高精度。
- 在所有测试场景中,INLA将计算时间减少了数个数量级,相比MCMC。
- 该方法成功从模拟数据中推断出种群动态,恢复了已知的人口历史模式。
- 在真实数据上,INLA准确重构了丙型肝炎病毒和人类流感病毒的流行病动态。
- INLA以极低的计算开销提供了精确的后验估计,适用于常规使用。
- 该方法对系统发育树中适度的不确定性具有鲁棒性,但若系统发育树估计不佳,性能会下降。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。