[论文解读] Robust and Scalable Models of Microbiome Dynamics
该论文提出了一种具有交互模块的贝叶斯非参数模型,用于从稀疏、噪声大、高维度的时间序列微生物组数据中学习稳健、可扩展且可解释的微生物相互作用网络。通过将交互参数从 O(n²) 减少到 O((log n)²),传播不确定性,并使用时变辅助变量以强制实现非负性,该方法实现了精确的系统识别,并揭示了具有生物学合理性的紧凑动力学结构,包括在无菌小鼠模型中验证的以及新型的潜在 *Clostridium difficile* 抑制剂。
Microbes are everywhere, including in and on our bodies, and have been shown to play key roles in a variety of prevalent human diseases. Consequently, there has been intense interest in the design of bacteriotherapies or "bugs as drugs," which are communities of bacteria administered to patients for specific therapeutic applications. Central to the design of such therapeutics is an understanding of the causal microbial interaction network and the population dynamics of the organisms. In this work we present a Bayesian nonparametric model and associated efficient inference algorithm that addresses the key conceptual and practical challenges of learning microbial dynamics from time series microbe abundance data. These challenges include high-dimensional (300+ strains of bacteria in the gut) but temporally sparse and non-uniformly sampled data; high measurement noise; and, nonlinear and physically non-negative dynamics. Our contributions include a new type of dynamical systems model for microbial dynamics based on what we term interaction modules, or learned clusters of latent variables with redundant interaction structure (reducing the expected number of interaction coefficients from $O(n^2)$ to $O((\log n)^2)$); a fully Bayesian formulation of the stochastic dynamical systems model that propagates measurement and latent state uncertainty throughout the model; and introduction of a temporally varying auxiliary variable technique to enable efficient inference by relaxing the hard non-negativity constraint on states. We apply our method to simulated and real data, and demonstrate the utility of our technique for system identification from limited data and gaining new biological insights into bacteriotherapy design.
研究动机与目标
- 解决从高维、稀疏采样且噪声大的时间序列微生物组数据中学习微生物相互作用网络的挑战。
- 减少在大型微生物群落(n > 300)中建模 O(n²) 成对交互作用所带来的计算与统计负担。
- 开发一个完全贝叶斯框架,以在整个模型中传播测量误差和潜在状态的不确定性。
- 在无需硬性约束的物理上合理的非负动力学下,实现高效推断。
- 发现紧凑、具有生物学可解释性的交互模块,揭示因果性微生物动力学,并支持细菌疗法的设计。
提出的方法
- 引入交互模块——具有冗余交互结构的潜在变量聚类——以将交互系数数量从 O(n²) 减少到 O((log n)²)。
- 采用随机动力系统完全贝叶斯公式,以在测量噪声、潜在状态和模型参数之间传播不确定性。
- 开发一种时变辅助变量技术,以放松对微生物种群状态的硬性非负性约束,从而实现高效的 MCMC 推断。
- 在交互模块上使用非参数先验(狄利克雷过程),以基于共享交互模式灵活聚类微生物。
- 采用对数变换的广义洛特卡-沃尔泰拉(gLV)模型作为基础动力系统,通过马尔可夫链蒙特卡洛(MCMC)进行推断。
- 在联合似然框架内,结合下一代测序(16S rRNA)和 qPCR 数据,分别估计相对丰度和总生物量。
实验结果
研究问题
- RQ1一种可扩展且稳健的模型能否从稀疏、噪声大、高维度的时间序列微生物组数据中推断出准确的微生物相互作用网络?
- RQ2交互模块能否在保持生物学可解释性的同时,减少建模复杂微生物群落所需的参数数量?
- RQ3所提出的方法能否有效在非负动力系统中传播测量噪声和潜在状态的不确定性?
- RQ4该模型能否识别出已知的以及新型的具有生物学合理性的微生物相互作用,特别是在细菌疗法设计的背景下?
- RQ5在数据有限的情况下,该模型在系统识别方面的性能与现有方法相比如何?
主要发现
- 该模型在无菌小鼠研究的真实数据中成功识别出中位数为 4 个的交互模块,其中 7 种微生物形成了一个主导且一致的模块。
- 该模型检测到了 *Clostridium scindens* 抑制 *Clostridium difficile* 的生物学验证相互作用,该作用在原始研究中仅被微弱识别。
- 该模型发现 *Akkermansia muciniphila* 是该病原体的潜在抑制剂,这一候选者具有生物学合理性,并得到现有关于黏膜完整性的文献支持。
- 交互系数的后验汇总再现了精细的网络结构,而模块化表示则提供了比原始研究中密集网络更清晰、更具可解释性的生物学图景。
- 在模拟数据中,即使采样有限且不均匀,该方法仍能准确恢复底层动力系统。
- 该模型通过辅助变量实现的不确定性传播与非负性强制,使得在高维、稀疏设置下实现了稳定且高效的推断。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。