[论文解读] Scalable Multiple Network Inference with the Joint Graphical Horseshoe
本文提出了一种可扩展的期望条件最大化(ECM)算法,用于贝叶斯图霍斯比尔推断,并引入了联合图霍斯比尔模型以实现多网络估计。通过利用边特定的收缩和跨网络的信息共享,该方法在具有共享与独特网络结构的高维多条件组学数据中,相较于现有方法实现了更优的准确性和可扩展性。
Network models are useful tools for modelling complex associations. In statistical omics, such models are increasingly popular for identifying and assessing functional relationships and pathways. If a Gaussian graphical model is assumed, conditional independence is determined by the non-zero entries of the inverse covariance (precision) matrix of the data. The Bayesian graphical horseshoe estimator provides a robust and flexible framework for precision matrix inference, as it introduces local, edge-specific parameters which prevent over-shrinkage of non-zero off-diagonal elements. However, its applicability is currently limited in statistical omics settings, which often involve high-dimensional data from multiple conditions that might share common structures. We propose (i) a scalable expectation conditional maximisation (ECM) algorithm for the original graphical horseshoe, and (ii) a novel joint graphical horseshoe estimator, which borrows information across multiple related networks to improve estimation. We show numerically that our single-network ECM approach is more scalable than the existing graphical horseshoe Gibbs implementation, while achieving the same level of accuracy. We also show that our joint-network proposal successfully leverages shared edge-specific information between networks while still retaining differences, outperforming state-of-the-art methods at any level of network similarity. Finally, we leverage our approach to clarify gene regulation activity within and across immune stimulation conditions in monocytes, and formulate hypotheses on the pathogenesis of immune-mediated diseases.
研究动机与目标
- 解决高维贝叶斯图霍斯比尔模型中吉布斯抽样计算不可行的问题。
- 实现在组学应用中单个和多个高斯图模型的可扩展推断。
- 开发一种联合建模框架,可在相关网络间共享信息的同时保留条件特异性差异。
- 在稀疏边选择中提升估计准确性,并对识别出的边提供高置信度。
提出的方法
- 提出一种ECM算法,用于图霍斯比尔模型中精度矩阵的后验估计,替代计算密集的吉布斯抽样。
- 引入联合图霍斯比尔模型,一种分层贝叶斯模型,可在多个网络间共享全局和局部收缩参数。
- 在精度矩阵非对角线元素上使用全局-局部霍斯比尔先验,以防止非零边的过度收缩。
- 采用ECM算法迭代最大化后验概率,实现在高维设置下的高效计算。
- 整合共享和条件特异性超参数,以在不同网络间平衡相似性与异质性。
- 提供R包fastGHS和jointGHS,分别用于单网络和联合网络推断。
实验结果
研究问题
- RQ1基于ECM的推断过程是否能在保持准确性的前提下,相比吉布斯抽样展现出更优的可扩展性?
- RQ2联合图霍斯比尔模型在不损害条件特异性差异的前提下,能否有效利用多条件间的共享网络结构?
- RQ3在不同网络相似性情景下,联合图霍斯比尔模型相对于最先进方法的性能如何?
- RQ4该方法在真实组学数据中的表现如何,特别是在识别免疫刺激下基因调控网络方面?
主要发现
- fastGHS ECM算法在准确性上与吉布斯抽样相当,但显著更具可扩展性,可实现对真实组学数据规模的推断。
- jointGHS方法在所有网络相似性水平下均持续优于JGL、SSJGL和GemBag,AUPRC0.3得分接近0.3,表明假阳性极少。
- 在p = 200个节点且网络完全不一致(100%差异)的模拟中,jointGHS的AUPRC0.3为0.296,优于JGL(0.284)和SSJGL(0.292)。
- 该方法在边选择中表现出高精度,仅当额外边的证据不足时召回率才急剧下降,表明其在稀疏估计中的稳健性。
- jointGHS的CPU时间随p呈亚二次方增长,可实现对两个条件下最多1000个节点的网络推断。
- 在单核细胞免疫刺激数据上的应用揭示了具有生物学合理性的基因调控网络,并提出了关于免疫介导疾病发病机制的新假说。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。