Skip to main content
QUICK REVIEW

[论文解读] Functional response regression with funBART: an analysis of patient-specific stillbirth risk

Jennifer E. Starling, Jared S. Murray|arXiv (Cornell University)|May 19, 2018
Statistical Methods and Inference被引用 2
一句话总结

本文提出tsBART,一种贝叶斯加法回归树模型,该模型在单一目标协变量(即妊娠龄)上强制实现平滑性,同时允许其他预测变量保持非平滑关系。在死胎风险预测中的应用表明,与标准BART相比,tsBART在妊娠龄范围内生成了更平滑、更具可解释性且临床合理的个体化风险估计。该方法已集成于R包tsbart中。

ABSTRACT

This article introduces BART with Targeted Smoothing, or tsBART, a new Bayesian tree-based model for nonparametric regression. The goal of tsBART is to introduce smoothness over a single target covariate t, while not necessarily requiring smoothness over other covariates x. TsBART is based on the Bayesian Additive Regression Trees (BART) model, an ensemble of regression trees. TsBART extends BART by parameterizing each tree's terminal nodes with smooth functions of t, rather than independent scalars. Like BART, tsBART captures complex nonlinear relationships and interactions among the predictors. But unlike BART, tsBART guarantees that the response surface will be smooth in the target covariate. This improves interpretability and helps regularize the estimate. After introducing and benchmarking the tsBART model, we apply it to our motivating example: pregnancy outcomes data from the National Center for Health Statistics. Our aim is to provide patient-specific estimates of stillbirth risk across gestational age (t), based on maternal and fetal risk factors (x). Obstetricians expect stillbirth risk to vary smoothly over gestational age, but not necessarily over other covariates, and tsBART has been designed precisely to reflect this structural knowledge. The results of our analysis show the clear superiority of the tsBART model for quantifying stillbirth risk, thereby providing patients and doctors with better information for managing the risk of perinatal mortality. All methods described here are implemented in the R package tsbart.

研究动机与目标

  • 开发一种非参数回归模型,确保在单一目标协变量(如妊娠龄)上实现平滑性,同时在其他预测变量上保持灵活性。
  • 提升个体化风险建模在围产期结局(尤其是死胎)中的可解释性与正则化能力。
  • 解决临床预期:即死胎风险随妊娠龄平滑变化,而非在其他母体或胎儿因素上如此。
  • 通过将特定领域的结构知识融入模型,为产科医生和患者提供更可靠、更具临床意义的风险估计。
  • 在使用美国国家卫生统计中心数据的真实围产期数据应用中实现并基准测试该方法。

提出的方法

  • tsBART通过将每棵树的终端节点参数化为针对目标协变量t的平滑函数,而非独立标量,从而扩展了BART模型。
  • 在每棵树的终端节点中,使用样条或其他非参数平滑技术对t的平滑函数进行建模。
  • 该模型保持了BART的集成结构,通过组合多棵回归树来捕捉复杂的非线性关系与交互作用。
  • 通过马尔可夫链蒙特卡洛(MCMC)进行后验推断,平滑性通过施加在t的平滑函数上的先验分布来实现。
  • 该方法在保持灵活性的同时,确保目标协变量t的平滑性,从而提升可解释性与估计稳定性。
  • 该方法已实现在R包tsbart中,支持在类似回归问题中的可重现与可访问应用。

实验结果

研究问题

  • RQ1能否在保持其他预测变量灵活性的同时,使贝叶斯非参数模型在单一目标协变量上实现平滑性?
  • RQ2在妊娠龄上强制实现平滑性,如何提升死胎风险预测模型的可解释性与准确性?
  • RQ3tsBART在跨妊娠龄估计个体化死胎风险方面是否优于标准BART?
  • RQ4将领域知识(如风险随时间预期的平滑变化)纳入模型,在多大程度上能改善临床风险建模?
  • RQ5tsBART能否生成与产科医生对死胎趋势预期一致的临床合理、平滑的风险曲面?

主要发现

  • 与标准BART相比,tsBART在妊娠龄上的风险曲面更平滑、更具可解释性,且符合临床预期。
  • 该模型在量化死胎风险方面表现显著优越,尤其在捕捉风险随时间的渐进变化方面。
  • 针对性平滑的引入显著提高了目标协变量上的估计稳定性,并减少了过拟合。
  • 结果表明,在妊娠龄上强制平滑可带来更可靠的个体化风险预测,从而增强临床决策支持能力。
  • 该方法在建模复杂交互作用与非线性关系的同时,保持了目标变量的平滑性,符合临床领域知识的要求。
  • tsBART模型已实现在R包tsbart中,支持在类似生物医学应用中的采用与扩展。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。