Skip to main content
QUICK REVIEW

[论文解读] A Bayesian Nonparametric Approach for Estimating Individualized Treatment-Response Curves

Yanbo Xu, Yanxun Xu|arXiv (Cornell University)|Aug 18, 2016
Statistical Methods and Inference参考文献 31被引用 28
一句话总结

本文提出一种基于高斯过程和层次化先验的贝叶斯非参数方法,用于从稀疏、不规则采样的观察性时间序列中估计个体化治疗反应曲线。通过利用G-计算公式和完整的后验推断,该方法在预测肌酐和体液平衡反应方面优于群体水平和基线模型,尤其在捕捉个体异质性和不确定性方面表现更优。

ABSTRACT

We study the problem of estimating the continuous response over time to interventions using observational time series---a retrospective dataset where the policy by which the data are generated is unknown to the learner. We are motivated by applications where response varies by individuals and therefore, estimating responses at the individual-level is valuable for personalizing decision-making. We refer to this as the problem of estimating individualized treatment response (ITR) curves. In statistics, G-computation formula (Robins, 1986) has been commonly used for estimating treatment responses from observational data containing sequential treatment assignments. However, past studies have focused predominantly on obtaining point-in-time estimates at the population level. We leverage the G-computation formula and develop a novel Bayesian nonparametric (BNP) method that can flexibly model functional data and provide posterior inference over the treatment response curves at both the individual and population level. On a challenging dataset containing time series from patients admitted to a hospital, we estimate responses to treatments used in managing kidney function and show that the resulting fits are more accurate than alternative approaches. Accurate methods for obtaining ITRs from observational data can dramatically accelerate the pace at which personalized treatment plans become possible.

研究动机与目标

  • 从治疗策略未知的观察性时间序列中估计连续的、个体水平的治疗反应曲线。
  • 解决现有方法仅关注时点群体水平估计的局限性。
  • 在跨个体间借用信息的同时,对个体间治疗效应的异质性进行建模。
  • 提供完整的后验推断,包括95%可信区间,以量化个体预测中的不确定性。

提出的方法

  • 采用基于高斯过程先验的贝叶斯非参数框架,灵活建模随时间变化的纵向结果。
  • 应用层次化先验在个体间共享信息,同时允许个体特异的治疗反应曲线。
  • 使用G-计算公式调整观察数据中时变混杂因素的影响。
  • 将治疗效应建模为时间与治疗剂量的函数,实现连续响应估计。
  • 使用马尔可夫链蒙特卡洛(MCMC)抽样,获得个体和群体水平治疗反应曲线的完整后验分布。
  • 纳入肾功能SOFA评分和共病等协变量,以指导个体特异性基线进展和治疗反应。

实验结果

研究问题

  • RQ1贝叶斯非参数模型能否从稀疏、不规则的观察性时间序列中准确估计个体化治疗反应曲线?
  • RQ2与群体水平和个体水平的基线模型相比,所提出方法在预测准确性上表现如何?
  • RQ3该模型在捕捉不同肾功能患者间治疗效应异质性方面的能力如何?
  • RQ4该模型在数据有限情况下对个体预测不确定性量化的程度如何?
  • RQ5该模型通过在个体间借用信息,是否能提升观测值较少患者的性能?

主要发现

  • 所提出的ITR模型在平均预测误差上显著优于群体水平(Pop)模型和三种基线模型,且差异具有统计学显著性。
  • 在数据稀疏时,ITR模型的预测误差低于个体水平模型,归因于患者间有效的信息共享。
  • 随着更多数据的增加,个体水平模型性能提升,但仍逊于ITR模型,后者保持了更优的灵活性和准确性。
  • 定性结果显示,ITR预测更符合临床预期,例如低剂量呋塞米在基线肾功能较好的患者中更有效。
  • 模型揭示,急性肾损伤(AKI)或慢性肾病(CKD)患者对利尿剂的反应性较低,而反应性较高的患者更少需要透析。
  • ITR估计的治疗反应曲线显示,随着肾功能恶化,利尿剂的有效性下降,与临床认知一致。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。