[论文解读] Adversarial Time-to-Event Modeling
本文提出 DATE(对抗性生存时间建模),一种基于生成对抗网络(GANs)的深度生成模型,用于在右删失数据下估计生存时间分布。通过利用对抗学习和针对删失事件的新型损失函数,DATE 在真实数据集和基准数据集上的预测性能优于参数化基线模型和 DRAFT 模型,同时提升了不确定性估计能力。
Modern health data science applications leverage abundant molecular and electronic health data, providing opportunities for machine learning to build statistical models to support clinical practice. Time-to-event analysis, also called survival analysis, stands as one of the most representative examples of such statistical models. We present a deep-network-based approach that leverages adversarial learning to address a key challenge in modern time-to-event modeling: nonparametric estimation of event-time distributions. We also introduce a principled cost function to exploit information from censored events (events that occur subsequent to the observation window). Unlike most time-to-event models, we focus on the estimation of time-to-event distributions, rather than time ordering. We validate our model on both benchmark and real datasets, demonstrating that the proposed formulation yields significant performance gains relative to a parametric alternative, which we also propose.
研究动机与目标
- 解决利用深度学习进行生存分析中非参数化时间-事件分布估计的挑战。
- 改进时间-事件建模中的不确定性量化,特别是针对删失事件。
- 开发一种能够估计完整时间-事件分布的方法,而非仅风险排序或固定时间点的概率。
- 通过对抗学习实现可扩展的随机训练,克服传统 Cox-PH 和 AFT 模型的局限性。
- 提供一种灵活的、无需假设特定参数基线分布的分布自由框架。
提出的方法
- 采用条件 GAN 框架,其中生成器网络在协变量条件下生成时间-事件预测。
- 使用判别器区分来自训练数据的真实事件时间与生成器生成的时间。
- 提出一种新型损失函数,通过促使生成器为右删失观测生成合理分布,显式建模删失事件。
- 在所有网络层中应用带噪声的随机层(如 Uniform(0,1)),以增强不确定性估计和分布覆盖能力。
- 通过对抗优化训练模型,避免在目标函数中显式引入时间顺序约束。
- 提出一种基于 AFT 的参数化基线模型(DATE-AE),采用对数正态分布用于对比。
实验结果
研究问题
- RQ1对抗学习能否有效应用于具有删失数据的时间-事件建模,以改善分布估计?
- RQ2所提出的基于 GAN 的方法是否在不确定性量化和预测性能上优于现有参数化与非参数化模型?
- RQ3在所有网络层中引入噪声如何影响预测时间-事件分布的覆盖范围与校准性?
- RQ4模型是否能在不显式强制时间顺序约束的情况下学习到正确的时间顺序?
- RQ5在具有高删失率和复杂协变量结构的真实临床数据集上,该模型表现如何?
主要发现
- DATE 在所有数据集上的相对绝对误差和覆盖率方面显著优于参数化 AFT 基线(DATE-AE)和 DRAFT 模型。
- 在 ehr 数据集上,DATE 的中位相对绝对误差为 23.6%(四分位距:11.1–43.0),优于 DRAFT(36.7%)和 DATE-AE(24.5%)。
- 在 flchain 数据集上,DATE 的中位相对绝对误差为 19.5%,与 DATE-AE(19.3%)相当,且显著优于 DRAFT(26.2%)。
- 在所有层中使用 Uniform(0,1) 噪声的模型产生了最大的 95% 预测区间(在支持数据上中位数为 149.9 天),表明其具有更优的分布覆盖能力。
- 向 DATE 添加显式的时间顺序损失并未提升性能,表明 GAN 目标函数隐式学习到了正确的时间顺序。
- concordance index(CI)结果显示,DATE(-AE) 在 ehr 数据集上表现最佳,DRAFT 在 support 数据集上表现最佳,且 DATE(-AE) 在 seer 数据集上优于 Cox-PH 和 RSF。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。