Skip to main content
QUICK REVIEW

[论文解读] Deep Survival: A Deep Cox Proportional Hazards Network.

Jared Katzman, Uri Shaham|arXiv (Cornell University)|Jun 2, 2016
Machine Learning in Healthcare参考文献 28被引用 82
一句话总结

本文提出了DeepSurv,一种深度学习扩展的Cox比例风险模型,利用神经网络对具有线性和非线性风险函数的生存数据进行建模。该模型在预测准确性方面优于传统Cox模型及其他生存模型,同时通过治疗组嵌入实现个性化治疗推荐,并提供了开源的Python实现。

ABSTRACT

Previous research has shown that neural networks can model survival data in situations in which some patients' death times are unknown, e.g. right-censored. However, neural networks have rarely been shown to outperform their linear counterparts such as the Cox proportional hazards model. In this paper, we run simulated experiments and use real survival data to build upon the risk-regression architecture proposed by Faraggi and Simon. We demonstrate that our model, DeepSurv, not only works as well as other survival models but actually outperforms in predictive ability on survival data with linear and nonlinear risk functions. We then show that the neural network can also serve as a recommender system by including a categorical variable representing a treatment group. This can be used to provide personalized treatment recommendations based on an individual's calculated risk. We provide an open source Python module that implements these methods in order to advance research on deep learning and survival analysis.

研究动机与目标

  • 开发一种深度学习模型,与Cox回归等线性模型相比,提升生存数据的预测性能。
  • 证明神经网络在生存分析中对线性和非线性风险函数建模的有效性。
  • 将模型扩展以整合治疗组变量,实现个性化治疗推荐。
  • 提供开源实现,以加速深度学习在生存分析领域的研究。

提出的方法

  • 将Faraggi和Simon的risk-regression架构改编为深度神经网络框架,用于生存建模。
  • 使用深度前馈神经网络学习协变量与风险函数之间的复杂非线性关系。
  • 应用Cox比例风险损失函数,对右删失生存数据进行网络训练。
  • 将分类的治疗组变量作为学习嵌入,以实现个体化风险预测和治疗效果估计。
  • 采用标准深度学习优化技术(如随机梯度下降)并结合正则化,防止过拟合。
  • 使用一致性指数(c-index)及其他标准生存分析指标,在模拟数据和真实世界数据集上验证模型性能。

实验结果

研究问题

  • RQ1深度神经网络是否能在预测生存结果方面优于标准Cox比例风险模型?
  • RQ2与线性模型相比,所提出的深度学习模型在具有非线性风险函数的生存数据上的表现如何?
  • RQ3通过整合治疗组信息,该模型在在多大程度上可作为推荐系统使用?
  • RQ4引入治疗组嵌入是否能提升个性化风险预测和治疗选择?

主要发现

  • DeepSurv在具有线性和非线性风险函数的模拟数据集上,预测准确性优于标准Cox比例风险模型。
  • 该模型的一致性指数高于基线模型,表明其对生存时间的排序能力更强。
  • 将治疗组作为分类嵌入整合后,模型能够生成个性化风险预测,并支持治疗推荐。
  • 该模型在真实世界生存数据集上保持了稳健的性能,证明其在真实数据上的泛化能力。
  • 开源的Python实现确保了结果的可复现性,并促进了深度学习在生存分析领域的进一步研究。
  • 结果证实,深度神经网络能够有效建模线性模型失效时的复杂生存模式。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。