Skip to main content
QUICK REVIEW

[论文解读] Machine Learning for Survival Analysis: A Survey

Ping Wang, Yan Li|arXiv (Cornell University)|Aug 15, 2017
Statistical Methods and Inference参考文献 103被引用 107
一句话总结

本综述全面回顾了传统统计生存分析方法与用于带删失的时间到事件数据的机器学习方法,包括分类、评估指标和应用。

ABSTRACT

Accurately predicting the time of occurrence of an event of interest is a critical problem in longitudinal data analysis. One of the main challenges in this context is the presence of instances whose event outcomes become unobservable after a certain time point or when some instances do not experience any event during the monitoring period. Such a phenomenon is called censoring which can be effectively handled using survival analysis techniques. Traditionally, statistical approaches have been widely developed in the literature to overcome this censoring issue. In addition, many machine learning algorithms are adapted to effectively handle survival data and tackle other challenging problems that arise in real-world data. In this survey, we provide a comprehensive and structured review of the representative statistical methods along with the machine learning techniques used in survival analysis and provide a detailed taxonomy of the existing methods. We also discuss several topics that are closely related to survival analysis and illustrate several successful applications in various real-world application domains. We hope that this paper will provide a more thorough understanding of the recent advances in survival analysis and offer some guidelines on applying these approaches to solve new problems that arise in applications with censored data.

研究动机与目标

  • 调研代表性的传统统计生存分析方法(非参数、半参数、参数性)及其性质。
  • 评述适用于生存数据的机器学习方法,包括决策树、贝叶斯方法、SVM 和神经网络。
  • 给出生存分析方法的分类法并讨论评估指标及相关表述。
  • 突出相关主题(竞争风险、重复事件、数据转换)及实际应用。
  • 提供关于生存分析方法实现及软件资源的指南。

提出的方法

  • 提供一个结构化的分类法,涵盖传统统计方法和生存分析中的机器学习方法。
  • 概述关键概念,如删失、生存/风险函数和基线风险。
  • 概述代表性方法(KM、NA、Life-Table,以及 Cox 及其变体;带惩罚项和核化的 Cox 模型;CoxBoost;TD-Cox)及其权衡。
  • 讨论生存分析领域的扩展和高级机器学习技术(集成、迁移、多任务、主动学习)。
  • 描述在生存分析中使用的评估指标及相关表述。
  • 讨论相关主题,如竞争风险、重复事件、去删失、校准及应用,以及实现细节。

实验结果

研究问题

  • RQ1生存分析方法的主要类别(非参数、半参数、参数性)及各自的优缺点是什么?
  • RQ2机器学习方法如何被改编以处理删失和时间到事件数据?
  • RQ3常用的评估指标和表述有哪些?
  • RQ4哪些扩展和高级机器学习技术适用于生存分析(如集成、迁移学习、多任务学习)?
  • RQ5生存分析方法的实际应用及可用软件实现有哪些?

主要发现

  • 本文提供了传统统计方法与生存分析中机器学习方法的全面分类与比较。
  • 它概述了删失的处理方式,并回顾了生存、风险和累积风险函数等核心概念。
  • 它涵盖了众所周知的方法,如 Kaplan-Meier、Nelson-Aalen、Life-Table 及 Cox 模型,包括正则化和时变变体。
  • 它讨论了用于生存数据的高级机器学习方法,包括集成、迁移和多任务学习技术。
  • 该综述包含相关主题(竞争风险、重复事件)及实际应用的讨论,并附带实现方面的考虑。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。