[論文レビュー] Machine Learning for Survival Analysis: A Survey
本調査は、打ち切りされた時間-到達データに対する従来の統計的生存法と機械学習アプローチの包括的なレビューを提供します。分類法、評価指標、適用を含みます。
Accurately predicting the time of occurrence of an event of interest is a critical problem in longitudinal data analysis. One of the main challenges in this context is the presence of instances whose event outcomes become unobservable after a certain time point or when some instances do not experience any event during the monitoring period. Such a phenomenon is called censoring which can be effectively handled using survival analysis techniques. Traditionally, statistical approaches have been widely developed in the literature to overcome this censoring issue. In addition, many machine learning algorithms are adapted to effectively handle survival data and tackle other challenging problems that arise in real-world data. In this survey, we provide a comprehensive and structured review of the representative statistical methods along with the machine learning techniques used in survival analysis and provide a detailed taxonomy of the existing methods. We also discuss several topics that are closely related to survival analysis and illustrate several successful applications in various real-world application domains. We hope that this paper will provide a more thorough understanding of the recent advances in survival analysis and offer some guidelines on applying these approaches to solve new problems that arise in applications with censored data.
研究の動機と目的
- 生存分析の代表的な従来の統計的方法(非パラメトリック、半パラメトリック、パラメトリック)とそれらの特性を調査する。
- 木構造、ベイズ法、サポートベクターマシン、ニューラルネットワークを含む、生存データに適応した機械学習法をレビューする。
- 生存分析手法の分類体系を提示し、評価指標と関連した定式化を論じる。
- 競合リスク、再発イベント、データ変換などの関連トピックと実世界の適用を取り上げる。
- 生存分析手法の実装とソフトウェア資源に関するガイダンスを提供する。
提案手法
- 生存分析の従来の統計的方法と機械学習アプローチを包含する体系的な分類を提供する。
- 検閲(センサリング)、生存関数/ハザード関数、ベースライン・ハザードなどの主要概念を要約する。
- 代表的な方法(KM、NA、LT;Coxとその派生形;ペナルizedおよびカーネル化Coxモデル;CoxBoost;TD-Cox)とそれらのトレードオフを概説する。
- 生存の文脈における拡張と高度なML技術(アンサンブル、転移学習、マルチタスク、アクティブ学習)を議論する。
- 生存分析で用いられる評価指標と関連定式化を説明する。
- 競合リスク、再発イベント、データの非検閲化、較正、適用などの関連トピックと実装の詳細を論じる。
実験結果
リサーチクエスチョン
- RQ1生存分析手法の主な分類(非パラメトリック、半パラメトリック、パラメトリック)とそれぞれの利点と限界は何か?
- RQ2機械学習手法はどのように生存分析における検閲対応と時間-イベントデータの取り扱いに適合してきたか?
- RQ3生存モデルを評価する際に一般的に用いられる評価指標と定式化は何か?
- RQ4拡張と高度なML技術は生存分析に適用可能か(例:アンサンブル、転移学習、マルチタスク学習)?
- RQ5生存分析手法の実用的な応用と利用可能なソフトウェア実装は何か?
主な発見
- 本論文は、生存分析における従来の統計的方法と機械学習アプローチの包括的な分類と比較を提供する。
- 検閲の取り扱い方法と、生存、ハザード、累積ハザード関数などの主要概念を概説する。
- Kaplan-Meier、Nelson-Aalen、Life-Table、Coxモデルなど、正則化および時変バリアントを含む著名な手法を扱う。
- アンサンブル、転移学習、マルチタスク学習など、生存データに適用された高度なMLアプローチを論じる。
- 競合リスク、再発イベントなどの関連トピックと実用的な適用、および実装上の考慮事項を含む。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。