[論文レビュー] Time-to-Event Prediction with Neural Networks and Cox Regression
この論文は Coxproportional hazards モデルをニューラルネットワークと統合して、イベントまでの時間予測を可能にし、比例および非比例ハザードの両方に対してスケーラブルなケース-コントロール損失を導入し、Pythonパッケージが入手可能な実データセットで競争力のある性能を示す。
New methods for time-to-event prediction are proposed by extending the Cox proportional hazards model with neural networks. Building on methodology from nested case-control studies, we propose a loss function that scales well to large data sets, and enables fitting of both proportional and non-proportional extensions of the Cox model. Through simulation studies, the proposed loss function is verified to be a good approximation for the Cox partial log-likelihood. The proposed methodology is compared to existing methodologies on real-world data sets, and is found to be highly competitive, typically yielding the best performance in terms of Brier score and binomial log-likelihood. A python package for the proposed methods is available at https://github.com/havakv/pycox.
研究の動機と目的
- 時間-to-event予測の動機づけと生存分析による検閲の扱い。
- ニューラルネットワークを統合して共変量効果の非線形性を捉えることでCoxモデルを拡張する。
- 大規模データセットに適したケース-コントロールサンプリングに基づくスケーラブルな訓練損失を提供する。
- 時系列依存の相対リスク関数を用いて非比例ハザードへ拡張する。
- 提案手法を再現性のために実装した Python パッケージを提供する。
提案手法
- 線形予測子 g(x) を Cox フレームワーク内でニューラルネットワーク g(x) に置換する。
- Cox 部分対数尤度を近似し、バッチにスケールするケース-コントロールサンプリングに基づく損失を導入する(式 8 および 9 の損失形)。
- 非線形モデル(Cox-MLP)へ一般化し、時系列依存の g(t, x) を用いた非比例時間成分(Cox-Time)を導入する。
- ニューラルネットワークを使用する場合の g(x) の正則化を目的とした小さなペナルティを組み込む(式 10)。
- ベースラインハザードを Breslow 法で推定し生存関数を計算して予測を適応させる。非比例ハザードの場合は計算効率のため予測を時間で離散化する。
- これらの手法を実装する Python パッケージ(pycox)を提供する。
実験結果
リサーチクエスチョン
- RQ1ニューラルネットワークをCoxモデリングと統合することで、検閲を扱いながら時間-to-event予測を改善できるか。
- RQ2ケース-コントロールベースの損失は大規模データ設定においてCox部分対数尤度のスケーラブルで正確な近似を提供するか。
- RQ3Cox フレームワークを非線形(Cox-MLP)および非比例(Cox-Time)ハザードへ拡張する際、計算コストを過度に増やさず実現可能か。
- RQ4提案手法は実データの生存データセットで既存手法(DeepSurv, DeepHit, RSF)と比べてどうか。
主な発見
- 提案されたケース-コントロール損失は Cox 部分対数尤度を近似し、バッチサイズを越えて安定している。
- データサイズが大きくなるにつれて Cox-SGD のパラメータ推定は古典的な Cox 推定に収束する;より多くのコントロールをサンプリングすると小規模データセットに有利だが計算コストが増加する。
- Cox-Time による非比例ハザードは、シミュレーションデータ上で比例ハザード法より生存関数推定を改善。
- SUPPORT、METABRIC、Rotterdam & GBSG、FLCHAIN を含む5つの実世界データセット全体で、提案手法は C-index、Brier スコア、二項対数尤度といった識別力・カリブレーション指標で既存手法と競合、または優れている。
- 著者はこれらの手法を実装し、シミュレーションと分析を再現する PyTorch ベースの Python パッケージ(pycox)を提供している。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。