QUICK REVIEW

[論文レビュー] Time-to-Event Prediction with Neural Networks and Cox Regression

Håvard Kvamme, Ørnulf Borgan|arXiv (Cornell University)|Jul 1, 2019

Statistical Methods and Inference参考文献 32被引用数 230

ひとこと要約

この論文は Coxproportional hazards モデルをニューラルネットワークと統合して、イベントまでの時間予測を可能にし、比例および非比例ハザードの両方に対してスケーラブルなケース-コントロール損失を導入し、Pythonパッケージが入手可能な実データセットで競争力のある性能を示す。

ABSTRACT

New methods for time-to-event prediction are proposed by extending the Cox proportional hazards model with neural networks. Building on methodology from nested case-control studies, we propose a loss function that scales well to large data sets, and enables fitting of both proportional and non-proportional extensions of the Cox model. Through simulation studies, the proposed loss function is verified to be a good approximation for the Cox partial log-likelihood. The proposed methodology is compared to existing methodologies on real-world data sets, and is found to be highly competitive, typically yielding the best performance in terms of Brier score and binomial log-likelihood. A python package for the proposed methods is available at https://github.com/havakv/pycox.

研究の動機と目的

時間-to-event予測の動機づけと生存分析による検閲の扱い。
ニューラルネットワークを統合して共変量効果の非線形性を捉えることでCoxモデルを拡張する。
大規模データセットに適したケース-コントロールサンプリングに基づくスケーラブルな訓練損失を提供する。
時系列依存の相対リスク関数を用いて非比例ハザードへ拡張する。
提案手法を再現性のために実装した Python パッケージを提供する。

提案手法

線形予測子 g(x) を Cox フレームワーク内でニューラルネットワーク g(x) に置換する。
Cox 部分対数尤度を近似し、バッチにスケールするケース-コントロールサンプリングに基づく損失を導入する（式 8 および 9 の損失形）。
非線形モデル（Cox-MLP）へ一般化し、時系列依存の g(t, x) を用いた非比例時間成分（Cox-Time）を導入する。
ニューラルネットワークを使用する場合の g(x) の正則化を目的とした小さなペナルティを組み込む（式 10）。
ベースラインハザードを Breslow 法で推定し生存関数を計算して予測を適応させる。非比例ハザードの場合は計算効率のため予測を時間で離散化する。
これらの手法を実装する Python パッケージ（pycox）を提供する。

実験結果

リサーチクエスチョン

RQ1ニューラルネットワークをCoxモデリングと統合することで、検閲を扱いながら時間-to-event予測を改善できるか。
RQ2ケース-コントロールベースの損失は大規模データ設定においてCox部分対数尤度のスケーラブルで正確な近似を提供するか。
RQ3Cox フレームワークを非線形（Cox-MLP）および非比例（Cox-Time）ハザードへ拡張する際、計算コストを過度に増やさず実現可能か。
RQ4提案手法は実データの生存データセットで既存手法（DeepSurv, DeepHit, RSF）と比べてどうか。

主な発見

提案されたケース-コントロール損失は Cox 部分対数尤度を近似し、バッチサイズを越えて安定している。
データサイズが大きくなるにつれて Cox-SGD のパラメータ推定は古典的な Cox 推定に収束する；より多くのコントロールをサンプリングすると小規模データセットに有利だが計算コストが増加する。
Cox-Time による非比例ハザードは、シミュレーションデータ上で比例ハザード法より生存関数推定を改善。
SUPPORT、METABRIC、Rotterdam & GBSG、FLCHAIN を含む5つの実世界データセット全体で、提案手法は C-index、Brier スコア、二項対数尤度といった識別力・カリブレーション指標で既存手法と競合、または優れている。
著者はこれらの手法を実装し、シミュレーションと分析を再現する PyTorch ベースの Python パッケージ（pycox）を提供している。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。