Skip to main content
QUICK REVIEW

[論文レビュー] Time-to-Event Prediction with Neural Networks and Cox Regression

Håvard Kvamme, Ørnulf Borgan|arXiv (Cornell University)|Jul 1, 2019
Statistical Methods and Inference参考文献 32被引用数 230
ひとこと要約

この論文は Coxproportional hazards モデルをニューラルネットワークと統合して、イベントまでの時間予測を可能にし、比例および非比例ハザードの両方に対してスケーラブルなケース-コントロール損失を導入し、Pythonパッケージが入手可能な実データセットで競争力のある性能を示す。

ABSTRACT

New methods for time-to-event prediction are proposed by extending the Cox proportional hazards model with neural networks. Building on methodology from nested case-control studies, we propose a loss function that scales well to large data sets, and enables fitting of both proportional and non-proportional extensions of the Cox model. Through simulation studies, the proposed loss function is verified to be a good approximation for the Cox partial log-likelihood. The proposed methodology is compared to existing methodologies on real-world data sets, and is found to be highly competitive, typically yielding the best performance in terms of Brier score and binomial log-likelihood. A python package for the proposed methods is available at https://github.com/havakv/pycox.

研究の動機と目的

  • 時間-to-event予測の動機づけと生存分析による検閲の扱い。
  • ニューラルネットワークを統合して共変量効果の非線形性を捉えることでCoxモデルを拡張する。
  • 大規模データセットに適したケース-コントロールサンプリングに基づくスケーラブルな訓練損失を提供する。
  • 時系列依存の相対リスク関数を用いて非比例ハザードへ拡張する。
  • 提案手法を再現性のために実装した Python パッケージを提供する。

提案手法

  • 線形予測子 g(x) を Cox フレームワーク内でニューラルネットワーク g(x) に置換する。
  • Cox 部分対数尤度を近似し、バッチにスケールするケース-コントロールサンプリングに基づく損失を導入する(式 8 および 9 の損失形)。
  • 非線形モデル(Cox-MLP)へ一般化し、時系列依存の g(t, x) を用いた非比例時間成分(Cox-Time)を導入する。
  • ニューラルネットワークを使用する場合の g(x) の正則化を目的とした小さなペナルティを組み込む(式 10)。
  • ベースラインハザードを Breslow 法で推定し生存関数を計算して予測を適応させる。非比例ハザードの場合は計算効率のため予測を時間で離散化する。
  • これらの手法を実装する Python パッケージ(pycox)を提供する。

実験結果

リサーチクエスチョン

  • RQ1ニューラルネットワークをCoxモデリングと統合することで、検閲を扱いながら時間-to-event予測を改善できるか。
  • RQ2ケース-コントロールベースの損失は大規模データ設定においてCox部分対数尤度のスケーラブルで正確な近似を提供するか。
  • RQ3Cox フレームワークを非線形(Cox-MLP)および非比例(Cox-Time)ハザードへ拡張する際、計算コストを過度に増やさず実現可能か。
  • RQ4提案手法は実データの生存データセットで既存手法(DeepSurv, DeepHit, RSF)と比べてどうか。

主な発見

  • 提案されたケース-コントロール損失は Cox 部分対数尤度を近似し、バッチサイズを越えて安定している。
  • データサイズが大きくなるにつれて Cox-SGD のパラメータ推定は古典的な Cox 推定に収束する;より多くのコントロールをサンプリングすると小規模データセットに有利だが計算コストが増加する。
  • Cox-Time による非比例ハザードは、シミュレーションデータ上で比例ハザード法より生存関数推定を改善。
  • SUPPORT、METABRIC、Rotterdam & GBSG、FLCHAIN を含む5つの実世界データセット全体で、提案手法は C-index、Brier スコア、二項対数尤度といった識別力・カリブレーション指標で既存手法と競合、または優れている。
  • 著者はこれらの手法を実装し、シミュレーションと分析を再現する PyTorch ベースの Python パッケージ(pycox)を提供している。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。