Skip to main content
QUICK REVIEW

[论文解读] Learning to Detect Sepsis with a Multitask Gaussian Process RNN Classifier

Joseph Futoma, Sanjay Hariharan|arXiv (Cornell University)|Jun 13, 2017
Sepsis Diagnosis and Treatment参考文献 19被引用 66
一句话总结

一个可扩展的端到端分类器,使用 Multitask Gaussian Processes 对不规则的多变量临床时间序列进行插值,然后输入到 RNN 以预测几小时内的败血症。

ABSTRACT

We present a scalable end-to-end classifier that uses streaming physiological and medication data to accurately predict the onset of sepsis, a life-threatening complication from infections that has high mortality and morbidity. Our proposed framework models the multivariate trajectories of continuous-valued physiological time series using multitask Gaussian processes, seamlessly accounting for the high uncertainty, frequent missingness, and irregular sampling rates typically associated with real clinical data. The Gaussian process is directly connected to a black-box classifier that predicts whether a patient will become septic, chosen in our case to be a recurrent neural network to account for the extreme variability in the length of patient encounters. We show how to scale the computations associated with the Gaussian process in a manner so that the entire system can be discriminatively trained end-to-end using backpropagation. In a large cohort of heterogeneous inpatient encounters at our university health system we find that it outperforms several baselines at predicting sepsis, and yields 19.4% and 55.5% improved areas under the Receiver Operating Characteristic and Precision Recall curves as compared to the NEWS score currently used by our hospital.

研究动机与目标

  • 利用丰富的、非规则的多变量临床时间序列,以更早且更准确地检测败血症。
  • 对生理数据中的不确定性和缺失进行建模,以提升预测性能。
  • 在一个端到端可训练的框架中,将基于 MGP 的插补与深度学习分类器整合。

提出的方法

  • 用 Multitask Gaussian Process (MGP) 对生理时间序列建模,以在变量间获得潜在、规律化的表示。
  • 将 MGP 连接到 Recurrent Neural Network (RNN, specifically LSTM) 以输出败血症概率。
  • 通过蒙特卡洛估计和重参数化,最小化 MGP 后验的期望损失,实现端到端训练。
  • 使用基于 Lanczos 的 Krylov 方法,从高维 MGPPosterior 中高效抽样,以实现可扩展性。
  • 将基线协变量和药物给药时序作为 RNN 的额外输入。
  • 与 NEWS/MEWS/SIRS 以及基线 GP/RNN 变体进行比较,以评估性能提升。

实验结果

研究问题

  • RQ1是否可以利用 multitask Gaussian Process 来插值和填补不规则的多变量临床时间序列,以进行败血症预测?
  • RQ2端到端 MGP-RNN 学习是否在判别性和时效性方面优于传统的早期预警分数和非端到端基线?
  • RQ3将不确定性和跨变量相关性纳入考虑在预测性能和降低误报方面能带来多少改进?

主要发现

  • MGP-RNN 大约在 4 小时前检测到败血症。
  • 在提前 4 小时时,模型实现灵敏度 0.85 和精确度 0.64。
  • 与在原始数据上训练的 RNN 相比,MGP-RNN 在 AU-ROC 上提升 4.3%,在 AU-PR 上提升 11.1%。
  • 该方法在精确度更高、警报负担更低方面优于 NEWS、MEWS 和 SIRS。
  • 相较于 NEWS,在 0.85 灵敏度且提前 4 小时的情况下,该方法每个真警报约产生 0.5 个误报,而 NEWS 大约为 2.5。
  • 端到端训练结合不确定性传播,相较于 MGP-RNN-mean 和单变量 GP 基线提供了收益。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。