QUICK REVIEW

[论文解读] Doctor AI: Predicting Clinical Events via Recurrent Neural Networks

Edward Choi, Mohammad Taha Bahadori|arXiv (Cornell University)|Nov 18, 2015

Machine Learning in Healthcare参考文献 56被引用 252

一句话总结

Doctor AI 是一种基于循环神经网络（RNN）的模型，通过从纵向电子健康记录（EHR）数据中学习时间表征，预测患者多次就诊后的未来诊断和用药订单。其在差异诊断预测中达到 79.58% 的召回率@30，且在不同医疗机构间展现出优异的可迁移性，准确率无显著下降。

ABSTRACT

Leveraging large historical data in electronic health record (EHR), we developed Doctor AI, a generic predictive model that covers observed medical conditions and medication uses. Doctor AI is a temporal model using recurrent neural networks (RNN) and was developed and applied to longitudinal time stamped EHR data from 260K patients over 8 years. Encounter records (e.g. diagnosis codes, medication codes or procedure codes) were input to RNN to predict (all) the diagnosis and medication categories for a subsequent visit. Doctor AI assesses the history of patients to make multilabel predictions (one label for each diagnosis or medication category). Based on separate blind test set evaluation, Doctor AI can perform differential diagnosis with up to 79% recall@30, significantly higher than several baselines. Moreover, we demonstrate great generalizability of Doctor AI by adapting the resulting models from one institution to another without losing substantial accuracy.

研究动机与目标

开发一种基于纵向 EHR 数据的通用、可扩展的临床事件预测模型。
解决在异质性、非计划性临床场景下预测多标签诊断和用药订单的挑战。
通过利用大型机构的迁移学习，在数据量较少的场景下提升预测性能。
评估模型在不同医疗系统和患者群体中的泛化能力。
通过专家验证评估模型预测的临床相关性与可解释性。

提出的方法

该模型使用两层长短期记忆（LSTM）网络对序列化的 EHR 就诊记录进行编码，每次就诊由 ICD-9 诊断码和用药码表示。
通过输出所有可能的诊断和用药类别在下一次就诊时的概率分布，实现多标签预测。
通过在 EHR 就诊序列上预训练的 Skip-gram 嵌入向量初始化 RNN，以加快收敛速度并提高预测准确率。
通过在 Sutter Health 的大规模数据集上进行预训练，并在其他机构（如 MIMIC-II）的小规模数据集上进行微调，实现知识迁移。
时间戳化的就诊序列在不进行时间离散化的情况下处理，保留时间分辨率，支持就诊时间的预测。
采用端到端训练方式，使用交叉熵损失进行多标签分类，使用均方误差损失进行就诊时间预测。

实验结果

研究问题

RQ1基于 RNN 的模型能否有效从纵向 EHR 数据中学习患者轨迹，以预测未来的诊断和用药订单？
RQ2模型性能如何随就诊频率和医疗编码的稀有性而变化？
RQ3在某一医疗系统上预训练的模型，能在多大程度上被适配到另一系统，且性能下降最小？
RQ4使用 Skip-gram 嵌入向量预训练是否能提升 RNN 的训练速度和预测准确率？
RQ5模型的预测是否具有临床意义，并与人类医生的推理过程相当？

主要发现

Doctor AI 在多标签诊断预测中达到 79.58% 的召回率@30，显著优于多个基线模型。
随着患者历史就诊次数的增加，性能持续提升，召回率@30随就诊次数增加而上升，表明对慢性或复杂疾病有更好的建模能力。
模型展现出强大的泛化能力：从 Sutter Health 向 MIMIC-II 进行迁移学习，使小规模数据集上的性能提升超过 10%。
就诊频繁的患者（如合并症负担高的患者）更容易被预测，而罕见疾病如克氏综合征则导致预测结果更加多样化且频繁出现。
使用 Skip-gram 嵌入向量进行预训练，显著提升了训练速度和最终模型的准确率，尤其在低数据场景下效果更明显。
医学专家确认，Doctor AI 的预测具有临床意义，并与普通医生的诊断行为高度一致。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。