QUICK REVIEW

[論文レビュー] Multi-task Prediction of Disease Onsets from Longitudinal Lab Tests

Narges Razavian, Jake Marcus|arXiv (Cornell University)|Aug 2, 2016

Machine Learning in Healthcare参考文献 17被引用数 39

ひとこと要約

本論文では、15か月前までに133種の疾患発症を予測するため、生の縦断的検査データを用いたマルチタスクディープラーニングフレームワークを提案する。298,000人の患者の36か月間にわたる18種の検査項目に対してLSTMと2つの新規CNNアーキテクチャを適用した結果、臨床的特徴工学を施したロジスティック回帰ベースラインを著しく上回り、生データからの表現学習が医療分野における早期疾患予測を向上させることを示した。

ABSTRACT

Disparate areas of machine learning have benefited from models that can take raw data with little preprocessing as input and learn rich representations of that raw data in order to perform well on a given prediction task. We evaluate this approach in healthcare by using longitudinal measurements of lab tests, one of the more raw signals of a patient's health state widely available in clinical data, to predict disease onsets. In particular, we train a Long Short-Term Memory (LSTM) recurrent neural network and two novel convolutional neural networks for multi-task prediction of disease onset for 133 conditions based on 18 common lab tests measured over time in a cohort of 298K patients derived from 8 years of administrative claims data. We compare the neural networks to a logistic regression with several hand-engineered, clinically relevant features. We find that the representation-based learning approaches significantly outperform this baseline. We believe that our work suggests a new avenue for patient risk stratification based solely on lab results.

研究の動機と目的

生の縦断的検査データを用い、広範な臨床的特徴工学を施さずに、医療分野における早期疾患予測を改善すること。
手作業で設計された臨床的特徴に依存する従来の機械学習モデルと比較して、表現ベースのディープラーニングモデルが優れているかどうかを評価すること。
疎で非同期的な検査測定値から、一度に複数の疾患発症を予測できるマルチタスク学習フレームワークを開発・検証すること。
実世界の請求データを用いたエンドツーエンドのディープラーニングが、患者のリスク分類に臨床的に有用であることを示すこと。

提案手法

疾患発症予測のため、各患者の18種の縦断的検査値を36か月分のスライディングウインドウで処理する。
検査値の時系列的依存関係をモデル化するため、長短期記憶（LSTM）再帰ニューラルネットワークを訓練する。
時系列的検査データから階層的なパターンを抽出するため、2つの新規1次元畳み込みニューラルネットワーク（CNN）アーキテクチャを導入する。
1つの共有表現を用いて、133種の異なる疾患発症を同時に予測するマルチタスク学習の設定を採用する。
入力はドメイン特化のない生で正規化された検査値（zスコア）であり、分野特化のない特徴工学は一切施さない。
ロジスティック回帰ベースラインは、検査トレンドと要約から得られた20の手作業で設計された臨床的関連特徴を用いて訓練される。

実験結果

リサーチクエスチョン

RQ1生の縦断的検査データを学習対象としたディープラーニングモデルは、熟練医師が設計した特徴に依存する従来のモデルを上回って疾患発症を予測できるか？
RQ21つの統合的ディープラーニングアーキテクチャから、多様で臨床的に重要な疾患発症を予測するマルチタスク学習はどの程度効果的か？
RQ3表現ベースのモデルは、トレーニング時に明示的にターゲットとされていない疾患の兆候をどの程度早期に検出できるか？
RQ4最小限の前処理で生の、加工されていない検査データを用いることで、臨床的特徴工学に依存するモデルよりも優れた予測性能が得られるか？
RQ5異なるディープラーニングアーキテクチャ（LSTM対CNN）は、疎で非同期的な臨床的検査データの時系列的パターンをどの程度適切に捉えられるか？

主な発見

提案されたディープラーニングモデルは、133の疾患状態において、ロジスティック回帰ベースラインを著しく上回る性能を示した。
LSTMおよび2つの新規CNNモデルは、手作業で設計された特徴ベースラインを上回る優れた性能を達成し、エンドツーエンドの表現学習の価値を示した。
トレーニング時に直接的に検査されていなかった疾患の予測にも成功しており、早期リスク分類における広範な臨床的有用性の可能性を示した。
最高性能を示したモデルは、代謝、腎臓、循環器系疾患を含む多様な疾患カテゴリにおいて、AUCが一貫して向上した。
ベースラインモデルからの特徴重要度分析により、グルコースやクレアチニンのトレンドといった臨床的に妥当なバイオマーカーが特定され、予測タスクの妥当性を裏付けた。
本研究は、生の検査データがディープラーニングモデルによって処理されれば、熟練医師がラベル付けした特徴に依存することなく、多疾患予測に十分な信号を含んでいることを確認した。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。