Skip to main content
QUICK REVIEW

[論文レビュー] Learning to Diagnose with LSTM Recurrent Neural Networks

Zachary C. Lipton, David C. Kale|arXiv (Cornell University)|Nov 11, 2015
Machine Learning in Healthcare参考文献 45被引用数 516
ひとこと要約

この論文では、不規則にサンプリングされた多変量時系列の臨床ICUデータからマルチラベル診断を分類するために、長短記憶(LSTM)再帰的ニューラルネットワークを提案する。訓練中にターゲットの複製とドロップアウトを適用することで、手作業で特徴を設計したMLPなどの強力なベースラインと比較して、生の時系列データのみを用いた場合にLSTMモデルが優れた性能を示し、特徴工学をほとんど行わずに臨床時系列における長距離依存関係を効果的に捉えられることを示している。

ABSTRACT

Clinical medical data, especially in the intensive care unit (ICU), consist of multivariate time series of observations. For each patient visit (or episode), sensor data and lab test results are recorded in the patient's Electronic Health Record (EHR). While potentially containing a wealth of insights, the data is difficult to mine effectively, owing to varying length, irregular sampling and missing data. Recurrent Neural Networks (RNNs), particularly those using Long Short-Term Memory (LSTM) hidden units, are powerful and increasingly popular models for learning from sequence data. They effectively model varying length sequences and capture long range dependencies. We present the first study to empirically evaluate the ability of LSTMs to recognize patterns in multivariate time series of clinical measurements. Specifically, we consider multilabel classification of diagnoses, training a model to classify 128 diagnoses given 13 frequently but irregularly sampled clinical measurements. First, we establish the effectiveness of a simple LSTM network for modeling clinical data. Then we demonstrate a straightforward and effective training strategy in which we replicate targets at each sequence step. Trained only on raw time series, our models outperform several strong baselines, including a multilayer perceptron trained on hand-engineered features.

研究の動機と目的

  • 不規則にサンプリングされた多変量臨床時系列データからLSTMが学習できる有効性を評価すること。
  • 可変長、欠損データ、長距離依存関係といった臨床時系列モデリングの課題に対処すること。
  • 線形モデルや手作業で特徴を設計したMLPを含む強力なベースラインと比較してLSTMの性能を評価すること。
  • 正則化技術(ターゲットの複製、補助出力、ドロップアウト)が、小さな臨床データセットにおける一般化性能に与える影響を調査すること。
  • 前処理や特徴工学をほとんど行わない生の時系列データの使用可能性を検討すること。

提案手法

  • モデルは、13個の不規則にサンプリングされた臨床測定値(例:心拍数、血圧)を時間経過とともに処理する単方向LSTMを使用する。
  • ターゲットの複製戦略が適用され、損失関数が各時刻で計算され、最終時刻損失と平均時刻損失の凸結合として組み合わされる。
  • 補助出力を導入することで、ネットワークが追加の臨床変数を予測するように訓練され、一般化性能が向上し、過学習が軽減される。
  • ドロップアウトは非再帰的接続に適用され、さらに正則化が行われ、性能が向上する。
  • データは前方および後方補完による前処理が施され、時系列は固定ウィンドウに再サンプリングされ、入力長が標準化される。
  • モデルは128の一般的な診断コードを対象とするマルチラベル分類を実行し、診断を非排他的ラベルとして扱う。

実験結果

リサーチクエスチョン

  • RQ1生の不規則にサンプリングされた多変量臨床時系列データから、LSTMがマルチラベル診断分類のための意味のある表現を効果的に学習できるか?
  • RQ2ターゲットの複製は、臨床時系列タスクにおける再帰モデルの学習安定性と性能を向上させるか?
  • RQ3補助出力やドロップアウトといった正則化技術は、小さな臨床データセットにおける一般化性能にどのように影響するか?
  • RQ4手作業で特徴を設計したモデルとは対照的に、生データに直接学習させるエンドツーエンドのLSTMは、性能が優れているか?
  • RQ5異なるデータウィンドウ処理および補完戦略は、モデル性能と情報保持にどのように影響するか?

主な発見

  • ターゲットの複製とドロップアウトを適用したLSTMモデルは、手作業で特徴を設計したMLPという最良のベースラインを上回ったが、それらは生の時系列データのみに依存していた。
  • ターゲットの複製は性能を顕著に向上させ、過学習を軽減した。特にドロップアウトと組み合わせた場合、より大きな容量のモデルの使用が可能になった。
  • 補助出力とドロップアウトの組み合わせは矛盾した結果を示し、相互に相殺する可能性があることが示唆された。これは、ターゲットの複製がも既に強力な正則化を提供しているためである可能性がある。
  • 臨床エピソードの最初の6時間と最後の6時間を学習させたモデルが、単に最後の12時間のみを用いた場合よりも優れた性能を示し、初期兆候が診断に重要であることが示された。
  • モデルは、LSTMが症状が初期損傷から数日後に現れる場合でも、臨床時系列における長距離依存関係を効果的に捉えられることを示した。
  • 本研究は、前処理段階で時間的構造を保持することが重要であることを強調しており、現在の補完および再サンプリング手法が、貴重なタイミング情報を損なう可能性がある。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。