Skip to main content
QUICK REVIEW

[論文レビュー] Deepr: A Convolutional Net for Medical Records

Phuoc Nguyen, Truyen Tran|arXiv (Cornell University)|Jul 26, 2016
Machine Learning in Healthcare参考文献 35被引用数 28
ひとこと要約

Deepr は、不規則な電子的医療記録(EMR)を、時間間隔で分離された臨床的イベントの系列に変換するディープラーニングフレームワークであり、畳み込みニューラルネットワークを用いて予測可能な局所的臨床モチーフを検出し、将来の健康リスクを予測する。従来の手法よりも優れた精度を達成するとともに、モチーフの可視化によって解釈可能なリスク説明を可能にする。

ABSTRACT

Feature engineering remains a major bottleneck when creating predictive systems from electronic medical records. At present, an important missing element is detecting predictive regular clinical motifs from irregular episodic records. We present Deepr (short for Deep record), a new end-to-end deep learning system that learns to extract features from medical records and predicts future risk automatically. Deepr transforms a record into a sequence of discrete elements separated by coded time gaps and hospital transfers. On top of the sequence is a convolutional neural net that detects and combines predictive local clinical motifs to stratify the risk. Deepr permits transparent inspection and visualization of its inner working. We validate Deepr on hospital data to predict unplanned readmission after discharge. Deepr achieves superior accuracy compared to traditional techniques, detects meaningful clinical motifs, and uncovers the underlying structure of the disease and intervention space.

研究の動機と目的

  • 電子的医療記録(EMR)における特徴工学の課題に対処すること。これは人的労力が多く、データ構造の変化に適応できない。
  • 時間的に不規則で発作的な医療記録を、時間間隔と病院移動を特別なトークンとして符号化することで、系列ベースの表現にモデル化すること。
  • 手動による特徴工学を伴わず、原始的なEMRデータから予測可能な臨床モチーフを自動で学習すること。
  • エンドツーエンドのディープラーニングアーキテクチャを用いて、予期しない入院再発のリスク予測を向上させること。
  • 可視化された臨床モチーフと注目メカニズムを通じて、予測の透明性と解釈可能性を提供すること。

提案手法

  • Deepr は、各EMRを、診断や手術などの離散的臨床イベントの可変長系列として表現し、時間間隔と移動インジケータで分離する。
  • 語彙埋め込みを用いて、臨床イベントと時間間隔を連続空間内の密なベクトル表現にマップする。
  • 1次元畳み込みニューラルネットワーク(CNN)を用いて、繰り返し現れる疾患進行や治療の系列などの局所的パターン(モチーフ)を検出する。
  • マックスプーリングを用いて、局所的モチーフ特徴をグローバルな患者表現ベクトルに集約する。
  • グローバル表現は、予測分類器に渡され、未計画な6か月以内の再入院などの将来的なリスクを予測する。
  • すべてのコンponentsはバックプロパゲーションを用いてエンドツーエンドで訓練され、特徴抽出と予測の共同最適化が可能になる。

実験結果

リサーチクエスチョン

  • RQ1手動による特徴工学を伴わず、不規則で発作的なEMRから意味のある臨床モチーフを自動で学習できるか?
  • RQ2時間間隔と移動を特別なトークンとしてモデル化することで、訪問タイミングが変動するEMRにおけるリスク予測がどのように向上するか?
  • RQ3CNNベースのアーキテクチャは、将来の健康結果を予測するのに有効な局所的臨床パターンを効果的に検出できるか?
  • RQ4Deeprは、未計画な入院再発を予測する際、従来のbag-of-wordsや他のディープラーニングベースラインよりもどの程度優れているか?
  • RQ5Deeprの内部表現は、意味的に解釈可能に可視化できるか? これにより、疾患と治療の進行パターンの背後にある潜在的パターンが明らかになるか?

主な発見

  • Deepr は、30万件の患者からなるデータセットにおいて、従来のbag-of-wordsや他のディープラーニングベースラインと比較して、未計画な6か月以内の再入院予測において優れた予測精度を達成した。
  • モデルは臨床的に意味のあるモチーフを効果的に検出した。例えば、糖尿病から腎不全への進行経路や治療プロトコルの繰り返しパターンなど。
  • Deepr は疾患と介入の空間の背後にある構造を解明し、患者の経路に隠れた潜在的パターンを明らかにした。
  • 可視化されたモチーフ反応を通じて、透明性があり解釈可能な予測が可能となり、根拠に基づく臨床意思決定を支援する。
  • 短い記録(例:1回または2回の訪問)においても、RNNベースのモデル(例:DeepCare)を上回る性能を示し、記録長にかかわらず堅牢であることが判明した。
  • このフレームワークは汎用的かつ拡張可能であり、再入院にとどまらず、疾患の発症や進行といった他のリスク予測タスクにも応用可能である。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。