Skip to main content
QUICK REVIEW

[論文レビュー] MiME: Multilevel Medical Embedding of Electronic Health Records for Predictive Healthcare

Edward Choi, Cao Xiao|arXiv (Cornell University)|Oct 22, 2018
Machine Learning in Healthcare参考文献 38被引用数 99
ひとこと要約

MiME は EHR データから多層埋め込みを学習し、診断–治療の関係を補助タスクでモデリングすることで、特に小規模データセットで強い予測性能を達成します。

ABSTRACT

Deep learning models exhibit state-of-the-art performance for many predictive healthcare tasks using electronic health records (EHR) data, but these models typically require training data volume that exceeds the capacity of most healthcare systems. External resources such as medical ontologies are used to bridge the data volume constraint, but this approach is often not directly applicable or useful because of inconsistencies with terminology. To solve the data insufficiency challenge, we leverage the inherent multilevel structure of EHR data and, in particular, the encoded relationships among medical codes. We propose Multilevel Medical Embedding (MiME) which learns the multilevel embedding of EHR data while jointly performing auxiliary prediction tasks that rely on this inherent EHR structure without the need for external labels. We conducted two prediction tasks, heart failure prediction and sequential disease prediction, where MiME outperformed baseline methods in diverse evaluation settings. In particular, MiME consistently outperformed all baselines when predicting heart failure on datasets of different volumes, especially demonstrating the greatest performance improvement (15% relative gain in PR-AUC over the best baseline) on the smallest dataset, demonstrating its ability to effectively model the multilevel structure of EHR data.

研究の動機と目的

  • コードの本質的な多層構造を活用して、EHRデータに対する深層学習のデータ量不足に対応する。
  • 訪問内の診断–治療の相互作用を捉える多層埋め込みを学習する。
  • 外部ラベルを用いず補助予測タスクを用いて、心不全予測などのタスクで予測性能を向上させる。

提案手法

  • 訪問を、Dxコードを持つ Dx オブジェクトの集合として表現し、関連する治療をそれぞれ含める。
  • Dxコード埋め込みと治療との相互作用を介して g(d_i, m_i) により診断オブジェクト埋め込み o_i を計算する。
  • スキップ接続されたトップダウン形式を用いて訪問埋め込み v を集約し、最終予測のための患者表現 h を導出する。
  • o_i から Dx および治療コードを予測する補助予測タスクを用い、追加ラベルなしで埋め込みを誘導する。
  • Dx–Rx 相互作用を捉えるために g(d_i, m_i) および W_m を用いた二次形式風の相互作用モデリングを組み込む。
  • ターゲットタスク(例:心不全予測)と補助損失(L_aux)として Dx/m 予測コードの補助損失を含むエンドツーエンドで訓練する。

実験結果

リサーチクエスチョン

  • RQ1データが限られている場合に、EHRデータの本質的な多層構造を利用して予測性能を向上させることができるか。
  • RQ2Dx–treatment 関係に基づく補助タスクは、訪問および患者埋め込みの品質と一般化性を向上させるか。
  • RQ3心不全および逐次的疾患の予測において、コードをフラット化する基準モデルや ontology ベースの知識を注入する方法と比較して MiME はどうか。

主な発見

  • MiME はサイズの異なるデータセットの心不全予測タスクでベースラインを上回り、補助タスクを用いた MiME で最小データセットにおいて PR-AUC が相対的に 15% 向上する。
  • MiME は異なるデータ量と訪問の複雑さにわたって心不全予測および逐次疾患予測で一貫してベースラインを上回る。
  • 補助タスクは一般化を改善し、特に小規模またはより複雑なデータセットで効果を発揮し、複数の設定で MiME aux が MiME のみより高い PR-AUC を達成する。
  • MiME はデータ削減に対する頑健性を示し、コード階層のみやフラット化表現を用いるモデルより Dx–treatment 相互作用をより効果的に捉える。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。