[論文レビュー] Improving Hospital Mortality Prediction with Medical Named Entities and Multimodal Learning
論文は、構造化ICUデータと臨床ノートおよび医療固有表現から派生したテキスト表現を組み合わせたマルチモーダルモデルを提案し、構造化データベースラインより院内死亡率予測を改善する。
Clinical text provides essential information to estimate the acuity of a patient during hospital stays in addition to structured clinical data. In this study, we explore how clinical text can complement a clinical predictive learning task. We leverage an internal medical natural language processing service to perform named entity extraction and negation detection on clinical notes and compose selected entities into a new text corpus to train document representations. We then propose a multimodal neural network to jointly train time series signals and unstructured clinical text representations to predict the in-hospital mortality risk for ICU patients. Our model outperforms the benchmark by 2% AUC.
研究の動機と目的
- 構造化データを超える死亡リスク予測を強化するために未構造化の臨床ノートを活用する動機づけ。
- ノートから医療固有表現と否定を抽出する内部医療NERサービスを活用する。
- NoteEmbとEntityEmbの2つのテキスト表現を作成し、それらを時系列データと統合する。
- MIMIC-IIIベンチマークでマルチモーダルアーキテクチャをベースラインLSTMと比較して評価する。
- 臨床ノートとエンティティに起因する性能向上を定量化する。
提案手法
- Doc2VecCを用いて日次集約ノートから埋め込みを生成する(NoteEmb)。
- neural NERサービスを用いて医療エンティティと否定を抽出し、EntityEmbを生成する。
- 2つのアーキテクチャを比較する:構造化データ上のベースラインLSTM(Vital)と、テキスト埋め込みと時系列信号を組み合わせるマルチモーダルモデル。
- MIMIC-IIIから42,276件のICU滞在データを70/15/15の訓練/検証/テスト分割で訓練・評価する。
- 再現性と比較可能性のためにHarutyunyanらのベンチマーク設定を再現する。
実験結果
リサーチクエスチョン
- RQ1日次集約臨床ノートを組み込むことは、構造化データのみよりも死亡率予測を改善するか?
- RQ2医療固有名詞からの埋め込みは、生ノート埋め込みより追加の予測価値を提供するか?
- RQ3マルチモーダルアーキテクチャは、同じデータモダリティを使用した純粋なLSTMよりも性能が良いか?
- RQ4NoteEmbとEntityEmbのAU-ROCおよびAU-PRC指標に対する定量的影響はどの程度か?
主な発見
| モデル | 特徴セット | ニューラルネットワーク構造 | AU-ROC(%) | AU-PRC(%) |
|---|---|---|---|---|
| Vital | (Benchmark) | LSTM | 0.8531 ±0.0020 | 0.5030 ±0.0051 |
| Vital + NoteEmb | Vital + NoteEmb | LSTM | 0.8496 ±0.0018 | 0.5040 ±0.0050 |
| Vital + NoteEmb | Vital + NoteEmb | Multi-modal | 0.8669 ±0.0018 | 0.5310 ±0.0051 |
| Vital + EntityEmb | Vital + EntityEmb | LSTM | 0.8703 ±0.0017 | 0.5470 ±0.0048 |
| Vital + EntityEmb | Vital + EntityEmb | Multi-modal | 0.8734 ±0.0019 | 0.5290 ±0.0056 |
- NoteEmbを用いたマルチモーダルモデルはAU-ROCを0.8669へ改善(Vital+NoteEmb, Multi-modal)、ベースラインLSTMの0.8531と比較。
- EntityEmbを用いたマルチモーダルモデルはAU-ROCを0.8734へ改善(Vital+EntityEmb, Multi-modal)、LSTMの0.8703と比較。
- NoteEmbとLSTMの組み合わせはAU-ROC0.8496、AU-PRC0.5040;EntityEmbとLSTMはAU-ROC0.8703、AU-PRC0.5470。
- 全体として、医療エンティティからの埋め込みは、トークン化ノート埋め込みをAU-ROCで一貫して上回る。
- マルチモーダルアーキテクチャは、特徴セット全体で純粋なLSTMベースラインより性能が向上している。
- 改善は、同じデータ処理フロー下で公開ベンチマークと直接比較可能である。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。