[論文レビュー] Explainable artificial intelligence model to predict acute critical illness from electronic health records
本論文では、時間的畳み込みネットワーク(TCN)を用いた予測と、ディープテイラー分解(DTD)を用いた解釈可能性を備えた、説明可能なAIモデルであるxAI-EWSを提案する。このシステムは、急性重症疾患の予測性能が高く(急性腎障害(AKI)のAUROCは最大0.91)、臨床医が各予測に対してどの電子的健康記録(EHR)変数が影響を与えたかを透明に理解できるインスタンスレベルの説明を提供する。これにより、信頼性と臨床的有用性が向上する。
We developed an explainable artificial intelligence (AI) early warning score (xAI-EWS) system for early detection of acute critical illness. While maintaining a high predictive performance, our system explains to the clinician on which relevant electronic health records (EHRs) data the prediction is grounded. Acute critical illness is often preceded by deterioration of routinely measured clinical parameters, e.g., blood pressure and heart rate. Early clinical prediction is typically based on manually calculated screening metrics that simply weigh these parameters, such as Early Warning Scores (EWS). The predictive performance of EWSs yields a tradeoff between sensitivity and specificity that can lead to negative outcomes for the patient. Previous work on EHR-trained AI systems offers promising results with high levels of predictive performance in relation to the early, real-time prediction of acute critical illness. However, without insight into the complex decisions by such system, clinical translation is hindered. In this letter, we present our xAI-EWS system, which potentiates clinical translation by accompanying a prediction with information on the EHR data explaining it.
研究の動機と目的
- 従来の早期警戒スコアよりも、早期かつより正確に急性重症疾患を予測できる説明可能なAIシステムの開発を目的とする。
- ブラックボックスAIモデルに対する臨床的不信感を解消するため、モデル予測の解釈可能でインスタンスレベルの説明を提供することを目的とする。
- 時間的EHRデータをディープラーニングを用いて効果的に統合しながら、リアルタイムの臨床意思決定支援における解釈可能性を維持することを目的とする。
- デンマークの実際のEHRデータを用いて、敗血症、急性腎障害(AKI)、急性肺障害(ALI)の3つの深刻な状態について、モデルの妥当性を検証することを目的とする。
提案手法
- xAI-EWSシステムは、時間的畳み込みネットワーク(TCN)を用いて時系列EHRデータを処理し、急性重症疾患のリスクを0〜1のスケールで予測する。
- 予測の解釈には、ディープテイラー分解(DTD)を適用し、血圧や心拍数などの入力EHR変数に重要性スコアを割り当てる。
- モデルは、2012年から2017年までの66,288人の固有患者から成る163,050件の入院データを含む多施設のデンマークEHRデータセットを用いて学習した。
- モデルの評価には5分割交差検証を用い、性能指標としてAUROCとAUPRCを測定した。
- 説明の妥当性は、救急医学専門医による手動による検査を通じて検証された。臨床的関連性と妥当性を評価した。
- ベースラインモデルには、MEWS、SOFA、GB-Vitalが含まれ、xAI-EWSとの予測性能および解釈可能性の比較が行われた。
実験結果
リサーチクエスチョン
- RQ1説明可能なAIモデルは、EHRデータを用いて、従来の早期警戒スコアを上回って急性重症疾患を予測できるか?
- RQ2ディープテイラー分解は、集中治療分野における複雑なディープラーニング予測に対して、臨床的に意味のある解釈可能な説明をどの程度提供できるか?
- RQ3xAI-EWSシステムは、実世界のEHR環境下で、敗血症、AKI、ALIといった多様な深刻な状態において、どの程度の性能を示すか?
- RQ4時間的モデリングと説明可能なAIを統合することで、リアルタイムの患者モニタリングにおけるAIの信頼性と採用促進が図れるか?
- RQ5EHRベースの急性重症疾患予測において、予測性能と解釈可能性のトレードオフはどのようなものか?
主な発見
- xAI-EWSモデルは、急性腎障害(AKI)に対してAUROC 0.91を達成し、高い予測性能を示した。
- 敗血症予測においては、AUROC 0.88を達成し、MEWS や SOFA などのベースラインモデルを顕著に上回った。
- GB-Vitalベースラインモデルは、急性重症疾患の早期発見において、xAI-EWSに比べて低い性能を示した。
- 臨床医による検証済みの説明から、モデルが血圧の低下や心拍数の上昇といった重要な生理的傾向を正しく予測要因として特定していることが判明した。
- DTDの使用により、予測意思決定が関連するEHR変数に信頼性高くインスタンス固有に帰属付けられ、臨床的解釈可能性が向上した。
- モデルは、敗血症、AKI、ALIのすべての状態で高い性能を維持しており、多様な急性重症疾患への一般化能力を確認した。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。