QUICK REVIEW

[論文レビュー] What Clinicians Want: Contextualizing Explainable Machine Learning for Clinical End Use

Sana Tonekaboni, Shalmali Joshi|arXiv (Cornell University)|May 13, 2019

Explainable Artificial Intelligence (XAI)参考文献 76被引用数 239

ひとこと要約

この論文は ICU および ED の臨床医を対象に、説明可能な ML を臨床実践へ翻訳するための具体的な説明可能性クラスと評価指標を定義する。

ABSTRACT

Translating machine learning (ML) models effectively to clinical practice requires establishing clinicians' trust. Explainability, or the ability of an ML model to justify its outcomes and assist clinicians in rationalizing the model prediction, has been generally understood to be critical to establishing trust. However, the field suffers from the lack of concrete definitions for usable explanations in different settings. To identify specific aspects of explainability that may catalyze building trust in ML models, we surveyed clinicians from two distinct acute care specialties (Intenstive Care Unit and Emergency Department). We use their feedback to characterize when explainability helps to improve clinicians' trust in ML models. We further identify the classes of explanations that clinicians identified as most relevant and crucial for effective translation to clinical practice. Finally, we discern concrete metrics for rigorous evaluation of clinical explainability methods. By integrating perceptions of explainability between clinicians and ML researchers we hope to facilitate the endorsement and broader adoption and sustained use of ML systems in healthcare.

研究の動機と目的

説明可能性が臨床実践のための ML モデルへの信頼を構築する方法を特定する。
ICU および ED の settings で臨床医にとって最も関連性が高い説明のクラスを特徴づける。
説明可能性の考慮を ML 設計に統合して信頼性と採用を促進する方法を説明する。
臨床説明可能性手法の厳密な評価のための指標を提案する。
臨床現場への翻訳を促進するために臨床医のニーズと機械学習研究を橋渡しする。

提案手法

モデル実装前の臨床医との上流ステークホルダー・エンゲージメント。
説明可能性の期待を探る臨床医10名（ICUと ED）への定性的インタビュー。
ICU での CA 推定や ED での acuity ラ ranking など、仮想的な対話型シナリオを用いて説明を検証。
インタビューはテーマ飽和まで実施され、インタビュー・プロトコルに guided された。
説明のクラスと、それらが異なる臨床現場（ICU 対 ED）に適用可能かを特定。
臨床ワークフローと意思決定に根ざした評価指標の提案。

実験結果

リサーチクエスチョン

RQ1ML の説明可能性のどの側面が実際の臨床 practice におけるモデル予測への信頼を高めるのか？
RQ2ICU および ED の臨床医にとって最も関連性が高く実行可能な説明クラスは何か？
RQ3説明可能性をどのように運用化し評価して、ML ツールの臨床翻訳を支援できるか？
RQ4臨床説明可能性手法の有用性と信頼性を最もよく評価する指標は何か？

主な発見

臨床医は、既存の医療エビデンスと臨床実践の文脈内で予測を正当化する手段として説明可能性を捉えている。
患者レベルおよび集団レベルの特徴重要度は、信頼と臨床判断との整合性のために重要である。
インスタンスレベルの説明（例：類似ケースを示す）は文脈依存であり、時間制約のある ICU/ED 設定では有用性が低い。
不確実性と信頼度スコアは、アラーム疲労を管理し、臨床行動と期待を整合させる説明の一部として評価される。
時系列の説明と透明性のある設計（例：意思決定プロセスを示す）は重要だが、ハイプレッシャーな環境で認知過負荷を回避するための配慮が必要。
本研究は、将来の臨床 ML 研究と導入を情報提供する具体的な説明クラスと評価指標を提供する。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。