QUICK REVIEW

[論文レビュー] Explainable Artificial Intelligence for Human Decision-Support System in Medical Domain

Samanta Knapic̆, Avleen Malhi|arXiv (Cornell University)|May 5, 2021

Colorectal Cancer Screening and Detection被引用数 4

ひとこと要約

本研究では、胃内視鏡動画のデータを用いて、医療画像解析における説明可能なAI（XAI）手法であるLIME、SHAP、CIUの3つを評価し、臨床現場における信頼性と意思決定支援を向上させることを目的としている。CIUは、人間の意思決定支援、透明性、説明の速度の面でLIMEおよびSHAPを上回り、AI支援診断における臨床現場への導入可能性を示している。

ABSTRACT

In the present paper we present the potential of Explainable Artificial Intelligence methods for decision-support in medical image analysis scenarios. With three types of explainable methods applied to the same medical image data set our aim was to improve the comprehensibility of the decisions provided by the Convolutional Neural Network (CNN). The visual explanations were provided on in-vivo gastral images obtained from a Video capsule endoscopy (VCE), with the goal of increasing the health professionals' trust in the black box predictions. We implemented two post-hoc interpretable machine learning methods LIME and SHAP and the alternative explanation approach CIU, centered on the Contextual Value and Utility (CIU). The produced explanations were evaluated using human evaluation. We conducted three user studies based on the explanations provided by LIME, SHAP and CIU. Users from different non-medical backgrounds carried out a series of tests in the web-based survey setting and stated their experience and understanding of the given explanations. Three user groups (n=20, 20, 20) with three distinct forms of explanations were quantitatively analyzed. We have found that, as hypothesized, the CIU explainable method performed better than both LIME and SHAP methods in terms of increasing support for human decision-making as well as being more transparent and thus understandable to users. Additionally, CIU outperformed LIME and SHAP by generating explanations more rapidly. Our findings suggest that there are notable differences in human decision-making between various explanation support settings. In line with that, we present three potential explainable methods that can with future improvements in implementation be generalized on different medical data sets and can provide great decision-support for medical experts.

研究の動機と目的

ブラックボックスAI予測の解釈可能性と信頼性を向上させることで、医療画像解析分野における臨床意思決定支援を強化すること。
説明可能なAI手法が、AIが生成する診断の解釈における人間の意思決定の正確性と透明性を向上させられるかどうかを評価すること。
同じ医療画像データセットを用いて、LIME、SHAP、および新規のCIUアプローチという3つのXAI手法の有効性を比較すること。
非医療分野の参加者を対象とした実験を通じて、異なる種類の説明が人間の理解度と意思決定パフォーマンスに与える影響を評価すること。
特にドメイン専門家を想定した実世界の臨床環境におけるXAIの今後の実装に役立つインサイトを提供すること。

提案手法

CNNによる予測の局所的・インスタンスレベルの説明を生成するために、post-hoc説明手法のLIMEとSHAPを、動画内視鏡による生体内胃画像に適用した。
ゲーム理論的原則に基づき、文脈的価値と有用性を用いて特徴量の重要度を計算するCIU（Contextual Value and Utility）手法を実装し、LIMEやSHAPよりも包括的な説明を提供した。
各手法に対して、特に予測に寄与する画像領域を強調する可視化説明（例：サリエンシーマップ）を生成した。
非医療分野の参加者60名（各手法20名）を対象に、ウェブベースの3回のユーザースタディを実施し、説明の明確さ、信頼性、意思決定の正確性を評価した。
正解意思決定率や説明理解度スコアといった定量的指標を用いて、3つのXAI手法を比較した。
説明ありと説明なしの両条件を評価し、人間のパフォーマンスに与える影響を測定した。

実験結果

リサーチクエスチョン

RQ1RQ1: 説明可能なAIは、医療分野におけるAIベースのコンピュータビジョンシステムの信頼性を向上させることができるか？
RQ2RQ2: 複数のXAIアプローチは、医療画像解析における有効な人間の意思決定支援システムとして機能できるか？
RQ3RQ3: LIME、SHAP、CIUという異なる説明手法は、使いやすさ、透明性、人間の意思決定の正確性に与える影響の面で、どのように比較できるか？
RQ4RQ4: 説明の有無が、説明なしの状況と比較して、ユーザーがより多くの正しい意思決定を下すよう支援するか？
RQ5RQ5: LIME、SHAP、CIUの間で、説明理解度および意思決定パフォーマンスに測定可能な差が存在するか？

主な発見

CIU手法は、LIMEおよびSHAPと比較して、人間の意思決定の正確性を顕著に向上させた。CIUの説明に従った参加者は、より多くの正しい意思決定を下した。
ユーザーの評価では、CIUの説明がLIMEおよびSHAPよりも透明性が高く、理解しやすかった。これは、ユーザーの理解度が優れていることを示している。
CIUは、LIMEおよびSHAPよりも説明の生成が迅速に行われた。これは、説明提供における計算効率が優れていることを示唆している。
他の手法とは異なり、SHAPの研究では説明なしの条件でより多くの正しい意思決定が得られた。これは、SHAPの説明がユーザーにとって混乱を招いたり、誤解を招くものであった可能性を示している。
説明支援は、2回のユーザースタディ（LIMEおよびCIU）では正しい意思決定数を増加させたが、SHAPのスタディではその効果が認められなかった。これは、人間認知に与える影響が手法に依存することを示している。
本研究の結果から、すべてのXAI手法が人間の意思決定を同等に支援するわけではないことが示され、説明手法の選択がユーザーの信頼性とパフォーマンスに顕著な影響を与えることがわかった。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。