[论文解读] DeepCOVIDExplainer: Explainable COVID-19 Diagnosis Based on Chest X-ray Images
本论文介绍 DeepCOVIDExplainer,一种可解释的神经集成用于从胸部 X 光片检测 COVID-19,利用 Grad-CAM++ 和 LRP 提供区域级解释,在平衡数据上对 COVID-19 的精确度/召回率高,PPV 大约为 96%。
Amid the coronavirus disease(COVID-19) pandemic, humanity experiences a rapid increase in infection numbers across the world. Challenge hospitals are faced with, in the fight against the virus, is the effective screening of incoming patients. One methodology is the assessment of chest radiography(CXR) images, which usually requires expert radiologist's knowledge. In this paper, we propose an explainable deep neural networks(DNN)-based method for automatic detection of COVID-19 symptoms from CXR images, which we call DeepCOVIDExplainer. We used 15,959 CXR images of 15,854 patients, covering normal, pneumonia, and COVID-19 cases. CXR images are first comprehensively preprocessed, before being augmented and classified with a neural ensemble method, followed by highlighting class-discriminating regions using gradient-guided class activation maps(Grad-CAM++) and layer-wise relevance propagation(LRP). Further, we provide human-interpretable explanations of the predictions. Evaluation results based on hold-out data show that our approach can identify COVID-19 confidently with a positive predictive value(PPV) of 91.6%, 92.45%, and 96.12%; precision, recall, and F1 score of 94.6%, 94.3%, and 94.6%, respectively for normal, pneumonia, and COVID-19 cases, respectively, making it comparable or improved results over recent approaches. We hope that our findings will be a useful contribution to the fight against COVID-19 and, in more general, towards an increasing acceptance and adoption of AI-assisted applications in the clinical practice.
研究动机与目标
- 通过在临床设置中对胸部 X 光片进行快速、可解释的 COVID-19 筛查来提供动机。
- 开发一个可解释的基于 DNN 的管线,区分正常、肺炎和 COVID-19 的 X 光片图像。
- 将多种 CNN 架构组合成一个集成以提升鲁棒性与泛化能力。
- 通过突出能够区分类别的胸部区域来提供人类可解释的解释。
- 以可复现实验结果与方法为目标(开源代码与数据链接)。
提出的方法
- 包括直方图均衡、边缘增强、降噪和伪影移除在内的图像预处理。
- 在不进行 ImageNet 预训练的迁移学习式设置下训练若干 CNN 架构(VGG-16/19、ResNet-18/34、DenseNet-161/201)。
- 使用循环余弦退火创建快照模型,并通过 Softmax 类后验平均(SCPA)和预测最大化(PM)来形成一个集成。
- 使用 Grad-CAM++、Grad-CAM 和 Layer-wise Relevance Propagation(LRP)生成对类别有区分性的解释。
- 通过类别权重处理类别不平衡,并在平衡和不平衡数据集上用精度、召回、F1 和 PPV 进行评估。
- 用热图和区域定位来解释预测,以帮助临床信任与验证。
实验结果
研究问题
- RQ1一个可解释的神经集成是否能够在 CXR 图像中准确区分 COVID-19、正常和非 COVID-19 的肺炎?
- RQ2Grad-CAM++、Grad-CAM 和 LRP 是否提供可可靠、可解释的决策相关胸部区域定位,便于临床使用?
- RQ3在平衡和不平衡类别分布下,哪些 CNN 架构与集成策略能够获得最佳性能?
- RQ4与现有的 COVID-19 X 世代方法相比,该方法在精度、召回和 PPV 方面的表现如何?
- RQ5模型的行为是否足够透明,以支持 AI 辅助的临床决策?
主要发现
- DenseNet-161 和 DenseNet-201 在平衡数据上实现单独性能的领先,DenseNet-161 达到 0.952 的精度、0.945 的召回和 0.948 的 F1。
- 在非平衡数据上,DenseNet-161 和 ResNet-18 显示出稳健的表现,DenseNet-161 保持强劲的指标。
- 使用 Softmax 后验平均(SCPA)的 VGG-19 + DenseNet-161 集成在平衡结果中表现最佳(Precision 0.946,Recall 0.943,F1 0.945)。
- 预测最大化(PM)集成在相同架构组合下也表现良好(0.937 精度,0.926 召回,0.931 F1)。
- COVID-19 阳性预测在平衡测试集上的 PPV 达到 96.12%;COVIDx v1.0 的比较显示在类似条件下 PPV 为 96.74%,表明与最先进方法具有竞争力。
- 在平衡数据集上的类别指标显示 Normal(Precision 0.942,Recall 0.927,F1 0.935)、Pneumonia(Precision 0.916,Recall 0.928,F1 0.922)、COVID-19(Precision 0.904,Recall 0.905,F1 0.905)。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。