QUICK REVIEW

[论文解读] COVIDGR dataset and COVID-SDNet methodology for predicting COVID-19 based on Chest X-Ray images

Siham Tabik, Anabel Gómez-Ríos|arXiv (Cornell University)|Jun 2, 2020

COVID-19 diagnosis using AI参考文献 25被引用 26

一句话总结

本文介绍了COVIDGR-1.0数据集，这是一个在四个COVID-19严重程度等级上平衡且同质的后前位胸部X光（CXR）图像集合，共包含852张图像，并提出了COVID-SDNet方法——一种整合了分割、数据增强和特征转换的深度学习框架。该方法在重症病例上的准确率达到97.72%，并展现出强大的泛化能力，尤其在中度和重症病例中表现突出，可实现可靠的早期检测分诊。

ABSTRACT

Currently, Coronavirus disease (COVID-19), one of the most infectious diseases in the 21st century, is diagnosed using RT-PCR testing, CT scans and/or Chest X-Ray (CXR) images. CT (Computed Tomography) scanners and RT-PCR testing are not available in most medical centers and hence in many cases CXR images become the most time/cost effective tool for assisting clinicians in making decisions. Deep learning neural networks have a great potential for building COVID-19 triage systems and detecting COVID-19 patients, especially patients with low severity. Unfortunately, current databases do not allow building such systems as they are highly heterogeneous and biased towards severe cases. This paper is three-fold: (i) we demystify the high sensitivities achieved by most recent COVID-19 classification models, (ii) under a close collaboration with Hospital Universitario Clínico San Cecilio, Granada, Spain, we built COVIDGR-1.0, a homogeneous and balanced database that includes all levels of severity, from normal with Positive RT-PCR, Mild, Moderate to Severe. COVIDGR-1.0 contains 426 positive and 426 negative PA (PosteroAnterior) CXR views and (iii) we propose COVID Smart Data based Network (COVID-SDNet) methodology for improving the generalization capacity of COVID-classification models. Our approach reaches good and stable results with an accuracy of $97.72\% \pm 0.95 \%$, $86.90\% \pm 3.20\%$, $61.80\% \pm 5.49\%$ in severe, moderate and mild COVID-19 severity levels (Paper accepted for publication in Journal of Biomedical and Health Informatics). Our approach could help in the early detection of COVID-19. COVIDGR-1.0 along with the severity level labels are available to the scientific community through this link https://dasci.es/es/transferencia/open-data/covidgr/.

研究动机与目标

解决使用CXR图像进行COVID-19分类时缺乏平衡、同质且具有临床相关性的数据集的问题。
通过揭示现有基准中数据偏差和不平衡问题，澄清现有深度学习模型过度夸大的敏感性声称。
开发一种稳健且可泛化的深度学习方法（COVID-SDNet），以提升模型在所有COVID-19严重程度等级上的性能。
通过基于Grad-CAM的注意力图和反事实解释，实现可解释的预测，以增强临床信任与验证。
通过高可靠性的分诊系统，实现对中度和重症病例的早期检测。

提出的方法

作者与格拉纳达大学医院临床圣塞西利奥医院密切合作，构建了COVIDGR-1.0数据集，确保在四个严重程度等级（正常（RT-PCR阳性）、轻度、中度和重度）中具有平衡的代表性。
该数据集包含426张阳性与426张阴性后前位CXR图像，严重程度等级使用改进的RALE评分进行标注，以保证放射学一致性。
所提出的COVID-SDNet方法集成了三个核心组件：(1) 肺部区域的语义分割，(2) 通过生成对抗网络（GANs）进行数据增强，以增强少数类，以及(3) 使用注意力机制进行特征转换，以突出病理区域。
通过改进的Grad-CAM方法实现模型可解释性，生成热图以突出影响预测的图像区域，并提供相反类别对应的反事实解释。
框架采用五折交叉验证进行训练与评估，性能通过各严重程度等级下的准确率、敏感性和特异性进行衡量。
评估模型在不同严重程度等级间的泛化能力，特别关注视觉特征稀疏的轻度和正常（PCR阳性）病例。

实验结果

研究问题

RQ1当前用于COVID-19分类的深度学习模型如何实现高敏感性？数据不平衡与异质性在这些结果中起到何种作用？
RQ2一个平衡、同质且具有临床标注的CXR数据集是否能提升深度学习模型在COVID-19检测中的泛化能力与可靠性？
RQ3在COVID-SDNet框架中整合分割、数据增强与特征转换是否能提升模型在不同疾病严重程度等级下的性能与鲁棒性？
RQ4基于注意力的可解释性方法（如Grad-CAM）在多大程度上能增强临床医生对基于AI的CXR图像诊断系统的信任？
RQ5所提出的方法是否能有效检测中度和重症病例，同时在轻度和正常（PCR阳性）病例中保持稳定性？

主要发现

COVIDGR-1.0数据集实现了平衡分布，四个严重程度等级中各含426张阳性与426张阴性CXR图像，与现有数据集相比显著降低了偏差。
COVID-SDNet模型在重症病例上的准确率为97.72% ± 0.95%，中度病例为86.90% ± 3.20%，轻度病例为61.80% ± 5.49%，在重症和中度疾病中表现出强劲性能。
该模型展现出高度的泛化能力，尤其在存在明显病理特征（如实变、磨玻璃影）的重症和中度病例中检测能力突出。
通过Grad-CAM热图进行的可解释性分析证实，模型正确识别了感兴趣区域，如肺部浸润、实变和骨关节炎，注意力图与放射学发现一致。
反事实解释表明，模型的预测具有鲁棒性，且相反类别的预测由不同且具有临床合理性的解剖区域驱动，从而增强了模型的透明度。
该数据集与方法论已公开发布于 https://dasci.es/es/transferencia/open-data/covidgr/，支持可复现性与未来研究。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。