Skip to main content
QUICK REVIEW

[论文解读] Multi-Feature Semi-Supervised Learning for COVID-19 Diagnosis from Chest X-ray Images

Qi Xiao, John L. Nosher|arXiv (Cornell University)|Apr 4, 2021
COVID-19 diagnosis using AI参考文献 32被引用 7
一句话总结

本文提出了一种用于从胸部X光(CXR)图像进行COVID-19诊断的多特征半监督学习(SSL)框架,将局部相位特征(LwPA、LPE、ELEA)整合到多通道输入中以提升表征学习效果。仅使用7.06%的标注数据和16.48%的未标注数据进行训练,该方法在大规模70.93%的测试集上实现了93.61%的平均准确率,优于监督学习和先前的SSL方法。

ABSTRACT

Computed tomography (CT) and chest X-ray (CXR) have been the two dominant imaging modalities deployed for improved management of Coronavirus disease 2019 (COVID-19). Due to faster imaging, less radiation exposure, and being cost-effective CXR is preferred over CT. However, the interpretation of CXR images, compared to CT, is more challenging due to low image resolution and COVID-19 image features being similar to regular pneumonia. Computer-aided diagnosis via deep learning has been investigated to help mitigate these problems and help clinicians during the decision-making process. The requirement for a large amount of labeled data is one of the major problems of deep learning methods when deployed in the medical domain. To provide a solution to this, in this work, we propose a semi-supervised learning (SSL) approach using minimal data for training. We integrate local-phase CXR image features into a multi-feature convolutional neural network architecture where the training of SSL method is obtained with a teacher/student paradigm. Quantitative evaluation is performed on 8,851 normal (healthy), 6,045 pneumonia, and 3,795 COVID-19 CXR scans. By only using 7.06% labeled and 16.48% unlabeled data for training, 5.53% for validation, our method achieves 93.61\% mean accuracy on a large-scale (70.93%) test data. We provide comparison results against fully supervised and SSL methods. Code: https://github.com/endiqq/Multi-Feature-Semi-Supervised-Learning-for-COVID-19-CXR-Images

研究动机与目标

  • 解决深度学习在COVID-19诊断中因标注医疗数据有限带来的挑战。
  • 通过利用局部相位图像特征提升表征学习,改善CXR图像的分类性能。
  • 开发一种半监督学习框架,以减少医学影像中对大量标注数据的依赖。
  • 在大规模、真实世界的CXR数据集上评估该方法,涵盖多样化患者群体。

提出的方法

  • 使用带通正交滤波器和L1正则化,提取三种局部相位特征——局部加权平均相位角(LwPA)、LwPA加权局部相位能量(LPE)和增强局部能量衰减(ELEA)。
  • 将三种局部相位特征组合为三通道多特征(MF)图像输入,供神经网络使用。
  • 实施教师/学生半监督学习流程,其中教师模型在标注数据上进行训练,并用于为未标注数据生成伪标签。
  • 应用一致性正则化和置信度过滤,以优化伪标签数据并提升学生模型的泛化能力。
  • 采用具有共享权重的多流卷积神经网络(CNN)架构,同时处理原始CXR图像和多特征MF图像。
  • 通过结合标注数据和高置信度伪标签数据来优化学生模型,采用早停法和衰减学习率策略。

实验结果

研究问题

  • RQ1局部相位特征是否能提升半监督学习模型在CXR图像中分类COVID-19的性能?
  • RQ2将多特征表征(原始CXR + 局部相位特征)融合后,如何在标注数据极少的情况下提升模型泛化能力?
  • RQ3当训练数据严重受限时,所提出的教师/学生SSL框架是否优于现有的SSL和全监督基线方法?
  • RQ4该模型在不同患者群体和成像条件下对分布偏移的鲁棒性如何?

主要发现

  • 所提出的MF-TS模型在大规模测试集(占总数据的70.93%)上实现了93.61%的平均准确率,仅使用7.06%的标注数据和16.48%的未标注数据进行训练。
  • 当仅使用10%的标注数据(即全数据集的2.35%)时,MF-TS模型在Test-1上达到92.43%的平均准确率,显著优于ResNet50(86.46%)和其他SSL基线方法。
  • MF-TS模型在不同数据集间表现出更优的稳定性,Test-1与Test-2之间平均准确率下降仅为1.69%,而伪标签方法的下降幅度达8.58%。
  • 与基线CXR-TS(Billion-Scale)相比,多特征方法(MF-TS)在Test-2上提升1.22%,在Test-1上提升1.18%,证明了特征融合的优势。
  • 消融实验证实,局部相位特征显著提升了模型性能,MF-TS优于单一特征变体(如Enh-TS和MF-T)。
  • 该方法在目前已报告的最大规模SSL评估中实现了最先进的性能,且仅使用极少量的标注数据。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。