QUICK REVIEW

[论文解读] Multi-Feature Semi-Supervised Learning for COVID-19 Diagnosis from Chest X-ray Images

Qi Xiao, John L. Nosher|arXiv (Cornell University)|Apr 4, 2021

COVID-19 diagnosis using AI参考文献 32被引用 7

一句话总结

本文提出了一种用于从胸部X光（CXR）图像进行COVID-19诊断的多特征半监督学习（SSL）框架，将局部相位特征（LwPA、LPE、ELEA）整合到多通道输入中以提升表征学习效果。仅使用7.06%的标注数据和16.48%的未标注数据进行训练，该方法在大规模70.93%的测试集上实现了93.61%的平均准确率，优于监督学习和先前的SSL方法。

ABSTRACT

Computed tomography (CT) and chest X-ray (CXR) have been the two dominant imaging modalities deployed for improved management of Coronavirus disease 2019 (COVID-19). Due to faster imaging, less radiation exposure, and being cost-effective CXR is preferred over CT. However, the interpretation of CXR images, compared to CT, is more challenging due to low image resolution and COVID-19 image features being similar to regular pneumonia. Computer-aided diagnosis via deep learning has been investigated to help mitigate these problems and help clinicians during the decision-making process. The requirement for a large amount of labeled data is one of the major problems of deep learning methods when deployed in the medical domain. To provide a solution to this, in this work, we propose a semi-supervised learning (SSL) approach using minimal data for training. We integrate local-phase CXR image features into a multi-feature convolutional neural network architecture where the training of SSL method is obtained with a teacher/student paradigm. Quantitative evaluation is performed on 8,851 normal (healthy), 6,045 pneumonia, and 3,795 COVID-19 CXR scans. By only using 7.06% labeled and 16.48% unlabeled data for training, 5.53% for validation, our method achieves 93.61\% mean accuracy on a large-scale (70.93%) test data. We provide comparison results against fully supervised and SSL methods. Code: https://github.com/endiqq/Multi-Feature-Semi-Supervised-Learning-for-COVID-19-CXR-Images

研究动机与目标

解决深度学习在COVID-19诊断中因标注医疗数据有限带来的挑战。
通过利用局部相位图像特征提升表征学习，改善CXR图像的分类性能。
开发一种半监督学习框架，以减少医学影像中对大量标注数据的依赖。
在大规模、真实世界的CXR数据集上评估该方法，涵盖多样化患者群体。

提出的方法

使用带通正交滤波器和L1正则化，提取三种局部相位特征——局部加权平均相位角（LwPA）、LwPA加权局部相位能量（LPE）和增强局部能量衰减（ELEA）。
将三种局部相位特征组合为三通道多特征（MF）图像输入，供神经网络使用。
实施教师/学生半监督学习流程，其中教师模型在标注数据上进行训练，并用于为未标注数据生成伪标签。
应用一致性正则化和置信度过滤，以优化伪标签数据并提升学生模型的泛化能力。
采用具有共享权重的多流卷积神经网络（CNN）架构，同时处理原始CXR图像和多特征MF图像。
通过结合标注数据和高置信度伪标签数据来优化学生模型，采用早停法和衰减学习率策略。

实验结果

研究问题

RQ1局部相位特征是否能提升半监督学习模型在CXR图像中分类COVID-19的性能？
RQ2将多特征表征（原始CXR + 局部相位特征）融合后，如何在标注数据极少的情况下提升模型泛化能力？
RQ3当训练数据严重受限时，所提出的教师/学生SSL框架是否优于现有的SSL和全监督基线方法？
RQ4该模型在不同患者群体和成像条件下对分布偏移的鲁棒性如何？

主要发现

所提出的MF-TS模型在大规模测试集（占总数据的70.93%）上实现了93.61%的平均准确率，仅使用7.06%的标注数据和16.48%的未标注数据进行训练。
当仅使用10%的标注数据（即全数据集的2.35%）时，MF-TS模型在Test-1上达到92.43%的平均准确率，显著优于ResNet50（86.46%）和其他SSL基线方法。
MF-TS模型在不同数据集间表现出更优的稳定性，Test-1与Test-2之间平均准确率下降仅为1.69%，而伪标签方法的下降幅度达8.58%。
与基线CXR-TS（Billion-Scale）相比，多特征方法（MF-TS）在Test-2上提升1.22%，在Test-1上提升1.18%，证明了特征融合的优势。
消融实验证实，局部相位特征显著提升了模型性能，MF-TS优于单一特征变体（如Enh-TS和MF-T）。
该方法在目前已报告的最大规模SSL评估中实现了最先进的性能，且仅使用极少量的标注数据。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。