[论文解读] End-to-end Training for Whole Image Breast Cancer Diagnosis using An All Convolutional Design
该论文提出了一种端到端的、全卷积神经网络的深度学习模型,用于基于全乳腺X线摄影图像的全图乳腺癌诊断,仅在初始训练阶段需要病灶标注,之后仅需图像级别标签。在初始弱监督后,仅使用全图监督,该方法在DDS-M数据集上达到0.91 AUC,在INbreast数据集上达到0.96 AUC,性能达到当前最先进水平。
We develop an end-to-end training algorithm for whole-image breast cancer diagnosis based on mammograms. It requires lesion annotations only at the first stage of training. After that, a whole image classifier can be trained using only image level labels. This greatly reduced the reliance on lesion annotations. Our approach is implemented using an all convolutional design that is simple yet provides superior performance in comparison with the previous methods. On DDSM, our best single-model achieves a per-image AUC score of 0.88 and three-model averaging increases the score to 0.91. On INbreast, our best single-model achieves a per-image AUC score of 0.96. Using DDSM as benchmark, our models compare favorably with the current state-of-the-art. We also demonstrate that a whole image model trained on DDSM can be easily transferred to INbreast without using its lesion annotations and using only a small amount of training data. Code availability: https://github.com/lishen/end2end-all-conv
研究动机与目标
- 减少全图乳腺癌诊断中对昂贵病灶级别标注的依赖。
- 开发一种简单但高效的全卷积神经网络架构,支持端到端训练。
- 仅使用图像级别标签和极少微调,实现从一个数据集到另一个数据集的迁移学习。
- 在显著降低标注负担的同时,实现与当前最先进方法相当的高诊断性能。
提出的方法
- 使用全卷积神经网络端到端处理全幅乳腺X线摄影图像。
- 模型首先使用病灶级别标注进行预训练,以定位可疑区域。
- 预训练完成后,仅使用图像级别标签(良性/恶性)对网络进行微调,用于全图分类任务。
- 采用两阶段训练策略,将病灶定位与全图诊断解耦,最大限度减少对标注的依赖。
- 通过在源数据集上初始化分类器头,并在目标数据集上进行极少数据的微调,实现迁移学习。
- 该架构避免使用全连接层,保留空间信息,提升泛化能力。
实验结果
研究问题
- RQ1在初始病灶级别预训练后,仅使用图像级别标签,端到端深度学习模型能否实现高诊断性能?
- RQ2与先前方法相比,全卷积设计在全图乳腺癌诊断中的有效性如何?
- RQ3在目标数据集上不使用病灶标注的情况下,从一个数据集训练的模型在多大程度上可迁移到另一个数据集?
- RQ4减少对病灶标注的依赖,是否能显著降低标注成本而不牺牲诊断准确性?
主要发现
- 在DDS-M数据集上,最佳单模型的图像级别AUC达到0.88,通过三模型平均提升至0.91。
- 在INbreast数据集上,最佳单模型的图像级别AUC达到0.96,展现出在具有挑战性的基准上的强劲性能。
- 在仅使用图像级别标签进行微调后,该模型在DDS-M数据集上的表现优于先前的最先进方法。
- 从DDS-M到INbreast的迁移学习效果良好,仅需极少数据,且在目标数据集上无需病灶标注。
- 全卷积设计相比使用全连接层的模型,实现了更优的特征学习和泛化能力。
- 该方法显著降低了对昂贵病灶级别标注的依赖,同时保持了高诊断准确性。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。