[论文解读] Deep Multi-instance Networks with Sparse Label Assignment for Whole Mammogram Classification
该论文提出了一种端到端的深度多实例网络,用于整个乳房X光片的分类,无需昂贵的检测或分割标注。通过利用最大池化、标签分配和稀疏学习方案,该模型在INbreast数据集上实现了最先进性能,相较于预训练的AlexNet,AUC提升了6%,并能无需显式边界框监督,稳健检测到微小且稀疏的肿块。
Mammogram classification is directly related to computer-aided diagnosis of breast cancer. Traditional methods requires great effort to annotate the training data by costly manual labeling and specialized computational models to detect these annotations during test. Inspired by the success of using deep convolutional features for natural image analysis and multi-instance learning for labeling a set of instances/patches, we propose end-to-end trained deep multi-instance networks for mass classification based on whole mammogram without the aforementioned costly need to annotate the training data. We explore three different schemes to construct deep multi-instance networks for whole mammogram classification. Experimental results on the INbreast dataset demonstrate the robustness of proposed deep networks compared to previous work using segmentation and detection annotations in the training.
研究动机与目标
- 消除在乳房X光片肿块分类中对昂贵人工标注(如边界框或分割掩码)的需求。
- 开发一种端到端的深度学习框架,直接从原始未标注图像中对整个乳房X光片进行分类。
- 通过将多实例学习适配于小区域病灶,提升医学图像分析中深度特征的鲁棒性和可迁移性。
- 探索替代性的多实例学习方案——最大池化、标签分配和稀疏性,以更好地处理乳房X光片中肿块尺寸小且出现频率低的问题。
提出的方法
- 将整个乳房X光片缩放至224×224,并应用Otsu分割方法去除背景。
- 使用深度卷积神经网络(如AlexNet)从乳房X光片的每个图像块中提取高维特征图。
- 通过参数共享的线性回归模型,预测特征图中每个图像块的恶性概率。
- 采用三种不同的多实例学习方案:最大池化(选择概率最高的图像块)、标签分配(将前k个图像块分配为正样本)和稀疏性(鼓励仅少数图像块被激活)。
- 使用针对每种方案定制的损失函数(最大池化损失、标签分配损失和稀疏正则化)进行端到端训练。
- 利用数据增强技术,提升在有限训练数据上的泛化能力。
实验结果
研究问题
- RQ1深度多实例网络是否能在无需检测或分割标注的情况下,实现对整个乳房X光片的鲁棒分类?
- RQ2不同多实例学习方案(最大池化、标签分配、稀疏性)在肿块分类中的性能和鲁棒性如何比较?
- RQ3从ImageNet预训练模型进行迁移学习,在标注数据有限的医学影像任务中,能在多大程度上提升性能?
- RQ4当肿块仅占据图像约2%的区域时,模型是否仍能有效定位并预测恶性图像块?
- RQ5与需要中间检测和分割标注的多阶段流水线相比,该模型的性能如何?
主要发现
- 所提出的深度多实例网络在INbreast数据集上实现了最佳AUC表现,优于基线模型,包括预训练的AlexNet以及使用检测/分割监督微调的模型。
- 基于标签分配的深度多实例网络实现了最高AUC,表明其在性能上优于最大池化和稀疏方法。
- 与从零开始训练相比,ImageNet预训练使性能提升了7%,证实了深度特征在医学图像中的可迁移性。
- 与预训练的AlexNet相比,AUC提升了6%;与基于最大池化的MIL方法相比,AUC提升了8%,表明模型具有强大的泛化能力和鲁棒性。
- 可视化结果显示,模型能够学习到在图像块上预测恶性概率的能力,其中标签分配方法在捕捉微小肿块方面优于最大池化方法。
- 稀疏多实例网络在模型复杂度与性能之间实现了有效平衡,为灵敏度与计算成本之间提供了折中方案。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。