[论文解读] A Weakly Supervised Adaptive DenseNet for Classifying Thoracic Diseases and Identifying Abnormalities
本文提出了一种弱监督自适应DenseNet,仅使用图像级别标签即可对14种胸部疾病进行分类并定位胸部X光片中的异常。通过集成两阶段池化机制与自适应DenseNet前端,该模型在分类(在14种疾病中的10种上优于先前方法)和定位(mIoU为0.7)方面均达到最先进性能,尽管存在标签模糊性,仍实现了与临床标注的更好对齐。
We present a weakly supervised deep learning model for classifying thoracic diseases and identifying abnormalities in chest radiography. In this work, instead of learning from medical imaging data with region-level annotations, our model was merely trained on imaging data with image-level labels to classify diseases, and is able to identify abnormal image regions simultaneously. Our model consists of a customized pooling structure and an adaptive DenseNet front-end, which can effectively recognize possible disease features for classification and localization tasks. Our method has been validated on the publicly available ChestX-ray14 dataset. Experimental results have demonstrated that our classification and localization prediction performance achieved significant improvement over the previous models on the ChestX-ray14 dataset. In summary, our network can produce accurate disease classification and localization, which can potentially support clinical decisions.
研究动机与目标
- 开发一种深度学习模型,仅在训练过程中无需区域级标注即可实现准确的胸部疾病分类与病灶定位。
- 解决大规模医学影像数据集中详细放射科标注稀缺的挑战。
- 通过仅从图像级别标签学习空间判别性特征,提升定位精度。
- 在包含图像级别标签与少量真实边界框的大型ChestX-ray14数据集上评估模型性能。
- 研究标注模糊性对定位性能的影响,并通过扩展由放射科医生验证的标注来验证模型的鲁棒性。
提出的方法
- 模型采用定制的两阶段池化结构:首先进行类别特定池化以识别疾病特异性特征,随后进行空间池化以定位病灶区域。
- 使用自适应DenseNet前端提取具有密集跳跃连接的层次化特征,增强特征复用与梯度流动。
- 网络仅使用图像级别标签进行端到端训练,避免对边界框或分割标注的依赖。
- 将类别全局平均池化层替换为更具判别性的池化策略,以保留空间信息并提升定位精度。
- 通过阈值化类别池化特征图生成最终的定位输出,生成突出显示与疾病相关区域的边界框。
- 利用预训练的ImageNet模型进行迁移学习,在ChestX-ray14数据集上对模型进行微调。
实验结果
研究问题
- RQ1仅使用图像级别标签,深度学习模型能否实现高精度的胸部疾病分类与病灶定位?
- RQ2与弱监督设置下标准全局池化相比,所提出的两阶段池化机制在多大程度上提升了定位性能?
- RQ3ChestX-ray14数据集中标注模糊性在多大程度上影响了定位性能?在该条件下,该模型是否比基线方法具有更强的泛化能力?
- RQ4自适应DenseNet架构在多种胸部疾病中是否增强了对小病灶与大病灶的特征表示能力?
- RQ5在存在多个或双侧病灶的情况下,模型的定位输出与真实边界框相比如何?
主要发现
- 该模型在ChestX-ray14数据集的14种胸部疾病中,有10种达到了最先进分类性能,尤其在肺炎与肺气肿等疾病上表现显著提升。
- 定位任务的平均交并比(IoU)达到0.7,显著优于NIH基线在8种评估疾病中的5种表现。
- 视觉分析显示,预测边界框与临床标注高度一致,尤其在双侧或多病灶情况下,模型能捕获所有病灶实例,而真实标注常遗漏部分。
- 在80个模糊病例上经认证放射科医生扩展真实标注后,模型在胸腔积液、结节、肺不张、浸润、肿块和肺炎等类别上的定位IoU显著提升。
- 移除平均池化有助于保留空间分辨率并改善特征表示,从而提升定位精度。
- 该模型对标签模糊性表现出鲁棒性,生成的定位输出比原始数据集标注更全面、更具临床相关性。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。