[论文解读] Attention Based Glaucoma Detection: A Large-scale Database and CNN Model
本文提出AG-CNN,一种基于注意力机制的卷积神经网络,用于通过眼底图像进行青光眼检测,利用了一个新型大规模LAG数据库(包含5,824张图像)和眼科医生标注的注意力图。通过整合注意力预测、基于引导反向传播的病灶区域定位以及青光眼分类,AG-CNN在测试中实现了95.3%的准确率和95.4%的敏感度,显著优于当前最先进方法。
Recently, the attention mechanism has been successfully applied in convolutional neural networks (CNNs), significantly boosting the performance of many computer vision tasks. Unfortunately, few medical image recognition approaches incorporate the attention mechanism in the CNNs. In particular, there exists high redundancy in fundus images for glaucoma detection, such that the attention mechanism has potential in improving the performance of CNN-based glaucoma detection. This paper proposes an attention-based CNN for glaucoma detection (AG-CNN). Specifically, we first establish a large-scale attention based glaucoma (LAG) database, which includes 5,824 fundus images labeled with either positive glaucoma (2,392) or negative glaucoma (3,432). The attention maps of the ophthalmologists are also collected in LAG database through a simulated eye-tracking experiment. Then, a new structure of AG-CNN is designed, including an attention prediction subnet, a pathological area localization subnet and a glaucoma classification subnet. Different from other attention-based CNN methods, the features are also visualized as the localized pathological area, which can advance the performance of glaucoma detection. Finally, the experiment results show that the proposed AG-CNN approach significantly advances state-of-the-art glaucoma detection.
研究动机与目标
- 解决眼底图像中高冗余性对深度学习模型准确检测青光眼的阻碍。
- 弥合人类眼科医生注意力与医学图像中病灶区域之间的差距。
- 开发一种CNN架构,联合预测注意力图并定位病灶区域,以提升诊断性能。
- 建立一个大规模、具有临床相关性的数据库,包含青光眼标签和专家标注的注意力图,用于模型训练与评估。
提出的方法
- 构建了包含5,824张眼底图像的LAG数据库,其中包含青光眼诊断标签以及通过模拟眼动追踪技术收集的眼科医生注意力图。
- 设计AG-CNN,包含三个子网络:注意力预测子网络、使用引导反向传播的病灶区域定位子网络,以及青光眼分类子网络。
- 采用引导反向传播技术优化注意力图,突出显示微小病灶区域(如视盘边界),提升定位精度。
- 引入多尺度残差块,增强特征表示能力,并提升模型在不同感受野尺度下的鲁棒性。
- 使用可视化热图与真实注意力图之间的皮尔逊相关系数(CC)评估模型与人类感知的一致性。
- 开展消融实验,验证注意力预测与病灶定位子网络在完整AG-CNN架构中的必要性。
实验结果
研究问题
- RQ1将人工标注的注意力图引入CNN是否能提升眼底图像中青光眼检测的性能?
- RQ2基于注意力的特征可视化在定位细微病灶区域(如视杯和视盘边界)方面,与标准CAM方法相比效果如何?
- RQ3将预测的注意力图与引导反向传播相结合,是否能同时提升可解释性与分类准确率?
- RQ4注意力预测子网络与病灶定位子网络在AG-CNN整体性能中分别贡献了多少?
- RQ5多尺度残差块架构是否能超越标准残差连接,进一步提升青光眼检测性能?
主要发现
- AG-CNN在LAG测试集上达到95.3%的准确率、95.4%的敏感度、95.2%的特异度以及0.975的AUC,显著优于当前最先进方法。
- 同时保留注意力预测子网络与病灶定位子网络时,F2-score相比移除两者提升了4.7%。
- 消融实验表明,若仅移除注意力预测子网络而保留定位子网络,性能下降至87.1%准确率,说明预测注意力对有效定位至关重要。
- 基于引导反向传播的定位方法成功突出显示了如视盘边缘等微小病灶区域,而CAM方法常错误地强调如眼球边界等冗余区域。
- 与标准残差连接相比,多尺度残差块将准确率提升至92.2%(替换传统跳跃连接后),证明其性能优势。
- 可视化热图与专家注意力图之间的皮尔逊相关系数为0.33(正确分类时)和0.14(错误分类时),证实注意力对齐程度与诊断正确性相关。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。