Skip to main content
QUICK REVIEW

[论文解读] Attention Guided Network for Retinal Image Segmentation

Shihao Zhang, Huazhu Fu|arXiv (Cornell University)|Jul 25, 2019
Retinal Imaging and Analysis参考文献 17被引用 23
一句话总结

本文提出了一种新型视网膜图像分割框架——注意力引导网络(AG-Net),用以替代标准的跳跃连接和上采样操作,引入一种注意力引导的滤波器以保留结构细节。通过将引导滤波与注意力机制相结合,AG-Net增强了特征融合,减少了背景噪声,并在血管和视盘/杯状结构分割任务中均取得了最先进性能。

ABSTRACT

Learning structural information is critical for producing an ideal result in retinal image segmentation. Recently, convolutional neural networks have shown a powerful ability to extract effective representations. However, convolutional and pooling operations filter out some useful structural information. In this paper, we propose an Attention Guided Network (AG-Net) to preserve the structural information and guide the expanding operation. In our AG-Net, the guided filter is exploited as a structure sensitive expanding path to transfer structural information from previous feature maps, and an attention block is introduced to exclude the noise and reduce the negative influence of background further. The extensive experiments on two retinal image segmentation tasks (i.e., blood vessel segmentation, optic disc and cup segmentation) demonstrate the effectiveness of our proposed method.

研究动机与目标

  • 解决视网膜图像分割过程中特征上采样导致的结构信息丢失问题。
  • 通过用结构敏感的扩展路径替代标准跳跃连接,改进U-Net类架构中的特征融合。
  • 降低背景噪声和边界模糊对分割结果的影响。
  • 提升对临床相关视网膜结构(如血管、视盘和杯状结构)的分割精度。

提出的方法

  • 提出一种注意力引导滤波器,利用引导滤波将结构信息从低分辨率特征图传递至高分辨率特征图。
  • 采用注意力模块生成空间注意力图,以抑制背景噪声并增强前景特征。
  • 利用注意力图对引导滤波系数进行加权,实现选择性滤波,从而保留边缘和结构细节。
  • 在M-Net中用注意力引导滤波器替代标准上采样和跳跃连接,以提升信息融合效果。
  • 通过双线性插值对滤波系数进行上采样,以重建高分辨率输出图。
  • 通过带正则化项的最小二乘问题优化滤波系数,以最小化重建误差。

实验结果

研究问题

  • RQ1引导滤波能否被有效整合进深度神经网络中,以在视网膜图像分割中保留结构细节?
  • RQ2在引导滤波中引入注意力机制是否能通过抑制背景噪声来提升分割性能?
  • RQ3与标准跳跃连接和上采样相比,所提出的注意力引导滤波器在分割精度方面表现如何?
  • RQ4该注意力引导滤波器能否在不同视网膜分割任务(如血管和视盘/杯状结构分割)中实现良好泛化?
  • RQ5与基线模型(如M-Net)相比,该方法的计算成本如何?

主要发现

  • 在DRIVE数据集上,AG-Net在血管分割任务中达到0.8186的DSC,优于基线模型M-Net(0.8089)及其他最先进方法。
  • 在ORIGA数据集上,AG-Net在视盘和杯状结构分割任务中实现0.137的重叠误差(OE),优于所有对比方法,包括M-Net+PT(0.150)。
  • AG-Net+PT*变体实现了最优OE为0.137,其中视盘为0.061,杯状结构为0.212,表现出对尺寸变化的强鲁棒性。
  • AG-Net将单张图像的测试推理时间缩短至0.0158秒,显著快于M-Net(0.0691秒),尽管训练时间更长。
  • 消融实验证实,注意力引导滤波器能有效减少背景噪声并提升边界精确度。
  • 该方法在多种视网膜结构上均保持高性能,证实其在临床相关分割任务中的良好泛化能力。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。