Skip to main content
QUICK REVIEW

[论文解读] Atrous Convolutional Neural Network (ACNN) for Semantic Image Segmentation with full-scale Feature Maps

Xiao-Yun Zhou, Jian-Qing Zheng|arXiv (Cornell University)|Jan 26, 2019
Advanced Neural Network Applications被引用 2
一句话总结

本文提出了一种空洞卷积神经网络(ACNN),一种全分辨率的深度卷积神经网络,通过级联空洞 II 块、残差学习和实例归一化,在扩展感受野的同时保持空间分辨率。ACNN 在 MRI 和 CT 扫描的分割任务中,以更少的可训练参数实现了高于 U-Net 和 Deeplabv3+ 的分割交并比(IoU)。

ABSTRACT

Deep Convolutional Neural Networks (DCNNs) are used extensively in medical image segmentation and hence 3D navigation for robot-assisted Minimally Invasive Surgeries (MISs). However, current DCNNs usually use down sampling layers for increasing the receptive field and gaining abstract semantic information. These down sampling layers decrease the spatial dimension of feature maps, which can be detrimental to image segmentation. Atrous convolution is an alternative for the down sampling layer. It increases the receptive field whilst maintains the spatial dimension of feature maps. In this paper, a method for effective atrous rate setting is proposed to achieve the largest and fully-covered receptive field with a minimum number of atrous convolutional layers. Furthermore, a new and full resolution DCNN - Atrous Convolutional Neural Network (ACNN), which incorporates cascaded atrous II-blocks, residual learning and Instance Normalization (IN) is proposed. Application results of the proposed ACNN to Magnetic Resonance Imaging (MRI) and Computed Tomography (CT) image segmentation demonstrate that the proposed ACNN can achieve higher segmentation Intersection over Unions (IoUs) than U-Net and Deeplabv3+, but with reduced trainable parameters.

研究动机与目标

  • 解决传统用于医学图像分割的深度卷积神经网络(DCNN)因下采样导致的空间分辨率损失问题。
  • 在实现大范围且完全覆盖的感受野的同时,保持全分辨率的特征图。
  • 在不牺牲分割性能的前提下,减少 DCNN 的参数数量。
  • 开发一种适用于机器人辅助微创手术中 3D 导航的高效全分辨率架构。
  • 优化空洞率设置,以最少的卷积层实现最大感受野覆盖。

提出的方法

  • 提出一种新颖的空洞率设置策略,以最少的空洞卷积层实现最大且完全覆盖的感受野。
  • 引入级联的空洞 II 块,利用空洞卷积在不进行下采样的情况下扩展感受野。
  • 采用残差学习以稳定训练过程并改善深层网络中的梯度流动。
  • 应用实例归一化(IN),对每个样本的特征进行归一化,提升特征表示能力和训练稳定性。
  • 通过避免下采样构建全分辨率网络,全程保留空间维度。
  • 将所有组件整合为统一架构——ACNN,专为医学影像中的高精度语义分割而设计。

实验结果

研究问题

  • RQ1空洞卷积能否有效替代下采样层,以在语义分割中保持空间分辨率?
  • RQ2实现完全且最大感受野覆盖的最优空洞率配置是什么,且所需层数最少?
  • RQ3结合残差学习和实例归一化的全分辨率 DCNN 是否能超越 U-Net 和 Deeplabv3+ 等现有最先进模型?
  • RQ4ACNN 是否在可训练参数更少的情况下,仍能实现更高的分割精度?
  • RQ5ACNN 在 MRI 和 CT 等不同医学影像模态上的表现如何?

主要发现

  • ACNN 在 MRI 和 CT 图像分割任务中,交并比(IoU)得分高于 U-Net 和 Deeplabv3+。
  • 所提出的空洞率设置策略以比传统方法更少的层数实现了完全且最大化的感受野覆盖。
  • ACNN 在网络中全程保持全分辨率特征图,避免了因下采样导致的空间分辨率损失。
  • 该模型在实现更优分割性能的同时,可训练参数数量少于 U-Net 和 Deeplabv3+。
  • 残差学习与实例归一化的集成显著提升了网络的训练稳定性和特征表示能力。
  • 在 MRI 和 CT 数据集上的实证结果证实了 ACNN 在不同医学影像模态下的有效性与泛化能力。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。