QUICK REVIEW

[論文レビュー] Atrous Convolutional Neural Network (ACNN) for Semantic Image Segmentation with full-scale Feature Maps

Xiao-Yun Zhou, Jian-Qing Zheng|arXiv (Cornell University)|Jan 26, 2019

Advanced Neural Network Applications被引用数 2

ひとこと要約

本稿では、アトリウス畳み込み層と残差学習、インスタンス正規化を用いて空間分解能を維持しながら受容 field を拡大する、フル解像度の DCNN である Atrous Convolutional Neural Network (ACNN) を提案する。ACNN は、U-Net や Deeplabv3+ よりも少ない学習可能なパラメータ数で、MRI や CT スキャンにおけるセグメンテーション IoU をより高く達成する。

ABSTRACT

Deep Convolutional Neural Networks (DCNNs) are used extensively in medical image segmentation and hence 3D navigation for robot-assisted Minimally Invasive Surgeries (MISs). However, current DCNNs usually use down sampling layers for increasing the receptive field and gaining abstract semantic information. These down sampling layers decrease the spatial dimension of feature maps, which can be detrimental to image segmentation. Atrous convolution is an alternative for the down sampling layer. It increases the receptive field whilst maintains the spatial dimension of feature maps. In this paper, a method for effective atrous rate setting is proposed to achieve the largest and fully-covered receptive field with a minimum number of atrous convolutional layers. Furthermore, a new and full resolution DCNN - Atrous Convolutional Neural Network (ACNN), which incorporates cascaded atrous II-blocks, residual learning and Instance Normalization (IN) is proposed. Application results of the proposed ACNN to Magnetic Resonance Imaging (MRI) and Computed Tomography (CT) image segmentation demonstrate that the proposed ACNN can achieve higher segmentation Intersection over Unions (IoUs) than U-Net and Deeplabv3+, but with reduced trainable parameters.

研究の動機と目的

従来の DCNN が医療画像セグメンテーションに用いる際のダウンサンプリングによる空間分解能の損失を是正すること。
ダウンサンプリングを回避しながら、大規模かつ完全にカバーされた受容 field を実現するフル解像度の特徴マップを維持すること。
セグメンテーション性能を損なわずに DCNN のパラメータ数を削減すること。
ロボット支援最小侵襲手術における 3D ナビゲーションに適した効率的でフル解像度のアーキテクチャを開発すること。
層数を最小限に抑えながら受容 field のカバー率を最大化するようにアトリウスレートの設定を最適化すること。

提案手法

最小限のアトリウス畳み込み層で最大かつ完全にカバーされた受容 field を達成するための新しいアトリウスレート設定戦略を提案する。
ダウンサンプリングを行わず、拡張された受容 field を実現するための、級列アトリウス II ブロックを導入する。
深層ネットワークにおける学習安定性と勾配の流れの改善を図るため、残差学習を採用する。
個々のサンプルごとに特徴を正規化するインスタンス正規化 (IN) を適用し、特徴表現の向上と学習安定性の強化を図る。
ダウンサンプリングを回避することで、ネットワーク全体にわたり空間次元を維持するフル解像度ネットワークを構築する。
すべての構成要素を統合した統一されたアーキテクチャである ACNN を、医療画像における高精度なセマンティックセグメンテーションに特化して設計する。

実験結果

リサーチクエスチョン

RQ1アトリウス畳み込みが、セマンティックセグメンテーションにおける空間分解能の維持を図るために、ダウンサンプリング層の代わりに効果的に機能するか。
RQ2最小限の層数で完全かつ最大の受容 field カバーを達成するための最適なアトリウスレート設定は何か。
RQ3残差学習とインスタンス正規化を組み合わせたフル解像度 DCNN が、U-Net や Deeplabv3+ といった最先端モデルを上回る性能を発揮できるか。
RQ4既存のアーキテクチャと比較して、ACNN がより少ない学習可能なパラメータ数で高いセグメンテーション精度を達成できるか。
RQ5ACNN は、MRI や CT などの多様な医療画像モodalities において、どのように性能を発揮するか。

主な発見

ACNN は、MRI や CT 画像セグメンテーションタスクにおいて、U-Net や Deeplabv3+ よりも高いインターセクションオーバー・ユーニオン (IoU) スコアを達成する。
提案されたアトリウスレート設定戦略により、従来のアプローチよりも層数を減らして完全かつ最大の受容 field カバーを実現できる。
ACNN はネットワーク全体にわたりフル解像度の特徴マップを維持し、ダウンサンプリングによる空間分解能の損失を回避する。
U-Net や Deeplabv3+ よりも少ない学習可能なパラメータ数を用いながら、優れたセグメンテーション性能を達成する。
残差学習とインスタンス正規化の統合により、ネットワーク内の学習安定性と特徴表現が向上する。
MRI および CT データセットにおける実験結果から、ACNN の有効性と異なる医療画像モダリティへの汎用性が確認される。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。