QUICK REVIEW

[論文レビュー] Channel prior convolutional attention for medical image segmentation

Hejun Huang, Zuguo Chen|arXiv (Cornell University)|Jun 8, 2023

Advanced Neural Network Applications被引用数 12

ひとこと要約

Channel Prior Convolutional Attention（CPCA）を導入し、医用画像分割における動的なチャネルと空間の注意を可能にする。CPCANetに統合され、ACDCおよび皮膚病変データセットにおいて計算量を抑えつつDiceスコアが優れている。

ABSTRACT

Characteristics such as low contrast and significant organ shape variations are often exhibited in medical images. The improvement of segmentation performance in medical imaging is limited by the generally insufficient adaptive capabilities of existing attention mechanisms. An efficient Channel Prior Convolutional Attention (CPCA) method is proposed in this paper, supporting the dynamic distribution of attention weights in both channel and spatial dimensions. Spatial relationships are effectively extracted while preserving the channel prior by employing a multi-scale depth-wise convolutional module. The ability to focus on informative channels and important regions is possessed by CPCA. A segmentation network called CPCANet for medical image segmentation is proposed based on CPCA. CPCANet is validated on two publicly available datasets. Improved segmentation performance is achieved by CPCANet while requiring fewer computational resources through comparisons with state-of-the-art algorithms. Our code is publicly available at \url{https://github.com/Cuthbert-Huang/CPCANet}.

研究の動機と目的

低コントラストと臓器形状のばらつきのため、医用画像分割におけるより適応的な注意機構の必要性を動機づける。
チャネルと空間の両方の次元で注意を動的に分配しつつ、チャネル事前情報を保持するCPCAを提案する。
CPCAを分割ネットワークCPCANetに統合し、心臓と皮膚病変分割の2つの公開データセットで評価する。
最先端手法と比べて、計算コストを抑えつつ分割性能を向上させることを示す。

提案手法

チャネル注意の後に空間注意を順次適用することでCPCAを提案する。
深さ方向畳み込みベースのマルチブランチ空間注意モジュールを用い、マルチスケール受容野を持つチャネルごとの空間マップを生成する。
平均プーリングと最大プーリングを共有MLPと共に用いてチャネル記述子を得て、チャネル注意を計算する。
入力特徴とチャネル注意マップの要素ごとの乗算でチャネルプリオリを取得し、深さ方向畳み込みで空間注意マップを導く。
チャネルミキシングと最終的な特徴の再重み付けによって洗練された特徴を得る。
ViT様エンコーダの自己注意をCPCAに置換し、CNNベースの軽量デコーダを用いた四段階のエンコーダ–デコーダピラミッドを用いてCPCANetを構築する。

実験結果

リサーチクエスチョン

RQ1CPCAは低コントラストの医用画像で分割を改善する動的なチャネルごとの空間注意を提供できるか？
RQ2CPCAをVision Transformerバ backboneにCNNデコーダと組み合わせると、従来のCNN/Transformerハイブリッドより精度と効率が向上するか？
RQ3CPCAは医用データセットにおける分割精度と計算コストの点でCBAMおよびSEと比較してどうか？
RQ4どのアーキテクチャの選択（カーネルサイズ、チャネルミキシング、デコーダ設計）がCPCAの性能に最も影響を与えるか？

主な発見

Methods	Average DSC	RV DSC	Myo DSC	LV DSC	FLOPs (G)
TransUNet	89.71	-	88.86	84.54	24.73
SwinUNet	90.00	-	88.55	85.62	95.83
MT-UNet	90.43	-	86.64	89.04	44.79
MISSFormer	90.86	-	89.55	88.04	-
UNet-2022	92.21	2.555	90.07	90.49	18.00
nnUNet	92.40	1.225	90.67	90.40	14.22
CPCANet(ours)	92.60	1.097	91.01	90.52	10.62

CPCANetは自動心臟診断ACDCおよび皮膚病変分割で、いくつかのベースラインより高い平均DSCを達成しつつFLOPsを削減する。
ACDCにおいてCPCANetの平均DSC=92.60%、HD95=1.097 mm、FLOPs=10.62 Gであり、精度と効率の両方でnnUNetを上回る。
皮膚病変分割では、CPCANetはDSC=93.7%、IoU=88.8%を達成し、nnUNetおよびBATベースラインを上回る。
アブレーション検証により、連続的なチャネル注意→空間注意（CPCA）が、並列または単一注意の変種より優れており、動的空間マッピングにおけるチャネルプリオリの重要性を確認した。
空間注意ブランチのカーネルサイズ選択（例：7、11、21）は最良の性能を生み、チャネルミキシングはDSCと領域焦点を大幅に改善した。
エンコーダ内の自己注意をCPCAに置換しCNNデコーダを使用することで、計算要件を抑えつつ強い性能を達成する。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。