[论文解读] CMUNeXt: An Efficient Medical Image Segmentation Network based on Large Kernel and Skip Fusion
CMUNeXt 是一个轻量级、全卷积的 U 形医学影像分割网络,使用带反向瓶颈的大核深度卷积和 Skip-Fusion 块,以高效捕获全局上下文并融合编码器-解码器特征,在超声数据集上实现高精度、低计算量和快速推断。
The U-shaped architecture has emerged as a crucial paradigm in the design of medical image segmentation networks. However, due to the inherent local limitations of convolution, a fully convolutional segmentation network with U-shaped architecture struggles to effectively extract global context information, which is vital for the precise localization of lesions. While hybrid architectures combining CNNs and Transformers can address these issues, their application in real medical scenarios is limited due to the computational resource constraints imposed by the environment and edge devices. In addition, the convolutional inductive bias in lightweight networks adeptly fits the scarce medical data, which is lacking in the Transformer based network. In order to extract global context information while taking advantage of the inductive bias, we propose CMUNeXt, an efficient fully convolutional lightweight medical image segmentation network, which enables fast and accurate auxiliary diagnosis in real scene scenarios. CMUNeXt leverages large kernel and inverted bottleneck design to thoroughly mix distant spatial and location information, efficiently extracting global context information. We also introduce the Skip-Fusion block, designed to enable smooth skip-connections and ensure ample feature fusion. Experimental results on multiple medical image datasets demonstrate that CMUNeXt outperforms existing heavyweight and lightweight medical image segmentation networks in terms of segmentation performance, while offering a faster inference speed, lighter weights, and a reduced computational cost. The code is available at https://github.com/FengheTan9/CMUNeXt.
研究动机与目标
- 在边缘/临床约束下,激励在轻量级医学分割中对全局上下文提取的需求。
- 提出一种基于全卷积的 CMUNeXt 架构,具备大核块和倒置瓶颈设计,以实现全球信息的高效混合。
- 引入 Skip-Fusion 块,以实现顺畅、有效的编码器-解码器特征融合。
- 证明 CMUNeXt 在乳腺和甲状腺超声数据集上实现了相对于计算量的有利精度,并提供开源代码和基准。
提出的方法
- 引入 CMUNeXt 块:深度卷积带大核,在残差结构中随后是两次带 GELU 和 BatchNorm 的倒置瓶颈逐点卷积。
- 用 Skip-Fusion 块替换标准跳连:分组卷积,含两次带倒置瓶颈的逐点卷积,用于编码器-解码器特征融合。
- 采用五级 U 形编码器-解码器,含一个 stem,通过最大池化下采样,以及在解码器中进行双线性上采样。
- 使用组合的 BCE 与 Dice 损失以及标准 SGD 优化,在调整为 256x256 的图像上进行训练,并进行数据增强。
- 提供三种 CMUNeXt 变体(S、L 和 baseline),具有不同的通道配置和内核设置,以在精度和计算量之间取得平衡。
实验结果
研究问题
- RQ1一个具备大核且全卷积的轻量级网络是否能够在超声数据上达到或超过基于 Transformer 的和重量级 CNN 的医学分割模型?
- RQ2所提出的 CMUNeXt 块是否能够在 U-Net 类架构中以极少的参数实现有效的全局上下文耦合?
- RQ3在边缘设备约束下,Skip-Fusion 块是否改善编码器-解码器特征融合和整体分割性能?
- RQ4不同超声数据集上,CMUNeXt 变体在精度、参数量、FLOPs 和 FPS 之间如何权衡?
主要发现
- CMUNeXt 在使用更少参数和更低计算量的情况下,其分割性能与最先进方法相当。
- CMUNeXt-S 在超声数据集上实现快速推断(高 FPS),IoU 和 F1 分数具有竞争力。
- CMUNeXt-L 在减少参数和 FLOPs 的同时仍提供强劲性能,并提升 FPS。
- 消融结果表明,用 CMUNeXt 块替换常规卷积并添加 Skip-Fusion 块,能够逐步提升分割精度并保持高效。
- 带有大核卷积且保留诱导偏置的设计在医学图像中有效捕获全局上下文,有助于精准病灶定位。
- 在多个数据集上,与 U-Net 和 UNeXt 相比,CMUNeXt 的训练稳定性更高,收敛速度更快。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。