[论文解读] V-Net: Fully Convolutional Neural Networks for Volumetric Medical Image Segmentation
V-Net 引入了一个用于端到端体积MRI前列腺分割的3D全卷积网络,基于Dice损失,实现快速推断和较强的准确性。
Convolutional Neural Networks (CNNs) have been recently employed to solve problems from both the computer vision and medical image analysis fields. Despite their popularity, most approaches are only able to process 2D images while most medical data used in clinical practice consists of 3D volumes. In this work we propose an approach to 3D image segmentation based on a volumetric, fully convolutional, neural network. Our CNN is trained end-to-end on MRI volumes depicting prostate, and learns to predict segmentation for the whole volume at once. We introduce a novel objective function, that we optimise during training, based on Dice coefficient. In this way we can deal with situations where there is a strong imbalance between the number of foreground and background voxels. To cope with the limited number of annotated volumes available for training, we augment the data applying random non-linear transformations and histogram matching. We show in our experimental evaluation that our approach achieves good performances on challenging test data while requiring only a fraction of the processing time needed by other previous methods.
研究动机与目标
- 展示体积(3D)CNN在端到端医疗影像分割中的应用。
- 使用基于 Dice 的损失来处理医学体积中的前景–背景不平衡。
- 通过残差学习和体积卷积提高训练效率和收敛性。
- 通过在线几何和强度变换扩增有限的带注释数据。
- 展示在 PROMISE 2012 前列腺 MRI 数据上的快速推断和具有竞争力的性能。
提出的方法
- 提出一个处理 128×128×64 的 MRI 体积、端到端的体积全卷积网络。
- 在3D编码器-解码器(压缩与扩张)架构内使用残差学习块。
- 用卷积替代池化,并使用 2×2×2 的步长-2 下采样在降低分辨率的同时增加特征通道。
- 引入类似跳跃的水平连接,以将早期阶段的细节与更深层的全局上下文结合起来。
- 使用基于 Dice 系数的损失训练,以处理前景–背景不平衡。
- 通过在线随机可变形变换和直方图匹配来增强训练数据以提高鲁棒性。
实验结果
研究问题
- RQ13D 全卷积网络是否能够直接对整幅 MRI 体积中的前列腺结构进行分割,而不需要逐切片处理?
- RQ2相对于带重权的交叉熵,基于 Dice 的损失在前景–背景不平衡下是否提升了分割性能?
- RQ3残差连接以及体积下采样/上采样对收敛速度和分割精度的影响是什么?
- RQ4V-Net 在 PROMISE 2012 前列腺 MRI 数据上的表现相对于现有方法如何?
主要发现
- V-Net with Dice-based loss 在 PROMISE 2012 测试数据上达到 Avg. Dice 0.869±0.033。
- V-Net with Dice-based loss 在 PROMISE 2012 测试数据上达到 Avg. Hausdorff distance 5.71±1.20 mm。
- V-Net with Dice-based loss 在 PROMISE 2012 挑战任务中的分值为 82.39。
- 使用带重权的多项逻辑损失得到较低的 Dice(0.739±0.088)和更差的 Hausdorff 距离(10.55±5.38 mm)。
- V-Net 的 Dice 损失在同一数据集上优于若干列出的方法(例如 Imorphics 0.879±0.044 Dice, 5.935±2.14 mm HD; ScrAutoProstate 0.874±0.036 Dice; SBIA 0.835±0.055 Dice)。
- 在50个体积、进行大幅数据增强的训练下,新的体积分割约1秒。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。