Skip to main content
QUICK REVIEW

[论文解读] Comparison of U-net-based Convolutional Neural Networks for Liver Segmentation in CT

Hans Meine, Grzegorz Chlebus|arXiv (Cornell University)|Jan 1, 2018
Medical Image Segmentation Techniques参考文献 12被引用 7
一句话总结

本研究基于219例标注病例,评估了用于CT扫描肝脏分割的U-Net架构卷积神经网络。提出了一种在正交切片上训练的2D U-Net集成模型,由于硬件限制,其性能优于3D U-Net,即使在重采样导致分辨率损失的情况下,仍实现了平均和中位Dice分数高于0.97,且表面距离度量指标更优。

ABSTRACT

Various approaches for liver segmentation in CT have been proposed: Besides statistical shape models, which played a major role in this research area, novel approaches on the basis of convolutional neural networks have been introduced recently. Using a set of 219 liver CT datasets with reference segmentations from liver surgery planning, we evaluate the performance of several neural network classifiers based on 2D and 3D U-net architectures. An interesting observation is that slice-wise approaches perform surprisingly well, with mean and median Dice coefficients above 0.97, and may be preferable over 3D approaches given current hardware and software limitations.

研究动机与目标

  • 比较2D与3D U-Net架构在CT扫描肝脏分割中的性能。
  • 评估体素重采样分辨率(2 mm与1 mm)对分割精度的影响。
  • 探究在冠状面、矢状面和轴向面切片上训练的2D U-Net集成模型是否能提升相对于单个2D或3D U-Net模型的鲁棒性。
  • 分析损失函数(Dice损失与二元交叉熵)对模型收敛性和性能的影响。
  • 识别硬件与软件限制(特别是GPU内存)对3D U-Net训练与推理的制约。

提出的方法

  • 在219例具有专家标注肝脏分割的CT影像上,训练了具有四或五级分辨率的多个2D与3D U-Net变体。
  • 使用Lanczos插值对CT数据进行各向同性重采样至2 mm和1 mm体素大小,对掩码则使用最近邻插值。
  • 构建了一个集成分类器,结合在轴向、矢状和冠状切片上分别训练的三个2D U-Net,以提升空间泛化能力。
  • 在ReLU激活前使用批量归一化,以加速训练并改善收敛性。
  • 使用Dice系数、表面距离度量(MICCAI评分)以及统计显著性检验(Wilcoxon符号秩检验)评估模型性能。
  • 比较不同架构的训练效率与内存使用情况,特别关注因8 GiB GPU内存导致的批量大小限制。

实验结果

研究问题

  • RQ1在CT扫描肝脏分割任务中,基于正交视图训练的2D U-Net集成模型是否优于单个2D或3D U-Net架构?
  • RQ2不同的体素重采样分辨率(2 mm与1 mm)如何影响分割性能与表面距离度量?
  • RQ3由于GPU内存限制,3D U-Net模型相较于2D集成模型的性能下降程度有多大?
  • RQ4在本高质量分割任务中,Dice损失是否相比二元交叉熵提供显著性能优势?
  • RQ5当硬件限制导致3D训练批量大小受限时,2D切片级方法是否能实现优于3D模型的结果?

主要发现

  • 在冠状面、矢状面和轴向面切片上训练的2D U-Net集成模型实现了平均Dice系数高于0.97,中位Dice系数也高于0.97,优于单个2D和3D U-Net模型。
  • 尽管重采样至2 mm各向同性体素,2D集成模型的MICCAI评分仍高于未经训练的人类专家,表明其具有极高的分割精度。
  • 3D U-Net模型的性能显著劣于2D集成模型,主要原因是GPU内存受限,导致有效批量大小减小,训练稳定性下降。
  • 采用填充卷积的3D U-Net(3Dpad U-net)显著优于原始3D U-Net,凸显了在内存受限条件下进行架构改进的重要性。
  • 在本数据集中,Dice损失并未显著优于二元交叉熵,可能是因为专家参考分割质量极高。
  • 将体素尺寸从2 mm减小到1 mm显著提升了MICCAI评分(p < 0.05),这是由于表面距离度量更优,但并未显著改善体积重叠,表明分辨率与计算成本之间存在权衡。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。