QUICK REVIEW

[论文解读] A Fully Convolutional Neural Network for Cardiac Segmentation in Short-Axis MRI

Phi Vu Tran|arXiv (Cornell University)|Apr 2, 2016

Advanced X-ray and CT Imaging参考文献 34被引用 321

一句话总结

本文提出了一个完全卷积神经网络（FCN），对短轴心肺MRI的左心室和右心室进行端到端、像素级分割，在多个数据集上达到最先进的准确性，并实现快速、可扩展的推理。

ABSTRACT

Automated cardiac segmentation from magnetic resonance imaging datasets is an essential step in the timely diagnosis and management of cardiac pathologies. We propose to tackle the problem of automated left and right ventricle segmentation through the application of a deep fully convolutional neural network architecture. Our model is efficiently trained end-to-end in a single learning stage from whole-image inputs and ground truths to make inference at every pixel. To our knowledge, this is the first application of a fully convolutional neural network architecture for pixel-wise labeling in cardiac magnetic resonance imaging. Numerical experiments demonstrate that our model is robust to outperform previous fully automated methods across multiple evaluation measures on a range of cardiac datasets. Moreover, our model is fast and can leverage commodity compute resources such as the graphics processing unit to enable state-of-the-art cardiac segmentation at massive scales. The models and code are available at https://github.com/vuptran/cardiac-segmentation

研究动机与目标

在短轴心 cine MRI 中实现左心室和右心室分割的自动化，无需手工特征或先验信息。
使用单一FCN架构在具有多样扫描仪和人群的多個公开心脏MRI数据集上进行评估。
展示端到端、逐像素标记在单阶段学习中训练的可行性，并评估迁移学习潜力。

提出的方法

采用15层带跳跃连接的完全卷积网络，用于端到端的逐像素分割。
使用均值方差归一化（MVN）和带 Dropout 的 ReLU 激活，以及 L2 正则化以减轻过拟合。
进行多尺度居中裁剪和仿射数据增强，以提高鲁棒性并解决类别不均衡。
使用随机梯度下降和动量进行训练，采用 Xavier 初始化和多项式学习率衰减。
可选择在一个大型LV数据集上进行预训练，并将学习到的权重迁移到目标LV/RV任务（迁移学习）。
推理速度快（在 GTX TITAN X 上，大约 61 ms 处理一个 256×256 图像），且可扩展到 CPU/GPU。

实验结果

研究问题

RQ1单个 FCN 架构是否能够在多样数据集上实现准确、自动化的 LV 和 RV 分割？
RQ2来自相关心脏分割任务的迁移学习是否在较小的目标数据集上提升性能？
RQ3在标准硬件上，FCN 方法的推理速度和可扩展性如何？

主要发现

该 FCN 在各数据集上实现了有竞争力 Dice 分数以及其他突出指标，通常达到最佳分数。
对 FCN 进行微调（迁移学习）在准确性上明显优于随机初始化。
在测试时间对大规模图像集进行分割也很快（例如，在 LVSC 上对 29,859 张图像的分割在 19 分钟内），单图像推断在 GPU 上约为 61 ms。
模型在不同站点、扫描仪和人群之间具有良好泛化能力，显示出对现实世界变异性的鲁棒性。
在难以清晰界定的尖端/基底切片上存在局限性，对象边界模糊，说明仍有改进空间。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。