Skip to main content
QUICK REVIEW

[论文解读] Efficient automatic segmentation for multi-level pulmonary arteries: The PARSE challenge

Gongning Luo, Kuanquan Wang|arXiv (Cornell University)|Apr 7, 2023
Medical Imaging and Pathology Studies被引用 10
一句话总结

PARSE 基准在 CTPA 同时进行主 PA 与分支 PA 的肺动脉分割,通过多级评估和开放数据集,在准确性与推理效率之间取得平衡。顶级团队结合新颖的体系结构、数据策略和效率技巧,在 Dice 与 HD95 上实现优化,同时尽量降低运行时间和显存。

ABSTRACT

Efficient automatic segmentation of multi-level (i.e. main and branch) pulmonary arteries (PA) in CTPA images plays a significant role in clinical applications. However, most existing methods concentrate only on main PA or branch PA segmentation separately and ignore segmentation efficiency. Besides, there is no public large-scale dataset focused on PA segmentation, which makes it highly challenging to compare the different methods. To benchmark multi-level PA segmentation algorithms, we organized the first extbf{P}ulmonary extbf{AR}tery extbf{SE}gmentation (PARSE) challenge. On the one hand, we focus on both the main PA and the branch PA segmentation. On the other hand, for better clinical application, we assign the same score weight to segmentation efficiency (mainly running time and GPU memory consumption during inference) while ensuring PA segmentation accuracy. We present a summary of the top algorithms and offer some suggestions for efficient and accurate multi-level PA automatic segmentation. We provide the PARSE challenge as open-access for the community to benchmark future algorithm developments at \url{https://parse2022.grand-challenge.org/Parse2022/}.

研究动机与目标

  • 为同时对主 PA 和分支 PA 在 CTPA 中的分割建立一个公开的大规模基准并给予动机。
  • 综合评估准确性和效率,以反映临床部署需求。
  • 从表现最好的方法中提取见解与指南,推动高效的多级 PA 分割。

提出的方法

  • 提供一个两级 PA 分割基准(主 PA 在肺部外;分支 PA 在肺部内)并采用加权分数(分支80%,主20%)。
  • 使用 DSC 和 HD95 衡量准确性;以运行时间和显存衡量效率。
  • 将训练、验证和测试阶段组织起来,严格不使用外部数据或预训练模型;最终结果需提交 Docker。
  • 通过将加权 DSC、加权 HD95、RT 和 GPU 四项指标组合,计算四项指标的综合排名。
  • 发布 PARSE 数据集,包含 203 名受试者(训练、验证、测试)、1 mm CT 切片,来自多个中心和厂商。

实验结果

研究问题

  • RQ1自动分割是否能在 CTPA 中可靠地同时分割主 PA 和分支 PA,同时保持临床水平的效率?
  • RQ2在多级血管分割中,哪些策略最有效地在准确性和速度之间取得平衡?
  • RQ3不同的算法方法(如 U-Net 变体、骨架解码、多阶段管线)对主 PA 与分支 PA 的性能有何影响?
  • RQ4关于数据集变异性、标注噪声以及顶尖技术有哪些洞见,可以指导未来工作?

主要发现

团队主 PA DSC (%)分支 PA DSC (%)加权 PA DSC (%)主 PA HD95 (mm)分支 PA HD95 (mm)加权 PA HD95 (mm)运行时间 (s/例)显存 (MB)
T189.70±6.4677.19±8.3279.69±6.957.084.805.267.921674
T291.71±4.0076.67±8.3979.68±6.944.834.744.7518.613658
T391.57±4.2576.86±7.9479.80±6.614.995.465.3614.536300
T489.50±6.5875.53±8.8578.33±7.496.764.925.296.633326
T589.98±4.9476.76±7.8879.40±6.387.745.706.1063.112828
T690.05±5.6576.76±8.1579.42±6.898.385.446.0325.558176
T790.49±5.1376.57±8.2979.36±6.806.374.564.92263.243658
T890.83±4.6876.25±8.2979.17±6.809.195.175.9857.574120
T990.29±5.0476.53±8.3379.28±6.876.505.365.5855.719303
T1090.45±5.2076.10±8.7178.97±7.166.184.935.18380.573472
T1190.08±5.3775.71±8.6878.58±7.299.194.945.7988.933658
T1289.69±5.3075.46±8.4078.31±6.9431.655.9111.067.744298
T1390.12±4.8274.30±9.0677.46±7.5318.435.528.1051.142800
T1490.55±4.6368.86±9.7073.20±7.976.2417.266.328.111894
T1590.55±5.1376.29±8.5879.15±7.126.054.714.98218.8210242
T1690.34±4.8674.98±8.7878.05±7.176.505.185.44116.404988
T1789.87±5.0470.00±9.7973.98±8.086.968.818.444.218230
T1890.19±4.4371.30±8.8375.08±7.286.137.847.50224.222328
T1989.74±4.8570.41±7.9174.28±6.637.2015.8714.13172.932640
T2089.84±4.8575.29±7.5278.20±6.1920.658.2810.7580.119424
T2189.80±5.2474.76±8.5677.77±7.1411.776.107.2476.6912288
T2290.55±4.9476.05±8.3178.95±6.899.145.226.003178.750
T2380.65±9.5662.53±7.1966.15±6.42140.7511.2437.1548.2221996
T2482.65±25.4169.37±22.3572.02±22.61---419.203349
T2585.79±18.8269.78±16.4072.98±16.5265.12--111.509784
  • 顶尖方法在主 PA 的平均 DSC 约为 89–91%,分支 PA 为 68–77%,加权 PA DSC 约为 79–80%。
  • HD95 在不同团队中偏向分支 PA 相对于主 PA,凸显主 PA 区域的更高难度。
  • 顶尖表现者在准确性与效率之间取得平衡;有些优先考虑速度(RT)或显存,而其他则偏向准确性,表明排名稳定性取决于指标重点。
  • 最终排名整合四项指标(DSC、HD95、RT、GPU),分支 PA 加权更高(80%),实现对多级评估的稳健性。
  • 分割质量与推理效率之间存在权衡;有些团队在接近最佳的准确性下仍然需要高显存/显存成本,而其他团队通过优化运行时间实现了在准确性变化较小的情况下优化。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。