Skip to main content
QUICK REVIEW

[論文レビュー] Efficient automatic segmentation for multi-level pulmonary arteries: The PARSE challenge

Gongning Luo, Kuanquan Wang|arXiv (Cornell University)|Apr 7, 2023
Medical Imaging and Pathology Studies被引用数 10
ひとこと要約

PARSE ベンチマークは、CTPAで同時に主PAと分岐PAのセグメンテーションを実現する手法を評価し、マルチレベル評価と公開データセットを用いて精度と推論効率のバランスを取る。トップチームは新規アーキテクチャ、データ戦略、効率化の工夫を組み合わせ、DiceとHD95を最適化しつつ実行時間とGPUメモリを最小化。

ABSTRACT

Efficient automatic segmentation of multi-level (i.e. main and branch) pulmonary arteries (PA) in CTPA images plays a significant role in clinical applications. However, most existing methods concentrate only on main PA or branch PA segmentation separately and ignore segmentation efficiency. Besides, there is no public large-scale dataset focused on PA segmentation, which makes it highly challenging to compare the different methods. To benchmark multi-level PA segmentation algorithms, we organized the first \textbf{P}ulmonary \textbf{AR}tery \textbf{SE}gmentation (PARSE) challenge. On the one hand, we focus on both the main PA and the branch PA segmentation. On the other hand, for better clinical application, we assign the same score weight to segmentation efficiency (mainly running time and GPU memory consumption during inference) while ensuring PA segmentation accuracy. We present a summary of the top algorithms and offer some suggestions for efficient and accurate multi-level PA automatic segmentation. We provide the PARSE challenge as open-access for the community to benchmark future algorithm developments at \url{https://parse2022.grand-challenge.org/Parse2022/}.

研究の動機と目的

  • 同時に主PAと分岐PAをセグメンテーションするための、公開された大規模ベンチマークを確立・動機づける。
  • 臨床適用のニーズを反映するため、精度と効率を一体で評価する。
  • 高性能手法から得られる洞察とガイドラインを提供し、効率的な多レベルPAセグメンテーションを推進する。

提案手法

  • 肺外の主PAと肺内の分岐PAという二レベルのセグメンテーションベンチマークを、分重付きスコア(分岐80%、主20%)で提供する。
  • 精度にはDSCとHD95を用い、効率には実行時間とGPUメモリを用いる。
  • 外部データや事前学習モデルの使用を厳格に禁じ、訓練・検証・テスト段階を組織する;最終結果にはDocker提出を要求する。
  • 重み付きDSC、重み付きHD95、RT、GPUを組み合わせて四つのmMetricランキングを算出し、最終スコアとする。
  • 複数センター・ベンダーにまたがる1 mm CTスライスを含む203名の対象を用いたPARSEデータセットを公開する。

実験結果

リサーチクエスチョン

  • RQ1臨床レベルの効率を維持しつつ、CTPAで自動セグメンテーションが主PAと分岐PAの両方を信頼性高く分割できるか?
  • RQ2多レベル血管セグメンテーションで精度と速度のバランスをとる最も効果的な戦略は何か?
  • RQ3様々なアルゴリズム的手法(例:U-Net系の変種、スケルトンベースデコード、多段パイプライン)が主PAと分岐PAの性能に与える影響はどうなるか?
  • RQ4データセットのばらつき、アノテーションノイズ、トップパフォーマンス手法から今後の研究を導く洞察は何か?

主な発見

チーム主PA DSC (%)分岐PA DSC (%)重み付きPA DSC (%)HD95 主PA (mm)HD95 分岐PA (mm)HD95 重み付きPA (mm)RT (s/ケース)GPU (MB)
T189.70±6.4677.19±8.3279.69±6.957.084.805.267.921674
T291.71±4.0076.67±8.3979.68±6.944.834.744.7518.613658
T391.57±4.2576.86±7.9479.80±6.614.995.465.3614.536300
T489.50±6.5875.53±8.8578.33±7.496.764.925.296.633326
T589.98±4.9476.76±7.8879.40±6.387.745.706.1063.112828
T690.05±5.6576.76±8.1579.42±6.898.385.446.0325.558176
T790.49±5.1376.57±8.2979.36±6.806.374.564.92263.243658
T890.83±4.6876.25±8.2979.17±6.809.195.175.9857.574120
T990.29±5.0476.53±8.3379.28±6.876.505.365.5855.719303
T1090.45±5.2076.10±8.7178.97±7.166.184.935.18380.573472
T1190.08±5.3775.71±8.6878.58±7.299.194.945.7988.933658
T1289.69±5.3075.46±8.4078.31±6.9431.655.9111.067.744298
T1390.12±4.8274.30±9.0677.46±7.5318.435.528.1051.142800
T1490.55±4.6368.86±9.7073.20±7.976.2417.266.328.111894
T1590.55±5.1376.29±8.5879.15±7.126.054.714.98218.8210242
T1690.34±4.8674.98±8.7878.05±7.176.505.185.44116.404988
T1789.87±5.0470.00±9.7973.98±8.086.968.818.444.218230
T1890.19±4.4371.30±8.8375.08±7.286.137.847.50224.222328
T1989.74±4.8570.41±7.9174.28±6.637.2015.8714.13172.932640
T2089.84±4.8575.29±7.5278.20±6.1920.658.2810.7580.119424
T2189.80±5.2474.76±8.5677.77±7.1411.776.107.2476.6912288
T2290.55±4.9476.05±8.3178.95±6.899.145.226.003178.750
T2380.65±9.5662.53±7.1966.15±6.42140.7511.2437.1548.2221996
T2482.65±25.4169.37±22.3572.02±22.61---419.203349
T2585.79±18.8269.78±16.4072.98±16.5265.12--111.509784
  • トップ手法は主PAで平均DSC約89–91%、分岐PAで約68–77%、重み付きPA DSCは約79–80%を達成。
  • HD95はチーム間で分岐PAを支持する傾向で、主PA領域の難易度の高さを示している。
  • 優れた手法は精度と効率のバランスをとる。高速性(RT)やメモリ(GPU)を優先するものもあれば、精度を重視するものもあり、指標の重視度によってランキングの安定性が変わる。
  • 最終ランキングはDSC、HD95、RT、GPUの四指標を統合し、分岐PAをより重く(80%)重み付けして、堅牢な多レベル評価を可能にする。
  • セグメンテーション品質と推論効率の間にはトレードオフがある。高い精度に近づく一方でGPU/メモリコストが高いチームもあれば、実行時間を最適化しつつ精度を小幅に変更するチームもある。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。