Skip to main content
QUICK REVIEW

[論文レビュー] Semi-supervised Segmentation via Uncertainty Rectified Pyramid Consistency and Its Application to Gross Target Volume of Nasopharyngeal Carcinoma.

Xiangde Luo, Wenjun Liao|arXiv (Cornell University)|Dec 13, 2020
Head and Neck Cancer Studies被引用数 1
ひとこと要約

本論文は、鼻咽頭がん(NPC)のグロスターゲットボリューム(GTV)セグメンテーションのための半教師付き深層学習フレームワーク、不確実性補正ピラミッド整合性(URPC)を提案する。20%のラベル付きデータのみを用いて、マルチスケールピラミッド予測と不確実性を考慮した整合性正則化を活用することで、分類精度が向上し、258体積のNPCデータセットにおいて、平均DSCは81.22%、平均表面距離(ASD)は1.88ボクセルを達成した。

ABSTRACT

Gross Target Volume (GTV) segmentation plays an irreplaceable role in radiotherapy planning for Nasopharyngeal Carcinoma (NPC). Despite that convolutional neural networks (CNN) have achieved good performance for this task, they rely on a large set of labeled images for training, which is expensive and time-consuming to acquire. Recently, semi-supervised methods that learn from a small set of labeled images with a large set of unlabeled images have shown potential for dealing with this problem, but it is still challenging to train a high-performance model with the limited number of labeled data. In this paper, we propose a novel framework with Uncertainty Rectified Pyramid Consistency (URPC) regularization for semi-supervised NPC GTV segmentation. Concretely, we extend a backbone segmentation network to produce pyramid predictions at different scales, the pyramid predictions network (PPNet) was supervised by the ground truth of labeled images and a multi-scale consistency loss for unlabeled images, motivated by the fact that prediction at different scales for the same input should be similar and consistent. However, due to the different resolution of these predictions, encouraging them to be consistent at each pixel directly is not robust and may bring much noise and lead to a performance drop. To deal with this dilemma, we further design a novel uncertainty rectifying module to enable the framework to gradually learn from meaningful and reliable consensual regions at different scales. Extensive experiments on our collected NPC dataset with 258 volumes show that our method can largely improve performance by incorporating the unlabeled data, and this framework achieves a promising result compared with existing semi-supervised methods, which achieves 81.22% of mean DSC and 1.88 voxels of mean ASD on the test set, where the only 20% of the training set were annotated.

研究の動機と目的

  • GTVセグメンテーションのためのNPC MRIスキャンの大量ラベル付けにかかる高コストと人的負荷を軽減すること。
  • 限られたラベル付きデータにおける医療画像セグメンテーションの半教師付き学習性能を向上させること。
  • 異なる特徴ピラミッドレベル間での一貫性のない予測に起因するノイズを低減する、頑健なマルチスケール整合性正則化を開発すること。
  • 不確実性推定を用いて、スケールレベル間で一貫性のある信頼性の高い領域にのみ学習を集中させることで、モデルの一般化性能を向上させること。

提案手法

  • 共有バックボーンネットワークからマルチスケールのセグメンテーション出力を生成するためのピラミッド予測ネットワーク(PPNet)を設計した。
  • ラベル付き画像では正解値による監視を行い、ラベルなし画像ではスケールレベル間の整合性を強制するマルチスケール整合性損失を用いて学習した。
  • 予測の信頼性に基づいて整合性損失の重みを動的に調整する不確実性補正モジュールを導入し、信頼性の低い領域に起因するノイズを低減した。
  • 不確実性モジュールは、空間的位置とスケールごとに不確実性を推定し、トレーニング中に信頼性の高い一貫性のある領域に注目できるようにした。
  • 不確実性を考慮した整合性正則化をU-Netベースのバックボーンに統合し、ラベル付きおよびラベルなしデータを用いたエンドツーエンド学習を可能にした。
  • 信頼性の高い一貫性のある領域に着目することで、スケール間で段階的に予測を精緻化し、より頑健で高い性能を実現した。

実験結果

リサーチクエスチョン

  • RQ1マルチスケールピラミッド予測と整合性正則化を組み合わせることで、NPCにおける半教師付きGTVセグメンテーションが向上するか?
  • RQ2不確実性推定は、マルチスケール半教師付き学習における整合性損失のロバスト性をどのように向上させるか?
  • RQ320%のトレーニングデータにラベルが付与されている状況で、ラベルなしデータを活用することで、セグメンテーション性能がどの程度向上するか?
  • RQ4不確実性補正は、スケールレベル間で不一致する予測からのノイズを効果的に抑制するか?
  • RQ5提案されたURPCフレームワークは、同じNPCデータセットにおいて、既存の半教師付き手法と比較してDSCおよびASDの観点で優れているか?

主な発見

  • 提案されたURPCフレームワークは、テストセットで平均DSCが81.22%を達成し、20%のラベル付きデータでの強力な性能を示した。
  • 平均表面距離(ASD)が1.88ボクセルにまで低減され、GTVの輪郭抽出における高い空間的正確性を示した。
  • ラベルなしデータの統合により、セグメンテーション性能が顕著に向上し、半教師付き学習戦略の有効性が裏付けられた。
  • 不確実性補正モジュールは、一貫性のない予測に起因するノイズを効果的に抑制し、より安定した信頼性の高いトレーニングを実現した。
  • 同じNPCデータセットにおいて、既存の半教師付き手法を上回る性能を示し、低データ環境下での優位性を確認した。
  • アブレーションスタディにより、ピラミッド整合性と不確実性補正の両モジュールが最適な性能を発揮するために不可欠であることが確認された。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。