Skip to main content
QUICK REVIEW

[논문 리뷰] Comparison of U-net-based Convolutional Neural Networks for Liver Segmentation in CT

Hans Meine, Grzegorz Chlebus|arXiv (Cornell University)|2018. 01. 01.
Medical Image Segmentation Techniques참고 문헌 12인용 수 7
한 줄 요약

이 연구는 전문가가 레이블링한 219개의 케이스를 사용하여 CT 영상에서 간 분할을 위한 U-net 기반 합성곱 신경망을 평가한다. 연구에서는 정사각형 단면에 대해 훈련된 2D U-net의 앙상블을 제안하며, 하드웨어 제약으로 인해 3D U-net보다 우수한 성능을 보이며, 평균 및 중앙값 Dice 점수는 0.97 이상을 기록하고, 해상도 손실이 발생하는 리샘플링에도 불구하고 표면 거리 지표가 뛰어나다.

ABSTRACT

Various approaches for liver segmentation in CT have been proposed: Besides statistical shape models, which played a major role in this research area, novel approaches on the basis of convolutional neural networks have been introduced recently. Using a set of 219 liver CT datasets with reference segmentations from liver surgery planning, we evaluate the performance of several neural network classifiers based on 2D and 3D U-net architectures. An interesting observation is that slice-wise approaches perform surprisingly well, with mean and median Dice coefficients above 0.97, and may be preferable over 3D approaches given current hardware and software limitations.

연구 동기 및 목표

  • CT 영상에서 2D 및 3D U-net 아키텍처의 성능을 비교한다.
  • 비트 볼륨 리샘플링 해상도(2 mm 대비 1 mm)가 분할 정확도에 미치는 영향을 평가한다.
  • 수직 시야에서 훈련된 2D U-net의 앙상블이 단일 2D 또는 3D U-net보다 더 높은 내성성을 가지는지 조사한다.
  • 손실 함수(Dice 대비 이진 교차 엔트로피)가 모델 수렴 및 성능에 미치는 영향을 분석한다.
  • 특히 GPU 메모리가 3D U-net 훈련 및 추론을 제한하는 하드웨어 및 소프트웨어 제약 조건을 규명한다.

제안 방법

  • 전문가가 레이블링한 219개의 CT 볼륨에서 4개 또는 5개의 해상도 수준을 가진 여러 2D 및 3D U-net 변종을 훈련한다.
  • CT 데이터에는 Lanczos 보간법을, 마스크에는 최소 거리 보간법을 사용하여 등방성 리샘플링을 통해 2 mm 및 1 mm 비트 크기로 변환한다.
  • 축상, 경사상, coronal 단면에 대해 각각 훈련된 세 개의 2D U-net을 조합하는 앙상블 분류기 구현으로 공간 일반화 능력을 향상시킨다.
  • 훈련 속도를 가속화하고 수렴을 향상시키기 위해 ReLU 활성화 함수 이전에 배치 정규화를 적용한다.
  • Dice 계수, 표면 거리 지표(MICCAI 점수), 통계적 유의성 검정(Wilcoxon 부호 순위 검정)을 사용하여 모델 성능을 평가한다.
  • 특히 8 GiB GPU 메모리로 인한 배치 크기 제약을 중심으로, 아키텍처 간 훈련 효율성 및 메모리 사용량을 비교한다.

실험 결과

연구 질문

  • RQ1수직 시야에서 훈련된 2D U-net 앙상블이 CT 영상에서 간 분할 작업에서 단일 2D 및 3D U-net 아키텍처를 능가하는가?
  • RQ2다른 비트 리샘플링 해상도(2 mm 대비 1 mm)는 분할 성능과 표면 거리 지표에 어떤 영향을 미치는가?
  • RQ33D U-net 모델이 GPU 메모리 제약으로 인해 2D 앙상블에 비해 얼마나 떨어지는가?
  • RQ4이 높은 품질의 분할 작업에서 Dice 손실이 이진 교차 엔트로피보다 유의미한 성능 향상을 제공하는가?
  • RQ5하드웨어 제약으로 인해 3D 훈련 배치 크기가 제한될 경우, 2D 슬라이스 기반 접근 방식이 3D 모델보다 뛰어난 결과를 낼 수 있는가?

주요 결과

  • 수직 시야에서 훈련된 2D U-net 앙상블은 평균 Dice 계수 0.97 이상, 중앙값 Dice 0.97 이상을 기록하며, 단일 2D 및 3D U-net 모델을 모두 능가한다.
  • 2 mm 등방성 비트로 리샘플링된 상태에서도 2D 앙상블은 훈련되지 않은 인간 전문가보다 MICCAI 점수를 높게 기록하여 높은 분할 정확도를 입증한다.
  • 3D U-net 모델은 제한된 GPU 메모리로 인해 효과적인 배치 크기와 훈련 안정성이 떨어져 2D 앙상블보다 유의미하게 열등하다.
  • 패딩을 적용한 3D U-net(3Dpad U-net)는 단순 3D U-net보다 유의미하게 뛰어난 성능을 보이며, 메모리 제약 하에서 아키텍처 수정의 중요성을 입증한다.
  • 이 데이터셋에서는 Dice 손실이 이진 교차 엔트로피보다 성능 향상에 유의미한 영향을 주지 않았다. 이는 전문가 기반 레이블링의 높은 품질 때문일 것이다.
  • 비트 크기를 2 mm에서 1 mm로 줄임으로써 MICCAI 점수는 유의미하게 향상(p < 0.05)되었으며, 이는 표면 거리 지표 향상 때문이지만, 부피 오버랩에는 유의미한 개선이 없어, 해상도와 계산 비용 사이의 상충 관계를 보여준다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.