QUICK REVIEW

[논문 리뷰] Embracing Imperfect Datasets: A Review of Deep Learning Solutions for Medical Image Segmentation

Nima Tajbakhsh, Laura Jeyaseelan|arXiv (Cornell University)|2019. 08. 27.

Advanced Neural Network Applications참고 문헌 171인용 수 331

한 줄 요약

의료 영상 분할에서 희소하고 약한 주석을 해결하기 위한 방법들에 대한 포괄적 고찰로, 데이터 증강, 외부 데이터 활용, 도메인 적응, 강건 학습 전략을 다룬다.

ABSTRACT

The medical imaging literature has witnessed remarkable progress in high-performing segmentation models based on convolutional neural networks. Despite the new performance highs, the recent advanced segmentation models still require large, representative, and high quality annotated datasets. However, rarely do we have a perfect training dataset, particularly in the field of medical imaging, where data and annotations are both expensive to acquire. Recently, a large body of research has studied the problem of medical image segmentation with imperfect datasets, tackling two major dataset limitations: scarce annotations where only limited annotated data is available for training, and weak annotations where the training data has only sparse annotations, noisy annotations, or image-level annotations. In this article, we provide a detailed review of the solutions above, summarizing both the technical novelties and empirical results. We further compare the benefits and requirements of the surveyed methodologies and provide our recommended solutions. We hope this survey article increases the community awareness of the techniques that are available to handle imperfect medical image segmentation datasets.

연구 동기 및 목표

불완전한 의료 데이터셋에서도 효과적인 분할이 필요하다는 점을 강조하여 연구의 동기를 제시한다.
데이터셋의 한계를 희소 주석과 약한 주석으로 분류하고 이에 상응하는 해결책을 요약한다.
실무를 안내하기 위해 데이터 중심 및 학습 중심 기법을 경험적 결과와 함께 고찰한다.
불완전한 데이터셋에 대한 실용적 해결책을 권고하기 위해 비용-편익 관점을 제시한다.

제안 방법

의료 영상 분할에서 희소 주석과 약한 주석으로 방법을 분류하고 검토한다.
희소성에 대한 데이터 증강, 외부 라벨 데이터 활용, CRF 기반 보정 방법을 요약한다.
외부 데이터를 활용하기 위한 전이 학습, 도메인 적응, 데이터셋 융합을 요약한다.
주석이 약한 경우의 학습 전략을 논의하며, 클래스 활성화 맵, 다중 인스턴스 학습, 강건한 손실 형태를 포함한다.
성능, 구현 난이도, 데이터 요구사항 측면에서 방법론을 비교하고 권고를 제시한다.

실험 결과

연구 질문

RQ1의료 영상 분할에서 희소 주석을 다루는 주된 기법은 무엇인가?
RQ2약한 주석(희소하고, 노이즈가 있거나 이미지 수준의 라벨)을 분할에 효과적으로 활용하는 방법은 무엇인가?
RQ3불완전한 데이터셋에서 데이터 중심 증강, 외부 데이터 활용, 정규화 기법 간의 트레이드오프는 무엇인가?
RQ4도메인 적응 및 다중 도메인 학습은 임상 영상 설정에서 일반화를 어떻게 향상시키는가?

주요 결과

전통적 증강, 믹스업, 합성 전략 등을 포함한 데이터 증강은 제한된 주석하에서 과적합을 완화하는 데 도움이 된다.
전이 학습, 도메인 적응, 데이터셋 융합을 통한 외부 라벨 데이터는 대상 데이터가 희소할 때 분할 성능을 향상시킬 수 있다.
CRF 기반 후처리 및 정규화 방법은 추가 주석 없이 분할 품질을 향상시킨다.
GAN, CycleGAN, MUNIT을 이용한 도메인 적응은 스캐너, 모달리티, 환자 집단 간 분포 이동을 해결한다.
이미지 수준 주석이나 희소 주석으로부터 학습을 가능하게 하는 약지도 학습 기술로는 클래스 활성화 맵과 선택적 손실이 있다.
이 연구는 데이터 가용성과 자원을 기준으로 접근법 선택을 안내하는 비용-편익 프레임워크를 제공한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.