[논문 리뷰] Identifying the Best Machine Learning Algorithms for Brain Tumor Segmentation, Progression Assessment, and Overall Survival Prediction in the BRATS Challenge
이 논문은 BRATS 2018 챌린지 데이터셋을 사용하여 뇌종양 세그멘테이션, 진행 평가 및 전반적인 생존 예측을 위한 기계학습 알고리즘을 평가하고 비교한다. 세그멘테이션 작업에서는 딥 러닝 모델이 높은 디스크 스코어를 기록하며 우수한 성능을 보였고, 생존 예측 작업에서는 데이터셋 크기가 작고 임상적 관련성이 높기 때문에 전통적인 기계학습 방법이 딥 러닝을 능가한다.
Gliomas are the most common primary brain malignancies, with different degrees of aggressiveness, variable prognosis and various heterogeneous histologic sub-regions, i.e., peritumoral edematous/invaded tissue, necrotic core, active and non-enhancing core. This intrinsic heterogeneity is also portrayed in their radio-phenotype, as their sub-regions are depicted by varying intensity profiles disseminated across multi-parametric magnetic resonance imaging (mpMRI) scans, reflecting varying biological properties. Their heterogeneous shape, extent, and location are some of the factors that make these tumors difficult to resect, and in some cases inoperable. The amount of resected tumor is a factor also considered in longitudinal scans, when evaluating the apparent tumor for potential diagnosis of progression. Furthermore, there is mounting evidence that accurate segmentation of the various tumor sub-regions can offer the basis for quantitative image analysis towards prediction of patient overall survival. This study assesses the state-of-the-art machine learning (ML) methods used for brain tumor image analysis in mpMRI scans, during the last seven instances of the International Brain Tumor Segmentation (BraTS) challenge, i.e., 2012-2018. Specifically, we focus on i) evaluating segmentations of the various glioma sub-regions in pre-operative mpMRI scans, ii) assessing potential tumor progression by virtue of longitudinal growth of tumor sub-regions, beyond use of the RECIST/RANO criteria, and iii) predicting the overall survival from pre-operative mpMRI scans of patients that underwent gross total resection. Finally, we investigate the challenge of identifying the best ML algorithms for each of these tasks, considering that apart from being diverse on each instance of the challenge, the multi-institutional mpMRI BraTS dataset has also been a continuously evolving/growing dataset.
연구 동기 및 목표
- 다양한 뇌영상 임상 과제(종양 세그멘테이션, 진행 평가, 전반적인 생존 예측)에 가장 효과적인 기계학습 알고리즘을 규명하기 위해.
- 이러한 과제들에서 딥 러닝과 전통적 기계학습 접근법 간의 성능 차이를 평가하기 위해.
- 데이터 이질성과 제한된 학습 샘플 수가 모델의 일반화 능력과 임상적 유용성에 미치는 영향을 이해하기 위해.
- 실제 임상적 필요와 데이터 가용성에 맞춰 알고리즘 설계를 조율함으로써 향후 임상 적용 가능한 인공지능 도구 개발을 안내하기 위해.
- 표준화된 벤치마킹과 오픈 소스 알고리즘 공유를 통해 연구 성과를 임상 현장에 효과적으로 번역하기 위해.
제안 방법
- BRATS 2018 챌린지 과제에서 다양한 기계학습 모델(예: 컨volution 신경망(CNNs), U-Net 변형, 전통적 기계학습 방법(예: 랜덤 포레스트, 서포트 벡터 머신(SVMs)))을 평가하였다.
- 19개 기관에서 수집한 185명의 환자에 대한 다중 영상 모odal MRI(mpMRI) 데이터를 사용하였으며, 표준화된 프리프로세싱 및 평가 프로토콜을 적용하였다.
- 세그멘테이션 성능 평가에 디스크 스코어를, 생존 예측 과제에선 공명 지수(C-index)와 AUC를 사용하였다.
- 세그멘테이션을 위한 계층적/연쇄형 딥 러닝 접근법: 먼저 정상 조직과 비정상 조직을 구분하고, 이후 종양 하위 영역(강화, 괴사, 부종)을 세그멘테이션한다.
- 모델 앙상블 및 데이터 증강을 구현하여 다양한 스캐너 및 프로토콜 설정에서의 강건성과 일반화 능력을 향상시켰다.
- 최상의 성능을 보인 모델들을 중앙 집중식 알고리즘 레포지터리(github.com/BraTS)를 통해 공개하여 재현 가능성과 임상 번역을 촉진하였다.
실험 결과
연구 질문
- RQ1다중 영상 모달 MRI 데이터를 사용할 때 어떤 기계학습 알고리즘이 뇌종양 세그멘테이션에서 가장 높은 성능을 내는가?
- RQ2영상 및 임상 데이터로부터 전반적인 생존을 예측할 때 딥 러닝 모델은 전통적 기계학습 방법에 비해 어떻게 비교되는가?
- RQ3데이터 이질성(예: 스캐너 변동성, 프로토콜 차이)은 모델의 일반화 능력과 성능에 어떤 영향을 미치는가?
- RQ4계층적 또는 연쇄형 딥 러닝 아키텍처는 복잡한 종양 하위 영역의 세그멘테이션 정확도를 향상시킬 수 있는가?
- RQ5신경종양학 분야에서 AI 모델의 임상적 도입을 제한하는 주요 요인는 무엇이며, 알고리즘 및 데이터 표준화를 통해 이를 어떻게 해결할 수 있는가?
주요 결과
- 특히 U-Net 기반 아키텍처를 사용한 딥 러닝 모델은 종양 세그멘테이션에서 최신 기술 수준의 성능을 기록하였으며, 강화 종양 영역의 평균 디스크 스코어가 0.85를 초과하였다.
- 전반적인 생존 예측 과제에서는 전통적 기계학습 모델이 딥 러닝을 능가하였으며, 이는 학습 샘플 수가 적고 데이터 제한에 대비한 강건성이 요구되기 때문이다.
- 계층적 세그멘테이션 접근법(먼저 정상 대 비정상 조직을 분류하고, 이후 하위 영역을 세그멘테이션)은 종래의 엔드 투 엔드 모델 대비 세그멘테이션 정확도를 향상시켰다.
- 스캐너 및 프로토콜의 변동성은 모델 일반화에 심각한 영향을 미쳤으며, 임상 AI 개발에서 표준화된 영상 프로토콜의 필요성을 강조한다.
- 연구 결과, 모델 성능은 기관 간에 상당한 차이를 보였으며, 이는 다기관 데이터와 강력한 검증 전략의 중요성을 입증한다.
- BraTS 알고리즘 레포지터리를 통한 최상의 성능 모델 공개는 재현 가능성을 보장하고 뇌영상 AI 분야의 방법론적 발전을 가속화하였다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.