QUICK REVIEW

[논문 리뷰] Extended 2D Volumetric Consensus Hippocampus Segmentation

Diedre Carmo, Bruna Silva|arXiv (Cornell University)|2019. 02. 12.

Advanced Image and Video Retrieval Techniques인용 수 3

한 줄 요약

이 논문은 잔여 연결, 배치 정규화, VGG 가중치 전이 및 이웃 패치 기반 데이터 증강을 갖춘 삼면 U-Net 기반의 완전 컨volution 신경망의 공감을 사용하여 3차원 해마 세그멘테이션 방법을 제안한다. 이 방법은 테스트 세트에서 96%의 Dice 스코어를 달성하였고, 공개된 HARP 데이터셋에서는 87.48%를 기록하였으며, 볼륨당 몇 초 내로 추론가능하며, 오픈소스 코드도 제공된다.

ABSTRACT

Hippocampus segmentation plays a key role in diagnosing various brain disorders such as Alzheimer's disease, epilepsy, multiple sclerosis, cancer, depression and others. Nowadays, segmentation is still mainly performed manually by specialists. Segmentation done by experts is considered to be a gold-standard when evaluating automated methods, buts it is a time consuming and arduos task, requiring specialized personnel. In recent years, efforts have been made to achieve reliable automated segmentation. For years the best performing authomatic methods were multi atlas based with around 80-85% Dice coefficient and very time consuming, but machine learning methods are recently rising with promising time and accuracy performance. A method for volumetric hippocampus segmentation is presented, based on the consensus of tri-planar U-Net inspired fully convolutional networks (FCNNs), with some modifications, including residual connections, VGG weight transfers, batch normalization and a patch extraction technique employing data from neighbor patches. A study on the impact of our modifications to the classical U-Net architecture was performed. Our method achieves cutting edge performance in our dataset, with around 96% volumetric Dice accuracy in our test data. In a public validation dataset, HARP, we achieve 87.48% DICE. GPU execution time is in the order of seconds per volume, and source code is publicly available. Also, masks are shown to be similar to other recent state-of-the-art hippocampus segmentation methods in a third dataset, without manual annotations.

연구 동기 및 목표

전문가의 수작업 레이블링에 의존도를 줄이기 위해 자동화되고 빠르며 정확한 해마 세그멘테이션 방법을 개발하기 위해.
삼면 추론과 U-Net 아키텍처의 개선을 융합하여 기존의 다중 애슬라스 및 딥러닝 방법을 향상시키기 위해.
낮은 추론 시간과 광범위한 적용 가능성을 유지하면서도 해마 세그멘테이션 분야에서 최고의 성능을 달성하기 위해.
수동 레이블링이 없는 공개 데이터셋에서의 검증을 통해 일반화 및 강건성을 입증하기 위해.
재현 가능성과 뇌 영상 분석 분야의 향후 연구를 지원하기 위해 소스 코드를 공개하기 위해.

제안 방법

이 방법은 축면, 사선면, 관절면에서 훈련된 3개의 2D U-Net 기반 완전 컨volution 신경망을 활용하여 체적 예측을 생성한다.
깊은 신경망에서 기울기 흐름과 특징 학습을 향상시키기 위해 U-Net 아키텍처에 잔여 연결을 통합한다.
에ncoder 브랜치에 사전 훈련된 VGG 가중치를 전이하여 수렴 속도를 가속화하고 특징 표현을 향상시킨다.
각 컨볼루션 레이어 이후에 배치 정규화를 적용하여 훈련의 안정성과 속도를 향상시킨다.
이웃 패치의 정보를 포함시키기 위해 패치 추출 기법을 사용하여 국소적 특징 이해를 향상시킨다.
최종 세그멘테이션 마스크는 세 개의 평면 네트워크에서의 예측를 평균하여 공감 체적을 형성함으로써 생성된다.

실험 결과

연구 질문

RQ1삼면 공감 2D U-Net 변종과 아키텍처 개선을 통해 기존의 표준 2D 또는 3D U-Net 방법보다 뛰어난 해마 세그멘테이션 정확도를 달성할 수 있는가?
RQ2잔여 연결, 배치 정규화, VGG 가중치 전이가 해마 세그멘테이션 성능에 각각 어떤 영향을 미치는가?
RQ3전체 볼륨의 맥락 없이 이웃 패치 데이터를 사용할 경우 일반화 및 강건성 향상에 어느 정도 기여하는가?
RQ4제안된 방법은 검증을 위해 수동 레이블링이 없는 HARP와 같은 공개 데이터셋에서 최고 수준의 성능을 달성할 수 있는가?
RQ5이 방법의 추론 속도는 얼마이며, 임상적 또는 연구적 구현에 실용적이라 할 수 있는가?

주요 결과

저자들이 소유한 비공개 테스트 데이터셋에서 이 방법은 약 96%의 체적 Dice 계수를 달성하여 높은 세그멘테이션 정확도를 보였다.
공개된 HARP 검증 데이터셋에서 이 방법은 87.48%의 Dice 스코어를 기록하여 외부 데이터에 대한 강력한 일반화 능력을 입증하였다.
GPU에서 실행 시 볼륨당 몇 초 내로 추론 시간이 소요되어 임상 및 고속 처리 응용에 적합하다.
세 번째의 비레이블링 데이터셋에서 다른 최근 최고 수준의 방법들과 비교했을 때, 생성된 세그멘테이션 마스크의 품질이 유사한 수준이었다.
제거 실험을 통해 아키텍처 수정, 특히 잔여 연결과 배치 정규화가 기본 U-Net에 비해 성능 향상에 크게 기여하는 것으로 확인되었다.
코드의 오픈소싱은 재현 가능성 향상과 향후 해마 세그멘테이션 분야의 벤치마킹 및 방법 개발을 촉진한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.