QUICK REVIEW

[논문 리뷰] Adversarial training and dilated convolutions for brain MRI segmentation

Pim Moeskops, Mitko Veta|arXiv (Cornell University)|2017. 07. 11.

Adversarial Robustness in Machine Learning참고 문헌 16인용 수 23

한 줄 요약

이 논문은 뇌 MRI 분할을 향상시키기 위해 판별자 네트워크를 활용한 적대적 훈련을 제안한다. 이는 더 현실적이고 구조적으로 일관된 분할을 생성함으로써 이루어진다. 표준 교차 엔트로피 손실과 적대적 손실을 결합함으로써, 특히 더 깊은 완전 컨volution 네트워크에서 분할 노이즈를 감소시키고 DICE 스코어를 향상시킨다. 성인 환자에서는 최대 0.92의 DICE 계수를 달 đạt하였고, 노인 환자에서는 0.85를 기록하였다.

ABSTRACT

Convolutional neural networks (CNNs) have been applied to various automatic image segmentation tasks in medical image analysis, including brain MRI segmentation. Generative adversarial networks have recently gained popularity because of their power in generating images that are difficult to distinguish from real images. In this study we use an adversarial training approach to improve CNN-based brain MRI segmentation. To this end, we include an additional loss function that motivates the network to generate segmentations that are difficult to distinguish from manual segmentations. During training, this loss function is optimised together with the conventional average per-voxel cross entropy loss. The results show improved segmentation performance using this adversarial training procedure for segmentation of two different sets of images and using two different network architectures, both visually and in terms of Dice coefficients.

연구 동기 및 목표

딥 러닝 기반 뇌 MRI 분할의 현실성과 구조적 일관성을 향상시키기 위해.
전체적인 구조적 일관성의 결여로 인해 표준 병렬 픽셀 손실 함수가 실패하는 문제를 해결하기 위해.
적대적 훈련이 다양한 네트워크 아키텍처와 데이터셋에서 분할 성능을 향상시키는지 평가하기 위해.
적대적 손실이 산산이 찢어진, 노이즈가 많은 분할을 줄이는 데 어떤 영향을 미치는지 조사하기 위해.
이 방법이 성인과 노인 뇌 MRI 데이터셋 모두에서 일반화 가능한지 입증하기 위해.

제안 방법

완전 컨volution 네트워크와 확장 컨볼루션 네트워크를 표준 교차 엔트로피 손실과 적대적 손실의 조합으로 훈련한다.
판별자 네트워크는 수동 분할과 분할 네트워크에서 생성된 분할을 구분하도록 훈련된다.
분할 네트워크의 출력과 이미지 패치(25×25)를 결합하여 판별자에 입력함으로써, 이미지-분할 출력의 현실성을 평가한다.
적대적 훈련은 번갈아가며 최적화를 수행한다: 분할 네트워크는 학습률 10⁻³, 판별자는 10⁻⁵로 업데이트된다.
훈련에는 RMSprop를 사용하고, 51×51(완전 연결) 또는 87×87(확장) 패치의 무작위 자르기 방식의 데이터 증강 기법을 적용한다.
이 방법은 두 데이터셋에 적용된다: MICCAI 2012(성인, 6개 클래스)와 MRBrainS13(노인, 7개 클래스)이며, 클래스 균형 샘플링을 사용한다.

실험 결과

연구 질문

RQ1적대적 훈련은 뇌 MRI 분할 출력의 현실성과 구조적 일관성을 향상시킬 수 있는가?
RQ2판별자 손실이 포함될 경우 표준 교차 엔트로피 훈련 대비 측정 가능한 DICE 계수 향상이 이루어지는가?
RQ3적대적 훈련은 분할 노이즈와 구성 요소 수(예: 분리된 영역의 수)에 어떤 영향을 미치는가?
RQ4완전 컨볼루션 네트워크와 확장 네트워크 아키텍처 간 성능 향상의 정도는 어떻게 다를까?
RQ5이 방법은 다양한 연령대와 MRI 촬영 프로토콜에서 효과적인가?

주요 결과

적대적 훈련은 분할 노이즈를 크게 감소시켰으며, 완전 컨볼루션 네트워크를 사용한 성인 환자에서 3D 구성 요소 수의 평균을 1,745±400에서 626±247로 감소시켰다.
노인 환자에서 완전 컨볼루션 네트워크를 사용할 경우 구성 요소 수는 926±134에서 692±88로 감소하여 구조적 일관성이 향상됨을 시사한다.
성인 환자에서 DICE 계수는 완전 컨볼루션 네트워크를 사용할 경우 0.67±0.04에서 0.91±0.03으로 향상되었고, 확장 네트워크를 사용할 경우 0.92±0.03으로 상승하였다.
노인 환자에서 DICE 스코어는 완전 컨볼루션 네트워크를 사용할 경우 0.80±0.02에서 0.83±0.02로 향상되었고, 확장 네트워크를 사용할 경우 0.85±0.01로 상승하였다. 모든 향상은 통계적으로 유의미했다(p<0.05).
성능 향상은 더 깊은 완전 컨볼루션 네트워크에서 가장 두드러졌으며, 이는 더 복잡한 아키텍처에서 더 큰 이점을 얻을 수 있음을 시사한다.
유일하게 유의미하지 않은 향상은 확장 네트워크를 사용한 노인 환자에서 lvCSF에 관찰되었지만, 다른 모든 조직 유형에서는 전반적으로 강력한 향상이 유지되었다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.