[논문 리뷰] Patched Diffusion Models for Unsupervised Anomaly Detection in Brain MRI
이 논문은 비지도 이상 탐지를 위한 패치 확산 모델(pDDPM)을 뇌 MRI에 제시하고 BraTS21 및 MSLUB 데이터셋에서 기준보다 개선을 보인다.
The use of supervised deep learning techniques to detect pathologies in brain MRI scans can be challenging due to the diversity of brain anatomy and the need for annotated data sets. An alternative approach is to use unsupervised anomaly detection, which only requires sample-level labels of healthy brains to create a reference representation. This reference representation can then be compared to unhealthy brain anatomy in a pixel-wise manner to identify abnormalities. To accomplish this, generative models are needed to create anatomically consistent MRI scans of healthy brains. While recent diffusion models have shown promise in this task, accurately generating the complex structure of the human brain remains a challenge. In this paper, we propose a method that reformulates the generation task of diffusion models as a patch-based estimation of healthy brain anatomy, using spatial context to guide and improve reconstruction. We evaluate our approach on data of tumors and multiple sclerosis lesions and demonstrate a relative improvement of 25.1% compared to existing baselines.
연구 동기 및 목표
- 픽셀 수준 주석 없이 뇌 MRI에서 병리를 탐지하는 도전을 비지도 이상 탐지를 사용해 해결한다.
- 확산 기반 생성 모델을 패치 기반의 건강한 뇌 해부학의 공간 맥락에 의해 안내된 추정으로 재정의한다.
- 슬라이딩 윈도우와 패치 스티칭으로 주변 맥락을 포함한 패치 수준 디노이징을 통해 전체 뇌 해부를 재구성한다.
- BraTS21 및 MSLUB 데이터셋에서 pDDPM을 평가하고 기존 UAD 기준선과 비교해 성능 향상을 입증한다.
제안 방법
- 입력 영상의 패치를 전방 확산시키고 나머지 이미지는 그대로 두는 방법을 적용한다.
- 역 확산 단계를 학습하기 위해 U-Net을 사용하고 주변 조직의 맥락 속에서 원래의 패치를 추정한다.
- 패치 영역에서 Lp 기반 손실(L_p) 또는 전체 재구성 손실(L_rec)로 학습하고 효율성을 위해 고정된 테스트 타임 스텝 t_test를 사용한다.
- 평가 중에는 이미지 전체에 걸쳐 슬라이딩 윈도우 패치 확산-디노이징을 수행하고 모든 패치를 재구성한 뒤 합치고 겹치는 영역을 평균낸다.
실험 결과
연구 질문
- RQ1주변 공간 맥 context를 활용한 패치 기반 확산 모델이 비패치 DDPM 및 다른 기준선에 비해 뇌 MRI에서 비지도 이상 탐지 성능을 향상시킬 수 있는가?
- RQ2패치 크기와 테스트 시간 확산 매개변수(t_test 등)가 BraTS21 및 MSLUB 데이터셋의 UAD 성능에 어떤 영향을 미치는가?
주요 결과
| 모델 | 다이스 [%] | AUPRC [%] | 다이스 [%] | AUPRC [%] | l1 (1e-3) |
|---|---|---|---|---|---|
| 임계값 | 19.69 | 20.27 | 6.21 | 4.23 | 145.12 |
| AE | 32.87 b1 1.25 | 31.07 b1 1.75 | 7.10 b1 0.68 | 5.58 b1 0.26 | 30.55 b1 0.27 |
| VAE | 31.11 b1 1.50 | 28.80 b1 1.92 | 6.89 b1 0.09 | 5.00 b1 0.40 | 31.28 b1 0.71 |
| SVAE | 33.32 b1 0.14 | 33.14 b1 0.20 | 5.76 b1 0.44 | 5.04 b1 0.13 | 28.08 b1 0.02 |
| DAE | 37.05 b1 1.42 | 44.99 b1 1.72 | 3.56 b1 0.91 | 5.35 b1 0.45 | 10.12 b1 0.26 |
| f-AnoGAN | 24.16 b1 2.94 | 22.05 b1 3.05 | 4.18 b1 1.18 | 4.01 b1 0.90 | 45.30 b1 2.98 |
| DDPM | 40.67 b1 1.21 | 49.78 b1 1.02 | 6.42 b1 1.60 | 7.44 b1 0.52 | 13.46 b1 0.65 |
| pDDPM + random sampling + Lrec | 44.47 b1 2.34 | 48.84 b1 2.71 | 9.41 0.96 | 9.13 1.13 | 14.08 b1 0.77 |
| pDDPM + fixed sampling + Lrec | 47.81 b1 1.15 | 52.38 1.17 | 10.47 1.27 | 10.58 0.85 | 12.12 1 0.76 |
| pDDPM + fixed sampling + Lp | 49.00 b1 0.84 | 54.07 1.06 | 10.35 b1 0.69 | 9.79 b1 0.40 | 11.05 b1 0.15 |
- 고정 샘플링과 Lp 손실을 갖춘 pDDPM이 평가된 모든 방법 중 BraTS21 및 MSLUB에서 최상의 Dice 및 AUPRC를 달성했다( BraTS21 Dice 49.00%, AUPRC 54.07%; MSLUB Dice 10.35? 표 참조).
- pDDPM 방법은 두 데이터 세트 모두에서 DICE 및 AUPRC에서 모든 기준선을 능가했고 BraTS21에서 통계적 유의성(p<0.05)을 보였다.
- 패치 크기 60x60 픽셀가 최상의 성능을 보였고 t_test에 해당하는 테스트 타임 노이즈 레벨이 약 400에서 성능 피크를 보였다.
- 건강 IXI 데이터에 대한 재구성 품질은 DAE가 가장 낮은 l1 오차를 보였고, pDDPM은 DDPM보다 더 작은 오차를 보여 건강한 뇌 재구성을 더 잘 수행하면서 이상 탐지 가능성을 유지한다는 것을 시사한다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.