[논문 리뷰] Slice-wise quality assessment of high b-value breast DWI via deep learning-based artifact detection
본 연구는 CNN을 사용하여 고 b-value 유방 DWI (b=1500 s/mm2)에서 슬라이스 단위로 과강조(Hyperintense) 및 저강조(Hypointense) 아티팩트를 탐지·분류하며, DenseNet121이 보유 데이터에서 강력한 AUROC/AUPRC를 달성하고 Grad-CAM을 통한 바운딩 박스 시각화를 제공합니다.
Diffusion-weighted imaging (DWI) can support lesion detection and characterization in breast magnetic resonance imaging (MRI), however especially high b-value diffusion-weighted acquisitions can be prone to intensity artifacts that can affect diagnostic image assessment. This study aims to detect both hyper- and hypointense artifacts on high b-value diffusion-weighted images (b=1500 s/mm2) using deep learning, employing either a binary classification (artifact presence) or a multiclass classification (artifact intensity) approach on a slice-wise dataset.This IRB-approved retrospective study used the single-center dataset comprising n=11806 slices from routine 3T breast MRI examinations performed between 2022 and mid-2023. Three convolutional neural network (CNN) architectures (DenseNet121, ResNet18, and SEResNet50) were trained for binary classification of hyper- and hypointense artifacts. The best performing model (DenseNet121) was applied to an independent holdout test set and was further trained separately for multiclass classification. Evaluation included area under receiver operating characteristic curve (AUROC), area under precision recall curve (AUPRC), precision, and recall, as well as analysis of predicted bounding box positions, derived from the network Grad-CAM heatmaps. DenseNet121 achieved AUROCs of 0.92 and 0.94 for hyper- and hypointense artifact detection, respectively, and weighted AUROCs of 0.85 and 0.88 for multiclass classification on single-slice high b-value diffusion-weighted images. A radiologist evaluated bounding box precision on a 1-5 Likert-like scale across 200 slices, achieving mean scores of 3.33+-1.04 for hyperintense artifacts and 2.62+-0.81 for hypointense artifacts. Hyper- and hypointense artifact detection in slice-wise breast DWI MRI dataset (b=1500 s/mm2) using CNNs particularly DenseNet121, seems promising and requires further validation.
연구 동기 및 목표
- 고 b-value 유방 DWI(b = 1500 s/mm2)에서 강도 아티팩트의 문제에 대응한다.
- 과강조(Hyperintense) 및 저강조(Hypointense) 아티팩트를 탐지하고 등급을 매기기 위해 슬라이스 단위의 CNN 기반 방법을 개발한다.
- 이진 아티팩트 존재 여부와 다중 클래스 아티팩트 강도 분류를 평가한다.
- 설명을 위한 Grad-CAM으로 도출된 바운딩 박스를 사용하여 아티팩트의 로컬라이제이션을 제공한다.
제안 방법
- IRB 승인 단일 센터 코호트에서 고 b-value DWI를 포함하는 3T 유방 MRI의 11,806 슬라이스로 슬라이스 단위 데이터셋을 구성한다.
- Hyper/Hypointense 아티팩트의 이진 분류를 위해 DenseNet121, ResNet18, SEResNet50 아키텍처를 비교하고 holdout 테스트에 사용할 최적 모델을 선택한다.
- 최적 모델을 다중 클래스 아티팩트 분류(5점 Likert 유사 척도 유지)를 위해 학습한다.
- 브레스 마스크를 적용해 학습을 유방 조직에 집중시키고 데이터 증강(회전, 뒤집기) 및 클래스 균형을 유지하는 Adam 최적화를 사용한다.
- Grad-CAM을 사용해 히트맵을 생성하고 임계값을 0.2로 설정한 후 바운딩 박스를 도출하여 아티팩트를 로컬라이즈한다.

실험 결과
연구 질문
- RQ1CNN이 단일 슬라이스의 고-b-value 유방 DWI에서 과강조(Hyperintense) 및 저강조(Hypointense) 아티팩트를 정확히 탐지할 수 있는가?
- RQ2어떤 CNN 아키텍처가 이 아티팩트를 가장 잘 탐지하며, 독립적인 holdout 세트에 일반화되는가?
- RQ3모델이 다중 클래스 아티팩트 강도 분류를 얼마나 잘 수행하는가?
- RQ4Grad-CAM 기반 로컬라이제이션이 아티팩트 영역에 대해 신뢰할 만한 바운딩 박스를 제공하는가?
주요 결과
- DenseNet121은 holdout 세트에서 과강조 아티팩트 탐지에 대해 AUROC 0.92 및 AUPRC 0.77을 달성했다.
- DenseNet121은 holdout 세트에서 저강조 아티팩트 탐지에 대해 AUROC 0.94 및 AUPRC 0.92를 달성했다.
- 다중 클래스 과강조 아티팩트에 대해 DenseNet121은 AUROC 0.85 및 AUPRC 0.75(holdout)를 달성했다.
- 다중 클래스 저강조 아티팩트에 대해 DenseNet121은 AUROC 0.88 및 AUPRC 0.69(holdout)를 달성했다.
- Grad-CAM 기반 바운딩 박스의 평균 로컬라이제이션 품질은 3.33±1.04(과강조)와 2.62±0.81(저강조)로 1–5 척도에서 나타났다.
- 리더-모델 일치는 과강조 및 저강조 아티팩트 평가에서 코헨의 κ 값이 달랐으며, 다중 클래스 예측에서 일부 라벨 변동성이 있음을 시사한다.

더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.