[논문 리뷰] SLSDeep: Skin Lesion Segmentation Based on Dilated Residual and Pyramid Pooling Networks
SLSDeep는 확장된 잔차 네트워크와 피라미드 풀링을 이용한 인코더-디코더 모델을 제안하여 피부 병변 분할을 수행하며, 결합된 NLL+EPE 손실로 최적화되어 ISBI 2016/2017 데이터셋에서 최첨단 성능을 달성합니다.
Skin lesion segmentation (SLS) in dermoscopic images is a crucial task for automated diagnosis of melanoma. In this paper, we present a robust deep learning SLS model, so-called SLSDeep, which is represented as an encoder-decoder network. The encoder network is constructed by dilated residual layers, in turn, a pyramid pooling network followed by three convolution layers is used for the decoder. Unlike the traditional methods employing a cross-entropy loss, we investigated a loss function by combining both Negative Log Likelihood (NLL) and End Point Error (EPE) to accurately segment the melanoma regions with sharp boundaries. The robustness of the proposed model was evaluated on two public databases: ISBI 2016 and 2017 for skin lesion analysis towards melanoma detection challenge. The proposed model outperforms the state-of-the-art methods in terms of segmentation accuracy. Moreover, it is capable to segment more than $100$ images of size 384x384 per second on a recent GPU.
연구 동기 및 목표
- 진단 보조를 위한 자동 흑색종 분할의 필요성을 제시하고, 크기, 형태 및 경계 흐림과 같은 피부경검 이미지의 가변성에 대응한다.
- Heavy pre/post-processing 없이 거칠은 특징에서 미세한 특징까지 포착하는 인코더-디코더 아키텍처를 개발한다.
- 경계 선명을 향상시키기 위해 음의 대수 우도(NLL)와 끝점 오차(EPE)를 결합한 손실 함수를 조사한다.
제안 방법
- 계층적 특징을 추출하기 위해 확장된 잔차 네트워크를 기반으로 하는 인코더.
- 재구성 전 다중 스케일 컨텍스트를 생성하기 위해 피라미드 풀링 계층을 사용하는 디코더.
- 타깃된 스킵 연결 전략을 통해 인코더 특징과 디코더 경로를 연결하는 연결(concatenation) 방법(인코더 끝에서 PPN으로의 단일 스킵 연결이 최적).
- NLL(바이너리 분할 확률)과 EPE(경계 보존)를 결합한 손실 함수: L_total = L_log + α L_epe with α = 0.5.
- 학습은 PyTorch, Adam 옵티마이저를 사용하고 인코더/디코더의 학습률은 0.001/0.01, 데이터 증강(스케일링 및 회전), 배치 크기 16, 100 에폭.
- ACC, DIC, JAC, SEN, SPE를 사용하여 ISBI 2016 및 2017 피부경검 데이터셋에서 평가합니다.
실험 결과
연구 질문
- RQ1확장된 잔차 인코더와 피라미드 풀링을 갖춘 디코더가 이전 방법들보다 SLS 정확도와 경계 선명도를 개선할 수 있는가?
- RQ2음의 대수 우도(NLL)와 끝점 오차(EPE)를 결합한 손실 함수가 이진 피부 병변 분할에 대해 표준 교차 엔트로피보다 성능이 우수한가?
- RQ3이 아키텍처에서 스킵 연결 전략이 분할 성능에 어떤 영향을 미치는가?
주요 결과
- SLSDeep는 ISBI 2016에서 ACC 0.984, DIC 0.955, JAC 0.913, SEN 0.945, SPE 0.992의 최상위 성능을 달성했다.
- ISBI 2017에서 SLSDeep는 ACC 0.936, DIC 0.878, JAC 0.782, SEN 0.816, SPE 0.983를 달성했다.
- 변형들에 비해 단일 인코더–PPN 스킵 연결을 가진 NLL+EPE를 사용하는 SLSDeep가 일관되게 DIC와 JAC를 향상시키며(예: ISBI 2016에서 DIC +3%, JAC +5% 등) 변형 대비 우수했다.
- SLSDeep-EPE와 SLSDeep+ASC는 혼합된 결과를 보였으며 EPE가 경계 보존을 일반적으로 향상시키지만 항상 전체 지표를 개선하는 것은 아니다.
- SLSDeep는 384x384 입력에서 현대 GPU에서 초당 100장 이상의 이미지 처리 속도를 보이며 대규모 분석에 실용성을 입증했다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.