[논문 리뷰] SLSNet: Skin lesion segmentation using a lightweight generative adversarial network
SLSNet은 1-D 커널 분해, 위치 및 채널 주의(attention), 다중 스케일 집계를 사용하여 자원 소모를 줄이면서 경쟁력 있는 정확도를 달성하는 경량 GAN 기반 피부 병변 분할 모델을 제안하며, GTX1080Ti에서 2.35M 매개변수로 97.61% 정확도 및 >110 FPS를 달성합니다.
The determination of precise skin lesion boundaries in dermoscopic images using automated methods faces many challenges, most importantly, the presence of hair, inconspicuous lesion edges and low contrast in dermoscopic images, and variability in the color, texture and shapes of skin lesions. Existing deep learning-based skin lesion segmentation algorithms are expensive in terms of computational time and memory. Consequently, running such segmentation algorithms requires a powerful GPU and high bandwidth memory, which are not available in dermoscopy devices. Thus, this article aims to achieve precise skin lesion segmentation with minimum resources: a lightweight, efficient generative adversarial network (GAN) model called SLSNet, which combines 1-D kernel factorized networks, position and channel attention, and multiscale aggregation mechanisms with a GAN model. The 1-D kernel factorized network reduces the computational cost of 2D filtering. The position and channel attention modules enhance the discriminative ability between the lesion and non-lesion feature representations in spatial and channel dimensions, respectively. A multiscale block is also used to aggregate the coarse-to-fine features of input skin images and reduce the effect of the artifacts. SLSNet is evaluated on two publicly available datasets: ISBI 2017 and the ISIC 2018. Although SLSNet has only 2.35 million parameters, the experimental results demonstrate that it achieves segmentation results on a par with the state-of-the-art skin lesion segmentation methods with an accuracy of 97.61%, and Dice and Jaccard similarity coefficients of 90.63% and 81.98%, respectively. SLSNet can run at more than 110 frames per second (FPS) in a single GTX1080Ti GPU, which is faster than well-known deep learning-based image segmentation models, such as FCN. Therefore, SLSNet can be used for practical dermoscopic applications.
연구 동기 및 목표
- 제한된 계산 및 메모리 자원 하에서 정확한 피부 병변 분할의 필요성에 대응합니다.
- 경량화된 자동 분할 모델을 개발하여 최첨단 방법과 경쟁력을 갖추도록 합니다.
- 모발, 낮은 대비, 경계 모호성 문제를 처리하기 위해 다중 스케일 특성 집계 및 주의 메커니즘을 도입합니다.
- 실시간 피부진단 기기 및 임베디드 시스템에 대한 모델의 실용성을 시연합니다.
제안 방법
- 손실 분포를 통한 경향 추정 및 분류를 위한 GAN 기반 프레임워크(pix2pix)를 사용하여 분할을 수행합니다.
- 1/8, 1/4, 1/2 스케일 이미지를 처리하여 스케일 불변 특성을 구축하는 다중 스케일 인코더를 통합합니다.
- 채널 주의 모듈(CAM)과 위치 주의 모듈(PAM)을 적용하여 판별 가능한 특징 표현을 강화합니다.
- 연산 비용을 줄이면서 표현력을 유지하기 위해 1-D 커널 분해(FCM) 모듈을 도입하고 그 뒤에 CAM을 적용합니다.
- 바운더리 정확도와 IoU 지표를 개선하기 위해 이진 교차 엔트로피, L1, Jaccard 손실을 결합한 공동 손실을 사용합니다.
- ISBI 2017 및 ISIC 2018 데이터셋에 대한 데이터 보강으로 Adam 최적화 및 마스크 변환을 위한 PSP 기반 임계값을 사용하여 학습합니다.
실험 결과
연구 질문
- RQ1경량 GAN 기반 모델이 ISBI 2017 및 ISIC 2018 데이터셋에서 최첨단 방법과 경쟁력 있는 분할 정확도를 달성할 수 있는가?
- RQ2다중 스케일 집계가 위치 및 채널 주의와 결합될 때 모발, 낮은 대비 및 가변 병변 형태가 있는 경우 분할이 개선되는가?
- RQ3제안된 1-D 커널 분해 네트워크가 매개변수 수와 계산량을 충분히 줄여 표준 GPU에서 실시간으로 실행될 수 있는가?
- RQ4BCE, L1, Jaccard 손실의 조합이 경계 정밀도와 IoU 지표에 미치는 영향은 무엇인가?
주요 결과
- 평가 데이터셋에서 97.61% 정확도 달성.
- Dice 유사도 계수 90.63% 및 Jaccard 유사도 계수 81.98%를 얻음.
- 2.35백만 매개변수만 사용하여 GTX1080Ti에서 추론 속도가 빠름(~>110 FPS).
- 연산 자원을 크게 줄이면서도 최첨단 방법에 버금가는 분할 결과를 제공.
- 실제 피부진단 기기에 적합한 실시간 적용 가능성을 보여줌.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.