[논문 리뷰] HarDNet-MSEG: A Simple Encoder-Decoder Polyp Segmentation Neural Network that Achieves over 0.9 Mean Dice and 86 FPS
HarDNet-MSEG는 HarDNet68 백본과 cascaded partial decoder를 사용하여 상태-최첨단 폴립 분할 정확도(mean Dice >0.9 on Kvasir-SEG)와 높은 속도(86 FPS)를 제공합니다.
We propose a new convolution neural network called HarDNet-MSEG for polyp segmentation. It achieves SOTA in both accuracy and inference speed on five popular datasets. For Kvasir-SEG, HarDNet-MSEG delivers 0.904 mean Dice running at 86.7 FPS on a GeForce RTX 2080 Ti GPU. It consists of a backbone and a decoder. The backbone is a low memory traffic CNN called HarDNet68, which has been successfully applied to various CV tasks including image classification, object detection, multi-object tracking and semantic segmentation, etc. The decoder part is inspired by the Cascaded Partial Decoder, known for fast and accurate salient object detection. We have evaluated HarDNet-MSEG using those five popular datasets. The code and all experiment details are available at Github. https://github.com/james128333/HarDNet-MSEG
연구 동기 및 목표
- CRC 예방을 위한 대장내시경 영상에서 빠르고 정확한 폴립 분할을 동기 부여한다.
- 메모리 효율적인 백본으로 간단한 인코더-디코더 아키텍처를 제안한다.
- 다섯 가지 주요 폴립 데이터셋에서 SOTA 정확도와 속도를 확립하기 위해 평가한다.
- Dice, IoU, FPS의 이득을 정량화하기 위해 U-Net, PraNet 및 기타 선도 모델과 비교한다.
제안 방법
- 메모리 트래픽을 줄이고 추론 속도를 높이기 위해 HarDNet68을 백본으로 채택한다.
- 빠른 현저 대상 탐지에서 영감을 받은 cascaded partial decoder를 갖춘 간단한 인코더-디코더 아키텍처를 사용한다.
- receptive field block(RFB)을 스킵 연결에 통합하여 수용 필드를 확대한다.
- 업샘플링 후 요소별 곱셈으로 밀도 있게 특징을 융합한다.
- 데이터셋 간 견고한 비교를 보장하기 위해 이전 연구에서 영감을 얻은 두 가지 상이한 설정으로 학습한다.
실험 결과
연구 질문
- RQ1HarDNet-MSEG가 표준 데이터셋에서 평균 Dice 및 IoU에서 현재 SOTA 폴립 분할 방법을 능가할 수 있는가?
- RQ2HarDNet68 백본을 이용한 간단한 인코더-디코더가 높은 추론 속도를 유지하면서 경쟁력 있는 정확도를 달성할 수 있는가?
- RQ3cascaded partial decoder와 RFB-enabled skip 연결이 경계 정확도와 작은 폴립 분할에 미치는 영향은 무엇인가?
- RQ4Kvasir-SEG, CVC-ColonDB, EndoScene, ETIS-Larib Polyp DB, 및 CVC-Clinic DB에서 PraNet 및 U-Net 변형에 비해 HarDNet-MSEG의 성능은 어떠한가?
주요 결과
| mIoU | mDice | F2-score | 정밀도 | 재현율 | 전체 정확도 | FPS | |
|---|---|---|---|---|---|---|---|
| U-Net | 0.471 | 0.597 | 0.598 | 0.672 | 0.617 | 0.894 | 11 |
| ResUNet | 0.572 | 0.690 | 0.699 | 0.745 | 0.725 | 0.917 | 15 |
| ResUNet++ | 0.613 | 0.714 | 0.720 | 0.784 | 0.742 | 0.917 | 7 |
| FCN8 | 0.737 | 0.831 | 0.825 | 0.882 | 0.835 | 0.952 | 25 |
| HRNet | 0.759 | 0.845 | 0.847 | 0.878 | 0.859 | 0.952 | 12 |
| DoubleUNet | 0.733 | 0.813 | 0.820 | 0.861 | 0.840 | 0.949 | 7.5 |
| PSPNet | 0.744 | 0.841 | 0.831 | 0.890 | 0.836 | 0.953 | 17 |
| DeepLabv3+[ResNet50] | 0.776 | 0.857 | 0.855 | 0.891 | 0.862 | 0.961 | 28 |
| DeepLabv3+[ResNet101] | 0.786 | 0.864 | 0.857 | 0.906 | 0.859 | 0.961 | 17 |
| U-Net[ResNet34] | 0.810 | 0.876 | 0.862 | 0.944 | 0.860 | 0.968 | 35 |
| HarDNet-MSEG | 0.848 | 0.904 | 0.915 | 0.907 | 0.923 | 0.969 | 86.7 |
- HarDNet-MSEG는 다섯 데이터셋에서 SOTA mean Dice 및 mIoU를 달성한다.
- Kvasir-SEG에서 0.904 mean Dice를 RTX 2080 Ti에서 86.7 FPS로 제공한다.
- U-Net[ResNet34] 및 PraNet보다 평균 Dice 및 mIoU 지표에서 지속적으로 우수하다.
- 경쟁 모델보다 빠른 추론(FPS)을 보여주면서 정확도를 유지하거나 개선한다.
- 정성적 결과에서 경계 구분 및 전체 분할 품질이 강하다는 것을 보여준다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.