QUICK REVIEW

[논문 리뷰] HarDNet-MSEG: A Simple Encoder-Decoder Polyp Segmentation Neural Network that Achieves over 0.9 Mean Dice and 86 FPS

Chien‐Hsiang Huang, Hung-Yu Wu|arXiv (Cornell University)|2021. 01. 18.

Vehicle License Plate Recognition참고 문헌 33인용 수 187

한 줄 요약

HarDNet-MSEG는 HarDNet68 백본과 cascaded partial decoder를 사용하여 상태-최첨단 폴립 분할 정확도(mean Dice >0.9 on Kvasir-SEG)와 높은 속도(86 FPS)를 제공합니다.

ABSTRACT

We propose a new convolution neural network called HarDNet-MSEG for polyp segmentation. It achieves SOTA in both accuracy and inference speed on five popular datasets. For Kvasir-SEG, HarDNet-MSEG delivers 0.904 mean Dice running at 86.7 FPS on a GeForce RTX 2080 Ti GPU. It consists of a backbone and a decoder. The backbone is a low memory traffic CNN called HarDNet68, which has been successfully applied to various CV tasks including image classification, object detection, multi-object tracking and semantic segmentation, etc. The decoder part is inspired by the Cascaded Partial Decoder, known for fast and accurate salient object detection. We have evaluated HarDNet-MSEG using those five popular datasets. The code and all experiment details are available at Github. https://github.com/james128333/HarDNet-MSEG

연구 동기 및 목표

CRC 예방을 위한 대장내시경 영상에서 빠르고 정확한 폴립 분할을 동기 부여한다.
메모리 효율적인 백본으로 간단한 인코더-디코더 아키텍처를 제안한다.
다섯 가지 주요 폴립 데이터셋에서 SOTA 정확도와 속도를 확립하기 위해 평가한다.
Dice, IoU, FPS의 이득을 정량화하기 위해 U-Net, PraNet 및 기타 선도 모델과 비교한다.

제안 방법

메모리 트래픽을 줄이고 추론 속도를 높이기 위해 HarDNet68을 백본으로 채택한다.
빠른 현저 대상 탐지에서 영감을 받은 cascaded partial decoder를 갖춘 간단한 인코더-디코더 아키텍처를 사용한다.
receptive field block(RFB)을 스킵 연결에 통합하여 수용 필드를 확대한다.
업샘플링 후 요소별 곱셈으로 밀도 있게 특징을 융합한다.
데이터셋 간 견고한 비교를 보장하기 위해 이전 연구에서 영감을 얻은 두 가지 상이한 설정으로 학습한다.

실험 결과

연구 질문

RQ1HarDNet-MSEG가 표준 데이터셋에서 평균 Dice 및 IoU에서 현재 SOTA 폴립 분할 방법을 능가할 수 있는가?
RQ2HarDNet68 백본을 이용한 간단한 인코더-디코더가 높은 추론 속도를 유지하면서 경쟁력 있는 정확도를 달성할 수 있는가?
RQ3cascaded partial decoder와 RFB-enabled skip 연결이 경계 정확도와 작은 폴립 분할에 미치는 영향은 무엇인가?
RQ4Kvasir-SEG, CVC-ColonDB, EndoScene, ETIS-Larib Polyp DB, 및 CVC-Clinic DB에서 PraNet 및 U-Net 변형에 비해 HarDNet-MSEG의 성능은 어떠한가?

주요 결과

mIoU	mDice	F2-score	정밀도	재현율	전체 정확도	FPS
U-Net	0.471	0.597	0.598	0.672	0.617	0.894	11
ResUNet	0.572	0.690	0.699	0.745	0.725	0.917	15
ResUNet++	0.613	0.714	0.720	0.784	0.742	0.917	7
FCN8	0.737	0.831	0.825	0.882	0.835	0.952	25
HRNet	0.759	0.845	0.847	0.878	0.859	0.952	12
DoubleUNet	0.733	0.813	0.820	0.861	0.840	0.949	7.5
PSPNet	0.744	0.841	0.831	0.890	0.836	0.953	17
DeepLabv3+[ResNet50]	0.776	0.857	0.855	0.891	0.862	0.961	28
DeepLabv3+[ResNet101]	0.786	0.864	0.857	0.906	0.859	0.961	17
U-Net[ResNet34]	0.810	0.876	0.862	0.944	0.860	0.968	35
HarDNet-MSEG	0.848	0.904	0.915	0.907	0.923	0.969	86.7

HarDNet-MSEG는 다섯 데이터셋에서 SOTA mean Dice 및 mIoU를 달성한다.
Kvasir-SEG에서 0.904 mean Dice를 RTX 2080 Ti에서 86.7 FPS로 제공한다.
U-Net[ResNet34] 및 PraNet보다 평균 Dice 및 mIoU 지표에서 지속적으로 우수하다.
경쟁 모델보다 빠른 추론(FPS)을 보여주면서 정확도를 유지하거나 개선한다.
정성적 결과에서 경계 구분 및 전체 분할 품질이 강하다는 것을 보여준다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.