[논문 리뷰] BiSe-Unet: A Lightweight Dual-path U-Net with Attention-refined Context for Real-time Medical Image Segmentation
BiSe-Unet은 주의 강화된 컨텍스트와 깊이별 분리형 디코더를 가진 경량 이중 경로 U-Net을 도입해 엣지 디바이스에서 실시간 의료 영상 분할을 달성하며 Kvasir-SEG에서 시연된다.
During image-guided procedures, real-time image segmentation is often required. This demands lightweight AI models that can operate on resource-constrained devices. One important use case is endoscopy-guided colonoscopy, where polyps must be detected in real time. The Kvasir-Seg dataset, a publicly available benchmark for this task, contains 1,000 high-resolution endoscopic images of polyps with corresponding pixel-level segmentation masks. Achieving real-time inference speed for clinical deployment in constrained environments requires highly efficient and lightweight network architectures. However, many existing models remain too computationally intensive for embedded deployment. Lightweight architectures, although faster, often suffer from reduced spatial precision and weaker contextual understanding, leading to degraded boundary quality and reduced diagnostic reliability. To address these challenges, we introduce BiSe-UNet, a lightweight dual-path U-Net that integrates an attention-refined context path with a shallow spatial path for detailed feature preservation, followed by a depthwise separable decoder for efficient reconstruction. Evaluated on the Kvasir-Seg dataset, BiSe-UNet achieves competitive Dice and IoU scores while sustaining real-time throughput exceeding 30 FPS on Raspberry Pi 5, demonstrating its effectiveness for accurate, lightweight, and deployable medical image segmentation on edge hardware.
연구 동기 및 목표
- 제약된 자원 하드웨어에서의 실시간 의료 영상 분할의 필요성을 제시한다.
- 경계 세부 정보와 컨텍스트를 보존하는 경량 이중 경로 아키텍처를 개발한다.
- 무거운 연산 없이 경계 정확도를 향상시키도록 공간적 특징과 맥락적 특징을 효율적으로 융합한다.
- 경계에서의 경쟁력 있는 정확도를 유지하면서 엣지 디바이스에서 실시간 성능(30+ FPS)을 입증한다.
제안 방법
- Attention Refinement Context Path와 얕은 Spatial Path를 갖는 이중 경로 아키텍처를 제안한다.
- MAC와 매개변수를 줄이기 위해 DSConv 기반 디코더를 사용한다.
- 재구성을 위해 CP와 SP 특징을 1x1 투영 및 DSConv 블록으로 융합한다.
- 전역 컨텍스트를 다듬기 위해 다수의 CP 스케일에서 주의 강화 모듈을 도입한다.
- Dice 및 IoU 지표로 Kvasir-SEG에서 평가하고 CUDA GPU와 Raspberry Pi 5에서 FPS를 측정한다.
실험 결과
연구 질문
- RQ1BiSe-UNet가 임베디드 하드웨어에서 정확도를 희생하지 않고 실시간(30+ FPS) 분할을 달성할 수 있는가?
- RQ2이중 경로 컨텍스트-공간 융합이 단일 경로 경량 모델에 비해 경계 품질과 전반적인 Dice/IoU를 향상시키는가?
주요 결과
| 모델 | 매개변수 (M) | MACs (G) | Dice | IoU | CUDA (GTX 1080 Ti) FPS | CUDA 메모리 (MB) | Raspberry Pi 5 FPS | Raspberry Pi 메모리 (MB) |
|---|---|---|---|---|---|---|---|---|
| U-Net (baseline) | 7.813 | 11.67 | 0.7900 | 0.7000 | 217.91 | 420 | 2.65 | 300 |
| BiSeNet | 2.533 | 1.07 | 0.7501 | 0.6595 | 397.37 | 210 | 30.06 | 160 |
| HarDNet | 3.809 | 4.46 | 0.7775 | 0.6959 | 232.62 | 360 | 7.17 | 200 |
| BiSe-UNet (Ours) | 2.509 | 0.97 | 0.7809 | 0.6961 | 358.34 | 240 | 30.48 | 170 |
- BiSe-UNet은 2.509M 매개변수 및 0.97G MAC로 Dice 0.7809 및 IoU 0.6961를 달성한다.
- CUDA (GTX 1080 Ti)에서 240 MB RAM으로 358 FPS에 도달하고, Raspberry Pi 5에서 170 MB RAM으로 30.48 FPS를 달성한다.
- BiSe-UNet은 U-Net에 비해 MAC를 0.97G 대 11.67G로 90% 이상 감소시키는 한편, Dice(0.7900에 비해) 및 IoU(0.7000에 비해)에서 경쟁력을 유지한다.
- BiSeNet과 비교하여 BiSe-UNet는 비슷한 매개변수 수에서 Dice를 4.1pp, IoU를 5.5포인트 향상시킨다.
- Ablation은 이중 경로 융합과 /8-스케일 융합이 정확도와 속도 간의 최적 트레이드오프를 제공함을 보여준다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.