Skip to main content
QUICK REVIEW

[논문 리뷰] Polyp Segmentation Using Wavelet-Based Cross-Band Integration for Enhanced Boundary Representation

Haesung Oh, Jaesung Lee|arXiv (Cornell University)|2026. 03. 04.
Colorectal Cancer Screening and Detection인용 수 0
한 줄 요약

그레이스케일과 RGB 특징을 파동소정 정렬된 교차 대역 상호작용으로 융합하여 네 가지 벤치마크에서 경계 정확도를 향상시키는 이중 인코더 폴립 분할 모델.

ABSTRACT

Accurate polyp segmentation is essential for early colorectal cancer detection, yet achieving reliable boundary localization remains challenging due to low mucosal contrast, uneven illumination, and color similarity between polyps and surrounding tissue. Conventional methods relying solely on RGB information often struggle to delineate precise boundaries due to weak contrast and ambiguous structures between polyps and surrounding mucosa. To establish a quantitative foundation for this limitation, we analyzed polyp-background contrast in the wavelet domain, revealing that grayscale representations consistently preserve higher boundary contrast than RGB images across all frequency bands. This finding suggests that boundary cues are more distinctly represented in the grayscale domain than in the color domain. Motivated by this finding, we propose a segmentation model that integrates grayscale and RGB representations through complementary frequency-consistent interaction, enhancing boundary precision while preserving structural coherence. Extensive experiments on four benchmark datasets demonstrate that the proposed approach achieves superior boundary precision and robustness compared to conventional models.

연구 동기 및 목표

  • 저대비 및 조명 변화 하에서 폴립 분할의 견고한 경계 구분의 필요성을 제시한다.
  • 그레이스케일과 RGB 표현을 비교하여 웨이브렛 도메인의 경계 특성을 조사한다.
  • 주파수 일관성 있는 상호작용을 통해 그레이스케일과 RGB 특징을 융합하는 이중 인코더 아키텍처를 제안한다.
  • 그레이스케일 기반 경계 신호가 RGB 구조를 정제하여 분할 정확도를 향상시킬 수 있음을 보인다.

제안 방법

  • RGB 및 그레이스케일 특징을 추출하기 위해 두 개의 Res2Net 기반 인코더를 사용한다.
  • 해당 웨이브렛 서브밴드에서 주파수 정렬된 교차 모듈 상호작용을 위한 Band-Specific Window Cross-Attention (BS-WCA) 모듈을 도입한다.
  • 확대된 합성 다채널 특징을 확장된 컨볼루션으로 융합하는 Cascade Dilated Fusion (CDF) 블록을 도입한다.
  • Dice와 IoU 지표를 사용하여 네 가지 데이터셋(Kvasir-SEG, ClinicDB, ColonDB, ETIS)에서 모델을 학습 및 평가한다.
  • PyTorch 기반 구현 설정 및 재현성 상세 정보를 제공한다.
Figure 1: Structural contrast comparison between RGB and grayscale images in the wavelet domain, showing consistently higher contrast for grayscale across all detail sub-bands.
Figure 1: Structural contrast comparison between RGB and grayscale images in the wavelet domain, showing consistently higher contrast for grayscale across all detail sub-bands.

실험 결과

연구 질문

  • RQ1웨이브렛 정렬된 교차 대역 상호작용을 통해 그레이스케일 경계 신호를 RGB 특징과 통합하는 것이 폴립 분할에서 경계 정밀도를 향상시키는가?
  • RQ2제안된 BS-WCA 및 CDF 설계가 데이터셋 전반에 걸친 경계 정확도와 전체 분할 일관성에 어떤 영향을 미치는가?
  • RQ3경계 인식 개선이 데이터셋의 변동성(크기, 조명, 대비)에 대해 RGB 단독 베이스라인과 비교하여 견고한가?

주요 결과

방법Kvasir mDiceKvasir mIoUClinicDB mDiceClinicDB mIoUColonDB mDiceColonDB mIoUETIS mDiceETIS mIoU
Ours0.885 ± 0.0210.822 ± 0.0190.926 ± 0.0140.862 ± 0.0230.913 ± 0.0210.840 ± 0.0420.922 ± 0.0290.821 ± 0.029
  • 제안된 방법은 네 가지 데이터셋 모두에서 여러 베이스라인보다 더 높은 평균 Dice 및 IoU를 달성한다.
  • 그레이스케일 특징은 웨이브렛 도메인에서 더 강한 경계 대비를 제공하여 경계 정제를 돕는다.
  • 주파수 일관성 상호작용은 고주파 그레이스케일 세부 정보를 사용해 RGB에서 도출된 구조를 정제하게 한다.
  • 이 방법은 다양한 크기와 영상 조건을 가진 데이터셋에서 안정적인 성능 향상을 보인다.
  • 실험은 BS-WCA 및 CDF를 갖춘 이중 인코더 아키텍처를 사용하여 향상된 경계 표현을 보여준다.
Figure 2: Proposed wavelet-based cross-band integration framework that fuses frequency-consistent information from RGB and grayscale features for enhanced boundary representation.
Figure 2: Proposed wavelet-based cross-band integration framework that fuses frequency-consistent information from RGB and grayscale features for enhanced boundary representation.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.