[논문 리뷰] Synergizing Deep Learning and Biological Heuristics for Extreme Long-Tail White Blood Cell Classification
하이브리드 3단계 프레임워크는 GAN 기반 복원, MedSigLIP 대비 구성을 가진 Swin Transformer 앙상블과 생물학적으로 영감을 받은 정제를 결합하여 극단적 긴 꼬리 WBC 분류 문제를 해결하고 WBCBench 2026 비공개 리더보드에서 Macro-F1을 최고로 달성합니다.
Automated white blood cell (WBC) classification is essential for leukemia screening yet remains challenging under extreme class imbalance and domain shift. These limitations often cause deep models to overfit dominant classes while failing to generalize to rare pathological subtypes. To address this issue, we propose a three-stage hybrid framework. First, a self-supervised Pix2Pix restoration module mitigates synthetic noise and restores high frequency cytoplasmic details. Second, we integrate a Swin Transformer ensemble with MedSigLIP contrastive embeddings to enhance rare-class semantic representation. Finally, we introduce a biologically inspired refinement strategy combining geometric spikiness analysis and Mahalanobis-based morphological constraints to explicitly rescue suppressed minority predictions. Our hybrid framework achieves a Macro-F1 score of 0.77139 on the private leaderboard, demonstrating strong robustness under extreme long-tail distributions. The code is available at https://github.com/trongduc-nguyen/WBCBench2026.
연구 동기 및 목표
- 자동화된 WBC 분류에서 극심한 클래스 불균형 및 도메인 시프트를 해결한다.
- 데이터 기반의 롱테일 방법을 넘는 희소 클래스 일반화 향상.
- 생성적 복원, 강건한 표현 학습 및 생물학적 형태 제약을 통합한다.
- WBCBench 2026 챌런지에서 효능을 입증한다.
- 재현성을 위한 오픈 소스 파이프라인을 제공한다.
제안 방법
- 단계 1: 합성으로 쌍을 구성한 데이터를 기반으로 Pix2Pix 프레임워크로 아티팩트를 제거하고 고주파 형태학적 디테일을 복원하는 GAN 기반 복원.
- 단계 2: 트랜스포머 백본으로 계층적 특징을 위한 이중 분기 특성 학습과 의미 임베딩을 위한 MedSigLIP 대비 헤드.
- 단계 3: 기하학적 스파이키니스와 Mahalanobis 기반 형태 제약을 사용한 적응적 생물학적 정제로 OOD 희소 클래스 예측을 회복한다.

실험 결과
연구 질문
- RQ1극단적 롱테일 분포에서 복원 및 강건한 표현 학습이 희소 클래스 WBC 분류를 향상시킬 수 있는가?
- RQ2트랜스포머 기반 표현과 대조 임베딩의 결합이 희소 클래스 구분력을 향상시키는가?
- RQ3생물학적 영감의 형태 제약이 데이터 기반 모델이 놓치는 OOD 희소 클래스 예측을 회복하는가?
- RQ4제안된 단계가 심한 클래스 불균형 및 도메인 시프트에서 Macro-F1에 미치는 영향은 무엇인가?
주요 결과
| 방법 | Macro-F1 (LB) |
|---|---|
| Baseline (Single Fold Swin-T) | 0.63857 |
| Swin-T (5-Fold + TTA) + Over-sampling | 0.65318 |
| Swin-T (5-Fold + TTA) + LDAM Loss | 0.66520 |
| Swin-T (5-Fold + TTA) + Decoupling Classifier | 0.66251 |
| Swin-T (5-Fold + TTA) | 0.66585 |
| + MedSigLIP Semantic Verification (Phase 2) | 0.71528 |
| + Biological Filtering (Phase 3) | 0.77139 |
- 전체 프레임워크로 비공개 WBCBench 2026 리더보드에서 Macro-F1 0.77139를 달성했다.
- Baseline Swin-T는 5-폴드 교차검증에서 Macro-F1 0.7355 및 Macro-Specificity 0.9932를 달성하여 정제 없이 희소 클래스에 대한 Recall이 낮음을 시사한다.
- Pure long-tail 방법은 의미론적 가이드가 없으면 리더보드에서 Macro-F1이 대략 0.66으로 정체된다.
- MedSigLIP 의미 검증은 형태학적 정제를 받기 전 성능을 0.71528까지 끌어올린다.
- 생물학적 필터링은 Macro-F1을 0.77139로 추가 상승시켜 생물학적 사전지식의 가치를 입증한다.

더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.