Skip to main content
QUICK REVIEW

[論文レビュー] Synergizing Deep Learning and Biological Heuristics for Extreme Long-Tail White Blood Cell Classification

Duc Toan Nguyen, Hoang-Long Nguyen|arXiv (Cornell University)|Mar 17, 2026
Digital Imaging for Blood Diseases被引用数 0
ひとこと要約

ハイブリッドな三段階フレームワークは、GANベースの復元、MedSigLIPコントラスト的埋め込みを備えたSwin Transformer Ensemble、そして生物学的にインスパイアされた精製を組み合わせ、極端な長尾WBC分類に挑戦。WBCBench 2026のプライベートリーダーボードでMacro-F1のトップを達成。

ABSTRACT

Automated white blood cell (WBC) classification is essential for leukemia screening yet remains challenging under extreme class imbalance and domain shift. These limitations often cause deep models to overfit dominant classes while failing to generalize to rare pathological subtypes. To address this issue, we propose a three-stage hybrid framework. First, a self-supervised Pix2Pix restoration module mitigates synthetic noise and restores high frequency cytoplasmic details. Second, we integrate a Swin Transformer ensemble with MedSigLIP contrastive embeddings to enhance rare-class semantic representation. Finally, we introduce a biologically inspired refinement strategy combining geometric spikiness analysis and Mahalanobis-based morphological constraints to explicitly rescue suppressed minority predictions. Our hybrid framework achieves a Macro-F1 score of 0.77139 on the private leaderboard, demonstrating strong robustness under extreme long-tail distributions. The code is available at https://github.com/trongduc-nguyen/WBCBench2026.

研究の動機と目的

  • 自動WBC分類における極端なクラス不均衡とドメインシフトに対処する。
  • データ駆動の長尾法を超えた希少クラスの一般化を改善する。
  • 生成的復元、堅牢な表現学習、生物学的形態学的制約を統合する。
  • WBCBench 2026 チャレンジでの有効性を実証する。
  • 再現性のためのオープンソースパイプラインを提供する。

提案手法

  • ステージ1:Pix2Pixフレームワークを用いた合成対データで訓練されたGANベースの復元により、アーティファクトを除去し高周波形態的ディテールを回復する。
  • ステージ2:Swin Transformer バックボーンによる階層的特徴と、セマンティック埋め込みのための MedSigLIP コントラストヘッドを備えたデュアルブランチ特徴学習。
  • ステージ3:幾何学的スパイク性と Mahalanobis ベースの形態学的制約を用いた適応的生物学的精製で、分布外の希少クラス予測を回復する。
Fig. 1 : Class distribution of the WBCBench 2026 dataset.
Fig. 1 : Class distribution of the WBCBench 2026 dataset.

実験結果

リサーチクエスチョン

  • RQ1復元と堅牢な表現学習は、極端な長尾分布下で希少クラスWBC分類を改善できるか。
  • RQ2トランスフォーマーに基づく表現とコントラスト埋め込みを組み合わせると、希少クラスの識別性は向上するか。
  • RQ3生物学的に着想を得た形態学的制約は、データ駆動モデルが見逃す分布外の希少クラス予測を回復するか。
  • RQ4提案された各フェーズが、強いクラス不均衡とドメインシフト下での Macro-F1 に与える影響はどの程度か。

主な発見

MethodMacro-F1 (LB)
Baseline (Single Fold Swin-T)0.63857
Swin-T (5-Fold + TTA) + Over-sampling0.65318
Swin-T (5-Fold + TTA) + LDAM Loss0.66520
Swin-T (5-Fold + TTA) + Decoupling Classifier0.66251
Swin-T (5-Fold + TTA)0.66585
+ MedSigLIP Semantic Verification (Phase 2)0.71528
+ Biological Filtering (Phase 3)0.77139
  • プライベートWBCBench 2026リーダーボードで、フルフレームワークを用いたMacro-F1 0.77139 を達成。
  • ベースラインの Swin-T は 5-fold クロスバリデーションで Macro-F1 0.7355、Macro-Specificity 0.9932 を達成し、精製なしでは希少クラスのリコールが低いことを示す。
  • 純粋な長尾手法は、意味的ガイダンスなしではリーダーボード上で Macro-F1 が約0.66に停滞。
  • MedSigLIP の意味的検証により、形態学的精製前に性能が 0.71528 へ向上。
  • 生物学的フィルタリングにより Macro-F1 がさらに 0.77139 へ向上し、生物学的 priors の組み込みの価値を示す。
Fig. 2 : Overview of the proposed three-stage hybrid framework. The pipeline seamlessly integrates generative domain restoration (Stage 1), dual-branch semantic feature extraction (Stage 2), and biological filtering (Stage 3) to achieve robust classification under extreme long-tail distributions.
Fig. 2 : Overview of the proposed three-stage hybrid framework. The pipeline seamlessly integrates generative domain restoration (Stage 1), dual-branch semantic feature extraction (Stage 2), and biological filtering (Stage 3) to achieve robust classification under extreme long-tail distributions.

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。