Skip to main content
QUICK REVIEW

[论文解读] LeukoNet: DCT-based CNN architecture for the classification of normal versus Leukemic blasts in B-ALL Cancer

Simmi Mourya, Sonaal Kant|arXiv (Cornell University)|Oct 18, 2018
Digital Imaging for Blood Diseases被引用 26
一句话总结

本文提出 LeukoNet,一种基于 DCT 的新型 CNN 架构,通过融合频域(DCT)与空域(光学密度)特征,对 B-ALL 中的正常造血母细胞与白血病母细胞进行分类。通过双线性池化与模型集成,将 DCT 处理的特征与标准 OD 空间特征相结合,该方法在未见患者数据上实现了 98.5% 的准确率,显著提升了模型的鲁棒性与泛化能力。

ABSTRACT

Acute lymphoblastic leukemia (ALL) constitutes approximately 25% of the pediatric cancers. In general, the task of identifying immature leukemic blasts from normal cells under the microscope is challenging because morphologically the images of the two cells appear similar. In this paper, we propose a deep learning framework for classifying immature leukemic blasts and normal cells. The proposed model combines the Discrete Cosine Transform (DCT) domain features extracted via CNN with the Optical Density (OD) space features to build a robust classifier. Elaborate experiments have been conducted to validate the proposed LeukoNet classifier.

研究动机与目标

  • 解决在 B-ALL 显微图像中区分形态学相似的正常造血母细胞与白血病母细胞的挑战。
  • 通过在患者主体级别分离的数据划分进行训练,提升在未见患者受试者上的分类鲁棒性。
  • 通过在深度学习框架中整合离散余弦变换(DCT)特征与光学密度(OD)空间特征,增强特征表示能力。
  • 开发一种混合模型架构,结合多个训练好的网络,以提升泛化能力并降低预测方差。
  • 在正常细胞与癌细胞类别上均实现高且均衡的分类准确率,防止临床环境中发生致命误诊。

提出的方法

  • 对原始 BMP 图像应用染色去卷积,提取光学密度(OD)空间表示,分离苏木精与伊红组分。
  • 在染色去卷积步骤后引入离散余弦变换(DCT)层,从 OD 图像中提取频域特征。
  • 训练两个独立的 CNN 分支:一个在原始 OD 空间图像上训练,另一个在 DCT 变换后的图像上训练,以捕捉互补的空域与频域特征。
  • 将两个分支的特征图进行拼接(六通道输入),并应用双线性池化而非平均池化,以增强细粒度特征学习。
  • 通过在最后全连接层集成最佳性能的独立模型——具体为结合 DCT 分支与 OD 分支模型的特征——实现混合模型架构。
  • 采用患者主体级别的数据划分进行交叉验证,确保任一患者的数据不会同时出现在训练集与测试集中,从而提升对前瞻性患者的泛化能力。

实验结果

研究问题

  • RQ1通过 DCT 提取的频域特征是否能提升对 B-ALL 中形态学相似的正常造血母细胞与白血病母细胞的分类性能?
  • RQ2在混合 CNN 架构中结合基于 DCT 的特征与空域特征,是否能提升在未见患者受试者上的泛化能力?
  • RQ3对两种不同 CNN 架构(一个含 DCT,一个不含)进行模型集成,对分类准确率与稳定性有何影响?
  • RQ4在有限的医学影像数据集上,数据增强(剪切、模糊)对模型性能与训练稳定性有何影响?
  • RQ5结合多个训练好网络的特征的混合模型,是否能在测试数据上实现比单一模型更高的准确率与鲁棒性?

主要发现

  • 混合模型 'Stage-3C w/ aug' 达到了最高的测试准确率 98.5%,证明了结合 DCT 与 OD 空间特征的有效性。
  • 引入 DCT 特征后,准确率显著提升,且训练波动减小,相较于无 DCT 的模型表现更优。
  • 尽管 PReLU 与 P-TELU 在深度学习中具有理论优势,但本任务中 ReLU 激活函数表现更优。
  • 表现最佳的两个模型('Stage-1 w/ aug' 与 'Stage-2C w/o aug')表现出互斥的失败模式,验证了模型集成的优势。
  • 未使用数据增强训练的混合模型与使用增强的模型性能相当,但 'Stage-3C' 配置在使用数据增强时取得了最佳结果。
  • 由于在交叉验证中采用患者主体级别的数据划分,最终模型对未见患者数据表现出强大的泛化能力,确保了各折之间无数据泄露。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。