Skip to main content
QUICK REVIEW

[论文解读] Breast Cancer Image Classification Method Based on Deep Transfer Learning

Weimin Wang, Yufeng Li|arXiv (Cornell University)|Apr 14, 2024
AI in cancer detection被引用 9
一句话总结

本文提出了一种基于 DenseNet 的乳腺癌图像分类器,通过 squeeze-and-excitation 注意力模块和多阶段迁移学习实现,在 BreakHis 数据上比基线 DenseNet 变体具有更高的准确性。

ABSTRACT

To address the issues of limited samples, time-consuming feature design, and low accuracy in detection and classification of breast cancer pathological images, a breast cancer image classification model algorithm combining deep learning and transfer learning is proposed. This algorithm is based on the DenseNet structure of deep neural networks, and constructs a network model by introducing attention mechanisms, and trains the enhanced dataset using multi-level transfer learning. Experimental results demonstrate that the algorithm achieves an efficiency of over 84.0\% in the test set, with a significantly improved classification accuracy compared to previous models, making it applicable to medical breast cancer detection tasks.

研究动机与目标

  • 解决传统方法中标注有限的乳腺癌病理数据和大量特征工程的问题。
  • 开发一种利用迁移学习提升分类准确性的深度学习模型。
  • 整合注意力机制以增强 DenseNet 内的特征融合。
  • 在 BreakHis 的放大倍数下评估性能并与基线网络进行比较。

提出的方法

  • 将 DenseNet 作为基础架构,在密集块和转换层中集成 squeeze-and-excitation (SE) 注意力模块。
  • 应用三阶段迁移学习策略:在 ImageNet 预训练,在 LC2500 肺癌数据集上微调,然后在 BreakHis 乳腺癌图像上微调。
  • 对 BreakHis 图像进行颜色归一化预处理,并通过旋转和翻转等数据增强来扩增数据集规模。
  • 采用 7:1:2 的训练/验证/测试划分进行训练与评估,并报告患者级和图像级的准确性指标。
  • 在 40×、100×、200×、400× 四个放大倍数下,比较三种模型(DenseNet、DenseNet+SE,以及提出的基于迁移学习的 DenseNet+SE 模型)的性能。

实验结果

研究问题

  • RQ1将 SE 注意力集成到 DenseNet 是否相较于基础 DenseNet 提高乳腺癌组织病理图像分类准确性?
  • RQ2深度迁移学习流程(ImageNet 预训练、LC2500 微调、BreakHis 微调)对分类性能有何影响?
  • RQ3提出的方法在 BreakHis 的放大倍数(40×、100×、200×、400×)下,在患者级和图像级准确性方面的表现如何?

主要发现

BreakHis 数据集40×100×200×400×
DenseNet (P_arp)73.975.077.678.0
DenseNet+SE (P_arp)78.078.178.578.7
Ours (P_arp)80.184.381.282.4
DenseNet (P_img)72.577.577.277.5
DenseNet+SE (P_img)72.575.674.980.3
Ours (P_img)78.479.279.784.0
  • 所提出的方法在 BreakHis 的放大倍数下,在至少某些指标上优于 DenseNet 和 DenseNet+SE。
  • 对于 P_arp(患者级准确性),本方法在 40×、84.3、81.2、82.4 分别达到 80.1、84.3、81.2、82.4。
  • 对于 P_img(图像级准确性),本方法在 40×、100×、200×、400×分别达到 78.4、79.2、79.7、84.0。
  • DenseNet+SE 在若干设定上优于 DenseNet,但所提方法在报道的结果中通常具有最高的准确性。
  • 与 DenseNet+SE 相比,提出的方法模型规模和参数数量 modest 增加,但收敛时间更短,表明迁移学习下的微调更高效。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。