[论文解读] Convolutional neural network classification of cancer cytopathology images: taking breast cancer as an example
本论文在 BreaKHis 数据集上,使用 Inception-V3、迁移学习和基于四叉树的图像分割,对乳腺癌细胞病理图像进行良性与恶性分类,在所有放大倍率下的准确率均超过 0.92。
Breast cancer is a relatively common cancer among gynecological cancers. Its diagnosis often relies on the pathology of cells in the lesion. The pathological diagnosis of breast cancer not only requires professionals and time, but also sometimes involves subjective judgment. To address the challenges of dependence on pathologists expertise and the time-consuming nature of achieving accurate breast pathological image classification, this paper introduces an approach utilizing convolutional neural networks (CNNs) for the rapid categorization of pathological images, aiming to enhance the efficiency of breast pathological image detection. And the approach enables the rapid and automatic classification of pathological images into benign and malignant groups. The methodology involves utilizing a convolutional neural network (CNN) model leveraging the Inceptionv3 architecture and transfer learning algorithm for extracting features from pathological images. Utilizing a neural network with fully connected layers and employing the SoftMax function for image classification. Additionally, the concept of image partitioning is introduced to handle high-resolution images. To achieve the ultimate classification outcome, the classification probabilities of each image block are aggregated using three algorithms: summation, product, and maximum. Experimental validation was conducted on the BreaKHis public dataset, resulting in accuracy rates surpassing 0.92 across all four magnification coefficients (40X, 100X, 200X, and 400X). It demonstrates that the proposed method effectively enhances the accuracy in classifying pathological images of breast cancer.
研究动机与目标
- 旨在加速并自动化乳腺癌细胞病理图像分类,以减少对病理学家时间和专业知识的依赖。
- 利用 Inception-V3 及迁移学习从高分辨率病理图像中提取特征。
- 引入基于四叉树的图像分割,以处理高分辨率图像并为每张图像生成多个块。
- 探讨融合规则(求和、乘积、最大值)将块级预测汇聚为图像级和患者级结果。
提出的方法
- 将图像缩放至 299x299 后,使用 Inception-V3 作为特征提取器,并移除最后两层全连接层。
- 通过使用 ImageNet 预训练权重且不进行微调,采用固定权重的迁移学习方法以节省计算。
- 从每张图像的最后池化层提取一个 1x2048 的特征向量并输入到一个两层全连接分类器(512 和 2 个节点),搭配 SoftMax 激活。
- 通过基于四叉树的分割对数据进行增强,产生每张原图的 4 张和 16 张子图像,数据集规模分别扩大 4 倍和 16 倍。
- 使用求和、乘积或最大值规则对子图像预测进行融合,以获得最终的图像诊断。
实验结果
研究问题
- RQ1基于四叉树的图像分割如何影响乳腺癌组织病理分类的准确性?
- RQ2不同融合算法(求和、乘积、最大值)对聚合的块级预测在图像级和患者级分类上的影响是怎样的?
- RQ3在 BreaKHis 上,基于卷积神经网络的迁移学习方法是否优于传统的手工特征提取用于乳腺癌组织病理图像分类?
主要发现
- 在使用分割块和融合时,在所有放大倍率(40X、100X、200X、400X)上的准确率均超过 0.92。
- 与未分割图像相比,使用分割后图像级准确率提升了 2.0% 至 4.4%。
- 与未分割图像相比,使用分割后患者级准确率提升了 0.9% 至 4.9%。
- 四分割分割通常在大多数情况下优于16路分割(在 79.2% 的实例中)。
- 与文献中的若干基线相比,所提出的基于 CNN 的方法结合分割和融合在图像识别准确率方面取得了显著提升(例如,较某些先前方法高出约 12% )。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。