QUICK REVIEW

[论文解读] Breast Mass Classification from Mammograms using Deep Convolutional Neural Networks

Daniel Lévy, Arzav Jain|arXiv (Cornell University)|Dec 2, 2016

AI in cancer detection参考文献 20被引用 167

一句话总结

本文训练端到端的 CNN，将乳腺X线摄影中预分割的乳腺肿块分类为良性或恶性，利用迁移学习、背景上下文增强和数据增强，在 DDSM 上达到最先进的结果，并提供可解释的显著性图。

ABSTRACT

Mammography is the most widely used method to screen breast cancer. Because of its mostly manual nature, variability in mass appearance, and low signal-to-noise ratio, a significant number of breast masses are missed or misdiagnosed. In this work, we present how Convolutional Neural Networks can be used to directly classify pre-segmented breast masses in mammograms as benign or malignant, using a combination of transfer learning, careful pre-processing and data augmentation to overcome limited training data. We achieve state-of-the-art results on the DDSM dataset, surpassing human performance, and show interpretability of our model.

研究动机与目标

推动自动化、端到端的乳腺肿块分类，以减少误诊和放射科医生之间的变异性。
研究迁移学习、肿块周围的上下文以及数据增强，以克服医学数据集规模较小的问题。
通过显著性图评估模型可解释性，以支持临床应用。

提出的方法

评估三种 CNN 架构（基线、AlexNet、GoogLeNet）在二分类任务上的性能。
在 ImageNet 上使用预训练权重，并针对乳腺X线数据进行微调，采用定制的学习率调度。
比较固定上下文填充与成比例上下文填充，并应用数据增强（旋转、裁剪、翻转）。
在合适情况下使用 Adam 或 SGD 进行训练，批量大小为 64，输入为 224x224x3。
提供显著性图可视化以解释模型预测（基于梯度）。

实验结果

研究问题

RQ1端到端的 CNN 能否从乳腺X线照片中对预分割的乳腺肿块进行良恶性分类？
RQ2迁移学习、上下文大小和数据增强是否能提升 DDSM 数据集上的性能？
RQ3显著性图是否能为乳腺肿块分类中的模型决策提供可解释的洞察？

主要发现

模型	准确率	精确度	召回率	训练轮数
Baseline (Aug-Large Context)	0.604	0.587	0.703	35
AlexNet (Aug - Large Context)	0.890	0.908	0.868	30
GoogLeNet (Aug - Large Context)	0.929	0.924	0.934	30

在增强与大上下文条件下的 GoogLeNet 获得最高的测试准确率（0.929），精确度 0.924，召回率 0.934。
从 ImageNet 的迁移学习显著提升相对于基线模型的性能。
成比例的（肿块大小的两倍）上下文优于固定填充上下文。
数据增强在训练稳定性和泛化能力方面有显著提升。
最佳模型召回率（0.934）超过了前一研究报道的放射科医生召回率范围。
在显著性图中，模型关注肿块边缘及周围上下文，提供可解释性。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。