Skip to main content
QUICK REVIEW

[论文解读] Skin Lesions Classification Using Convolutional Neural Networks in Clinical Images

Danilo Barros Mendes, Nilton Correia da Silva|arXiv (Cornell University)|Dec 6, 2018
Cutaneous Melanoma Detection and Management参考文献 22被引用 45
一句话总结

论文使用 transfer learning 的方式对 ResNet-152 CNN,基于 ImageNet 预训练,结合强数据增强,对临床图片中的 12 种皮肤病变进行分类,取得高 AUC(如黑色素瘤 0.96,基底细胞癌 0.91)和整体 78% 的准确率。

ABSTRACT

Skin lesions are conditions that appear on a patient due to many different reasons. One of these can be because of an abnormal growth in skin tissue, defined as cancer. This disease plagues more than 14.1 million patients and had been the cause of more than 8.2 million deaths, worldwide. Therefore, the construction of a classification model for 12 lesions, including Malignant Melanoma and Basal Cell Carcinoma, is proposed. Furthermore, in this work, it is used a ResNet-152 architecture, which was trained over 3,797 images, later augmented by a factor of 29 times, using positional, scale, and lighting transformations. Finally, the network was tested with 956 images and achieve an area under the curve (AUC) of 0.96 for Melanoma and 0.91 for Basal Cell Carcinoma.

研究动机与目标

  • 促使改进皮肤病变分类以帮助临床医生并降低误诊与成本。
  • 开发基于 CNN 的模型,使用临床(非皮肤镜)图像来区分 12 种病变类别。
  • 通过迁移学习和广泛的数据增强解决数据稀缺问题。
  • 研究模型的可解释性以促进信任和临床应用。

提出的方法

  • 以 ResNet-152 作为主干,使用 ImageNet 预训练权重。
  • 通过替换最后一层,使网络输出 12 类病变。
  • 在 MED-NODE、Edinburgh 和 Atlas 数据集上应用实质性数据增强(扩大 29 倍)。
  • 构建分层抽样的训练/验证/测试拆分,并将数据以 LMDB 格式准备,以实现高效访问。
  • 在 Caffe 中尝试超参数,包括 base_lr=0.01、batch_size=5,并进行等同于 10 轮次的迭代。
  • 使用准确率、混淆矩阵、AUC、ROC 曲线和最佳截断点进行评估。
  • 结合 GradCAM 的可解释性分析,以可视化模型对病变区域的关注点。

实验结果

研究问题

  • RQ1一个通过迁移学习在异质临床图像数据集上训练的 CNN 是否能够以高区分度对 12 种皮肤病变类型进行分类?
  • RQ2在医学数据稀缺的情形下,广泛的数据增强如何影响性能?
  • RQ3哪些可解释性方法(如 GradCAM)能为临床信任与调试提供有用的洞察?

主要发现

  • 最佳模型使用 ResNet-152,并结合来自 MED-NODE、Edinburgh 和 Atlas 数据集的增强数据,在若干病变上实现了高 AUC。
  • 在测试中,日晒性角化病(Actinic Keratosis)是唯一未达到 80% 以上准确率的病变类型(总体 78% 的准确率)。
  • AUC 比较显示各病变的性能具有竞争力,黑色素瘤的 AUC 约为 0.96,其他病变的范围在 0.90–0.99 之间(引文结果)。
  • 迁移学习和数据增强对解决数据稀缺并在该医学影像任务中提高泛化能力至关重要。
  • 基于 GradCAM 的可解释性分析突出了驱动预测的区域,并有助于诊断误分类。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。