Skip to main content
QUICK REVIEW

[论文解读] Towards Automated Melanoma Screening: Exploring Transfer Learning Schemes

Afonso Menegola, Michel Fornaciali|arXiv (Cornell University)|Sep 5, 2016
Cutaneous Melanoma Detection and Management参考文献 6被引用 34
一句话总结

本文研究了用于深度学习自动黑色素瘤筛查的迁移学习方案,比较了从通用数据集(ImageNet)和特定领域数据集(视网膜图像)进行迁移学习,是否进行微调。出人意料的是,从ImageNet迁移优于从相关医学领域迁移,且组合式顺序迁移反而降低了性能,表明来自无关但规模庞大的数据集的预训练模型在医学图像分类任务中可能具有更好的泛化能力。

ABSTRACT

Deep learning is the current bet for image classification. Its greed for huge amounts of annotated data limits its usage in medical imaging context. In this scenario transfer learning appears as a prominent solution. In this report we aim to clarify how transfer learning schemes may influence classification results. We are particularly focused in the automated melanoma screening problem, a case of medical imaging in which transfer learning is still not widely used. We explored transfer with and without fine-tuning, sequential transfers and usage of pre-trained models in general and specific datasets. Although some issues remain open, our findings may drive future researches.

研究动机与目标

  • 评估不同迁移学习方案对黑色素瘤分类性能的影响。
  • 探究来自相似医学领域(如视网膜图像)的迁移是否优于通用领域预训练(如ImageNet)。
  • 评估微调在小样本医学图像分类中的作用。
  • 确定顺序迁移(两步迁移)是否能提升最终模型性能。
  • 为医学影像,特别是黑色素瘤筛查中的迁移学习应用提供实用指导。

提出的方法

  • 所有实验均采用VGG-M深度神经网络架构。
  • 通过冻结预训练模型的早期层并微调最后几层在黑色素瘤数据集上的表现,实现迁移学习。
  • 评估了微调(端到端训练)与非微调(仅特征提取)两种策略。
  • 在倒数第二层特征上使用SVM分类器进行最终预测,以实现与先前研究的公平比较。
  • 使用来自ImageNet和医学领域数据集(糖尿病性视网膜病变图像)的预训练模型进行实验。
  • 执行组合迁移:首先从ImageNet迁移到视网膜图像,再从视网膜图像迁移到黑色素瘤图像。

实验结果

研究问题

  • RQ1从通用领域数据集(ImageNet)迁移是否在黑色素瘤分类中优于从特定医学领域(视网膜图像)迁移?
  • RQ2在训练数据有限的情况下,微调如何影响分类性能?
  • RQ3与单步迁移相比,顺序迁移(两步迁移)是否能提升最终性能?
  • RQ4结果对数据集大小、标注质量及数据不平衡的敏感性如何?
  • RQ5实验设计(如交叉验证折的构建方式)对模型性能的影响如何?

主要发现

  • 从ImageNet(通用领域)迁移优于从相关医学领域(视网膜图像)迁移,微调下mAP达到69.8%,而非微调下仅为49.3%。
  • 组合迁移方法(ImageNet → 视网膜图像 → 黑色素瘤图像)的性能劣于单步迁移,mAP仅为57.4%,表明在第一轮迁移过程中ImageNet的知识部分被抹除。
  • 微调显著提升了性能:在黑色素瘤与良性病变分类中,mAP从非微调的57.1%提升至微调的69.8%。
  • 将黑色素瘤和基底细胞癌合并为正样本类别可提高分类准确率(微调下mAP达73.0%),可能因减少了类别不平衡。
  • 从数据集中移除基底细胞癌会降低性能,表明更多样化的正样本有助于提升模型泛化能力。
  • 实验设计具有敏感性:数据折的微小变化对结果影响显著,凸显了稳健评估协议的重要性。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。