[论文解读] Deep Learning for Skin Lesion Classification
本文提出了一种基于谷歌Inception-v3模型迁移学习的两阶段深度学习系统,用于自动皮肤病变分类。该系统提取1000维图像表征,并使用两个独立的两层前馈网络,分别对病变进行良恶性(第一阶段)和黑色素细胞性/非黑色素细胞性(第二阶段)分类,最终在ISIC 2017验证集上实现了65.8%的总体AUC。
Melanoma, a malignant form of skin cancer is very threatening to life. Diagnosis of melanoma at an earlier stage is highly needed as it has a very high cure rate. Benign and malignant forms of skin cancer can be detected by analyzing the lesions present on the surface of the skin using dermoscopic images. In this work, an automated skin lesion detection system has been developed which learns the representation of the image using Google's pretrained CNN model known as Inception-v3 \cite{cnn}. After obtaining the representation vector for our input dermoscopic images we have trained two layer feed forward neural network to classify the images as malignant or benign. The system also classifies the images based on the cause of the cancer either due to melanocytic or non-melanocytic cells using a different neural network. These classification tasks are part of the challenge organized by International Skin Imaging Collaboration (ISIC) 2017. Our system learns to classify the images based on the model built using the training images given in the challenge and the experimental results were evaluated using validation and test sets. Our system has achieved an overall accuracy of 65.8\% for the validation set.
研究动机与目标
- 开发一种基于深度学习的自动化系统,用于将皮肤病变分类为良性或恶性。
- 利用皮肤镜图像将皮肤癌的潜在病因分类为黑色素细胞性或非黑色素细胞性。
- 利用预训练的Inception-v3模型进行迁移学习,以在有限训练数据下提升分类性能。
- 通过使用皮肤镜图像的深度特征自动化诊断,应对早期黑色素瘤检测的挑战。
提出的方法
- 将皮肤镜图像预处理为299×299×3大小,并通过镜像、裁剪、缩放和亮度调整进行数据增强。
- 使用预训练的Inception-v3模型,从倒数第二层提取1000维的特征表征。
- 训练一个包含1000个神经元的隐含层和2个输出神经元的两层前馈神经网络,输出层使用Softmax激活函数。
- 将相同的表征向量分别输入两个独立的前馈网络,用于第一阶段(良恶性)和第二阶段(黑色素细胞性/非黑色素细胞性)分类。
- 使用Adam优化器和交叉熵损失函数,在4000次迭代内优化网络。
- 在ISIC 2017挑战数据集的150张图像验证集上评估性能。
实验结果
研究问题
- RQ1基于预训练的Inception-v3模型进行迁移学习,能否有效利用皮肤镜图像将皮肤病变分类为良性或恶性?
- RQ2所学习到的相同图像表征是否可用于区分皮肤癌的黑色素细胞性与非黑色素细胞性病因?
- RQ3与传统特征工程方法相比,该两阶段分类系统的性能如何?
- RQ4在ISIC 2017验证集上,达到稳定性能的最优训练迭代次数是多少?
主要发现
- 该系统在第一阶段(良恶性分类)的验证集准确率达到72%。
- 该系统在第二阶段(病因分类为黑色素细胞性或非黑色素细胞性)的验证集准确率达到71%。
- 验证集的总体受试者工作特征曲线下面积(AUC)为65.8%,表明诊断性能中等。
- 在4000次迭代时,第一阶段的训练准确率达到82.5%,第二阶段达到81.4%,表明模型在训练数据上具有良好的收敛性。
- 训练损失函数在4000次训练迭代内有效最小化,如训练损失曲线所示。
- 采用镜像、裁剪和亮度调整等数据增强技术,提升了模型的泛化能力。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。