QUICK REVIEW

[论文解读] WonDerM: Skin Lesion Classification with Fine-tuned Neural Networks

Yeong Chan Lee, Sang‐Hyuk Jung|arXiv (Cornell University)|Aug 10, 2018

Cutaneous Melanoma Detection and Management参考文献 14被引用 32

一句话总结

WonDerM 提出了一种基于迁移学习与集成方法的深度学习流水线，用于多类别皮肤病变分类。该方法利用在分割任务上预训练的微调 DenseNet 架构，并结合集成学习以缓解类别不平衡问题。在 ISIC 2018 挑战赛中，该方法在验证集上达到 89.9% 的准确率，在测试集上达到 78.5% 的准确率，通过迁移学习和加权集成评分显著提升了性能。

ABSTRACT

As skin cancer is one of the most frequent cancers globally, accurate, non-invasive dermoscopy-based diagnosis becomes essential and promising. A task of the Part 3 of the ISIC Skin Image Analysis Challenge at MICCAI 2018 is to predict seven disease classes with skin lesion images, including melanoma (MEL), melanocytic nevus (NV), basal cell carcinoma (BCC), actinic keratosis / Bowen's disease (intraepithelial carcinoma) (AKIEC), benign keratosis (solar lentigo / seborrheic keratosis / lichen planus-like keratosis) (BKL), dermatofibroma (DF) and vascular lesion (VASC) as defined by the International Dermatology Society. In this work, we design the WonDerM pipeline, that resamples the preprocessed skin lesion images, builds neural network architecture fine-tuned with segmentation task data (the Part 1), and uses an ensemble method to classify the seven skin diseases. Our model achieved an accuracy of 0.899 and 0.785 in the validation set and test set, respectively.

研究动机与目标

解决使用皮肤镜图像进行多类别皮肤病变分类中的类别不平衡问题。
通过从分割任务迁移学习，提升七种类别皮肤疾病（包括黑色素瘤和良性病变）的分类性能。
开发一种鲁棒的集成模型，通过加权概率评分结合多个分类器，以增强预测的可靠性。
利用从分割数据中学到的形态学与空间特征，提升分类任务中的泛化能力。

提出的方法

流水线使用在 2,594 张图像上预训练的 DenseNet-U-Net 架构进行皮肤病变分割，以提取高层特征。
分割模型的编码器部分在 HAM10000 数据集的 28,052 张重采样平衡训练集上进行微调。
在四个不同的平衡数据集上分别训练四个分类模型，每个模型均根据少数类的样本数量进行拟合（例如，BCC 类约 463 张图像）。
采用加权集成方法，利用类别特定的真正例率作为权重，以校正模型置信度中的不平衡问题。
最终预测通过选择加权概率得分最高的类别做出：$\tilde{P}_{ij\cdot} = \frac{\sum_{\forall k} w_k^{(j)} P_{ijk}}{\sum_{\forall j} \sum_{\forall k} w_k^{(j)} P_{ijk}}$，其中 $w_k^{(j)}$ 为网络 $k$ 中类别 $j$ 的真正例率。
数据增强包括对代表性不足的类别（DF、VASC）进行 90°、180°、270° 旋转以及垂直和水平翻转。

实验结果

研究问题

RQ1从分割任务迁移学习是否能提升多类别皮肤病变诊断中的分类性能？
RQ2使用加权概率评分的集成学习在缓解皮肤病变分类中的类别不平衡问题方面有多有效？
RQ3使用少数类频率作为目标对训练数据进行重采样，是否能提升模型在所有类别上的泛化能力？
RQ4混合的 DenseNet-U-Net 架构是否能有效提取对分割和分类均有用的形态学特征？

主要发现

集成模型在验证集上达到 89.9% 的准确率，显著优于单个模型。
在测试集上，模型达到 78.5% 的准确率，表明其在未见数据上具有强大的泛化能力。
加权集成评分方法通过为在代表性不足类别上真正例率更高的模型分配更高权重，有效降低了对多数类的偏差。
使用分割预训练的特征显著提升了特征学习效果，尤其在复杂形态学模式的皮肤病变中表现更优。
将训练集重采样以平衡各类频率（例如，每类 463 张图像）显著提升了对少数类（如 DF 和 VASC）的模型性能。
混淆矩阵分析显示，所有七种类别的性能保持一致，其中 NV（痣）类别准确率最高，MEL 和 BCC 类别达到中等至高水平准确率。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。