[论文解读] SLSDeep: Skin Lesion Segmentation Based on Dilated Residual and Pyramid Pooling Networks
SLSDeep 提出了一种使用扩张残差网络和金字塔池化的编码器-解码器模型用于皮肤病变分割,并通过结合 NLL+EPE 损失进行优化,在 ISBI 2016/2017 数据集上取得了最先进的结果。
Skin lesion segmentation (SLS) in dermoscopic images is a crucial task for automated diagnosis of melanoma. In this paper, we present a robust deep learning SLS model, so-called SLSDeep, which is represented as an encoder-decoder network. The encoder network is constructed by dilated residual layers, in turn, a pyramid pooling network followed by three convolution layers is used for the decoder. Unlike the traditional methods employing a cross-entropy loss, we investigated a loss function by combining both Negative Log Likelihood (NLL) and End Point Error (EPE) to accurately segment the melanoma regions with sharp boundaries. The robustness of the proposed model was evaluated on two public databases: ISBI 2016 and 2017 for skin lesion analysis towards melanoma detection challenge. The proposed model outperforms the state-of-the-art methods in terms of segmentation accuracy. Moreover, it is capable to segment more than $100$ images of size 384x384 per second on a recent GPU.
研究动机与目标
- 自动化黑色素瘤分割以辅助诊断并应对 dermoscopic 图像在大小、形状和边界模糊等方面的变异性。
- 开发一个能够在不进行大量预处理/后处理的情况下捕获粗到细特征的编码-解码器结构。
- 研究将负对数似然(Negative Log Likelihood, NLL)与端点误差(End Point Error, EPE)结合的损失函数,以提高边界清晰度。
提出的方法
- 基于扩张残差网络的编码器用于提取层级特征。
- 解码器采用金字塔池化层在重建前生成多尺度上下文。
- 通过定向跳跃连接策略将编码器特征与解码路径连接(在从编码器端到 PPN 的单一跳跃时效果最佳)。
- 一个将 NLL(用于二分类分割概率)与 EPE(用于边界保持)的损失函数:L_total = L_log + α L_epe,α = 0.5。
- 训练使用 PyTorch,Adam 优化器,编码器/解码器学习率 0.001/0.01,数据增强(缩放和旋转),批大小 16,训练 100 轮。
- 在 ISBI 2016 和 2017 的 dermoscopy 数据集上评估,指标包括 ACC、DIC、JAC、SEN、SPE。
实验结果
研究问题
- RQ1将扩张残差编码器与解码器中的金字塔池化结合,是否能在 SLS 精度和边界清晰度方面优于以往方法?
- RQ2将 NLL 与 EPE 结合的损失函数是否优于常规二分类损失(交叉熵)在皮肤病变分割中的表现?
- RQ3跳跃连接策略对该架构的分割性能有何影响?
主要发现
- SLSDeep 在 ISBI 2016 上达到顶尖性能,ACC 0.984、DIC 0.955、JAC 0.913、SEN 0.945、SPE 0.992。
- 在 ISBI 2017 上,SLSDeep 达到 ACC 0.936、DIC 0.878、JAC 0.782、SEN 0.816、SPE 0.983。
- 与变体相比,采用 NLL+EPE 且仅有一个编码器–PPN 跳跃连接的 SLSDeep 在 DIC 和 JAC 上具有持续提升(例如 ISBI 2016:相对于变体,DIC 提升约 3%,JAC 提升约 5%)。
- SLSDeep-EPE 与 SLSDeep+ASC 显示出混合结果,EPE 通常提升边界保持,但并不总是提升整体指标。
- SLSDeep 在现代 GPU 上对 384x384 输入的处理速率超过每秒 100 张,显示出用于大规模分析的实用性。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。