[论文解读] Semi-supervised Anomaly Detection using AutoEncoders
本文提出一种基于U-Net结构的卷积自编码器的半监督异常检测方法,仅使用正常(无缺陷)图像进行训练。通过重建输入图像并分析输入与重建结果之间的像素级残差,利用阈值化方法检测异常,在两个数据集上平均F1分数达到0.885,对合成裂纹缺陷表现优异,对真实铁路表面数据中的中等噪声也具有较好鲁棒性。
Anomaly detection refers to the task of finding unusual instances that stand out from the normal data. In several applications, these outliers or anomalous instances are of greater interest compared to the normal ones. Specifically in the case of industrial optical inspection and infrastructure asset management, finding these defects (anomalous regions) is of extreme importance. Traditionally and even today this process has been carried out manually. Humans rely on the saliency of the defects in comparison to the normal texture to detect the defects. However, manual inspection is slow, tedious, subjective and susceptible to human biases. Therefore, the automation of defect detection is desirable. But for defect detection lack of availability of a large number of anomalous instances and labelled data is a problem. In this paper, we present a convolutional auto-encoder architecture for anomaly detection that is trained only on the defect-free (normal) instances. For the test images, residual masks that are obtained by subtracting the original image from the auto-encoder output are thresholded to obtain the defect segmentation masks. The approach was tested on two data-sets and achieved an impressive average F1 score of 0.885. The network learnt to detect the actual shape of the defects even though no defected images were used during the training.
研究动机与目标
- 开发一种仅需正常(无缺陷)训练数据的异常检测方法,以应对工业检测中异常样本标注稀缺的问题。
- 实现工业光学检测与基础设施资产管理中的缺陷自动检测,减少对耗时且易出错的人工检测的依赖。
- 在训练过程中未接触任何异常样本的情况下,实现对多样化缺陷形状与几何结构的检测。
- 评估该方法在真实与合成数据集上对阈值选择及光照变化的鲁棒性与敏感性。
提出的方法
- 采用受U-Net启发的卷积自编码器架构,编码器与解码器模块使用逐步减小的卷积核尺寸,并通过转置卷积实现图像重建。
- 在每个卷积层与转置卷积层后应用批量归一化和ReLU激活函数,以稳定训练过程并提升特征学习能力。
- 使用均方误差(MSE)损失函数计算原始输入图像与自编码器重建输出之间的差异,采用Adam优化器在50个周期内进行训练。
- 通过计算输入图像与重建图像之间的像素级差异生成残差图:R = X − AE(X)。
- 对残差图进行阈值化处理,生成最终的缺陷分割掩码,检测灵敏度取决于阈值选择。
- 该方法仅使用正常样本进行训练,因此适用于异常数据稀缺或不可用的半监督场景。
实验结果
研究问题
- RQ1仅使用正常图像进行训练的深度自编码器是否能在无任何异常训练数据的情况下检测出多样化缺陷形状与几何结构?
- RQ2基于自编码器重建误差的残差法在真实世界与合成工业缺陷数据集上的异常检测效果如何?
- RQ3该方法的性能对残差图分割步骤中阈值选择的敏感性如何?
- RQ4光照变化与图像噪声在真实世界数据中对误报检测的影响程度如何?
- RQ5即使未显式在训练中接触过,该方法是否仍能泛化检测出形状与尺寸各异的缺陷?
主要发现
- 在合成DAGMC8数据集上,该方法取得了0.96的F1分数,表明其在低噪声条件下对裂纹缺陷具有极强的检测能力。
- 在真实世界RSDDsI数据集上,F1分数为0.81,表明检测效果良好,但受噪声影响较大且对阈值选择较为敏感。
- 自编码器成功学习到正常纹理的重建能力,并生成了具有意义的残差图,能够清晰突出实际缺陷形状,尽管训练过程中未使用任何异常样本。
- 该方法对阈值选择较为敏感,微小的阈值变化即导致分割结果的显著波动,表明需要采用更稳健的阈值选择策略。
- RSDDsI数据集中光照变化有时被误判为缺陷,导致误报,凸显了其在光照变化下鲁棒性不足的局限性。
- 该方法展现出对不同几何形状与范围缺陷的检测能力,表明其在工业应用中具备实现基于度量的缺陷分析的潜力。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。