[论文解读] FastFlow: Unsupervised Anomaly Detection and Localization via 2D Normalizing Flows
FastFlow 引入了一个用于无监督异常检测和像素级定位的二维正则化流,作为 CNN 或 ViT 特征提取器之上的插件,将正常特征映射到标准正态分布,并使用似然度进行异常评分。
Unsupervised anomaly detection and localization is crucial to the practical application when collecting and labeling sufficient anomaly data is infeasible. Most existing representation-based approaches extract normal image features with a deep convolutional neural network and characterize the corresponding distribution through non-parametric distribution estimation methods. The anomaly score is calculated by measuring the distance between the feature of the test image and the estimated distribution. However, current methods can not effectively map image features to a tractable base distribution and ignore the relationship between local and global features which are important to identify anomalies. To this end, we propose FastFlow implemented with 2D normalizing flows and use it as the probability distribution estimator. Our FastFlow can be used as a plug-in module with arbitrary deep feature extractors such as ResNet and vision transformer for unsupervised anomaly detection and localization. In training phase, FastFlow learns to transform the input visual feature into a tractable distribution and obtains the likelihood to recognize anomalies in inference phase. Extensive experimental results on the MVTec AD dataset show that FastFlow surpasses previous state-of-the-art methods in terms of accuracy and inference efficiency with various backbone networks. Our approach achieves 99.4% AUC in anomaly detection with high inference efficiency.
研究动机与目标
- 在异常样本稀少或不可用时,推动高效的无监督异常检测与定位。
- 用维持空间结构的二维正则化流来建模正常特征分布。
- 实现端到端推理,提供一个轻量级、可与各种骨干网络对接的插件式流模块。
提出的方法
- 将正则化流扩展到带完全卷积的二维形式,以保持空间关系。
- 在流子网络中交替使用 3x3 与 1x1 的卷积核,以在精度与效率之间取得平衡。
- 在正常数据上训练 FastFlow,使特征转化为标准正态分布,并将得到的似然度作为异常分数。
- 支持端到端推理,直接从二维流输出像素级异常图。
- 将 CNN 的特征提取器(如 ResNet)和视觉变换器(ViT)作为插件整合。
实验结果
研究问题
- RQ1二维正则化流是否能有效建模全局与局部特征分布,用于无监督异常检测?
- RQ2带有完全卷积块的二维流是否在不进行滑窗补丁处理的情况下提升异常定位?
- RQ3不同骨干架构(CNN 与 ViT)与流配置下,FastFlow 的性能如何变化?
- RQ4在保持高精度的同时,端到端推理是否比基于补丁的方法或 KNN 方法更高效?
主要发现
| 类别 | 图像级 AUC | 像素级 AUC |
|---|---|---|
| 地毯 | 100.0 | 99.3 |
| 网格 | 99.7 | 98.3 |
| 皮革 | 100.0 | 99.5 |
| 瓷砖 | 100.0 | 96.3 |
| 木头 | 100.0 | 97.0 |
| 瓶子 | 100.0 | 98.6 |
| 电缆 | 100.0 | 98.4 |
| 胶囊 | 100.0 | 99.1 |
| 榛子 | 100.0 | 99.1 |
| 元件螺母 | 100.0 | 98.5 |
| 药丸 | 99.4 | 99.2 |
| 螺丝 | 97.8 | 99.4 |
| 牙刷 | 94.4 | 98.9 |
| 晶体管 | 99.8 | 97.3 |
| 拉链 | 99.5 | 98.7 |
- FastFlow 在 MVTec AD 上实现了最先进的图像级 AUC,以及有竞争力的像素级 AUC,例如在某些骨干上达到 99.4 的图像级 AUC 和 98.5 的像素级 AUC。
- 与 Patch Core、CFlow 等方法相比,FastFlow 提供显著更高的推理速度(在某些设置中快多达 10 倍)。
- FastFlow 在不同骨干(ViT 与 CNN)上都保持了强劲的性能,并从保持空间信息以实现定位的二维流设计中受益。
- 消融研究表明,交替使用 3x3 和 1x1 的卷积核可以在较大骨干下提高性能并减少参数,而仅使用 3x3 在较小骨干下效果更佳。
- 定性结果显示在未对齐/受干扰数据场景下也能实现准确定位和稳健表现。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。