Skip to main content
QUICK REVIEW

[论文解读] Anomalous Instance Detection in Deep Learning: A Survey.

Saikiran Bulusu, Bhavya Kailkhura|arXiv (Cornell University)|Mar 16, 2020
Anomaly Detection Techniques and Applications参考文献 71被引用 29
一句话总结

本综述对深度学习中的事后异常检测技术提供了全面且结构化的概述,根据其基本假设和方法对各类技术进行分类。分析了各类方法的优势、劣势及研究空白,为提升深度学习系统在分布外(out-of-distribution)和对抗性输入下的鲁棒性提供了路线图。

ABSTRACT

Deep Learning (DL) is vulnerable to out-of-distribution and adversarial examples resulting in incorrect outputs. To make DL more robust, several posthoc anomaly detection techniques to detect (and discard) these anomalous samples have been proposed in the recent past. This survey tries to provide a structured and comprehensive overview of the research on anomaly detection for DL based applications. We provide a taxonomy for existing techniques based on their underlying assumptions and adopted approaches. We discuss various techniques in each of the categories and provide the relative strengths and weaknesses of the approaches. Our goal in this survey is to provide an easier yet better understanding of the techniques belonging to different categories in which research has been done on this topic. Finally, we highlight the unsolved research challenges while applying anomaly detection techniques in DL systems and present some high-impact future research directions.

研究动机与目标

  • 为深度学习中的事后异常检测技术提供结构化且全面的概述。
  • 基于其基本假设和采用的方法,对现有方法进行分类。
  • 分析不同异常检测技术的相对优势与劣势。
  • 识别在深度学习系统中应用异常检测时尚未解决的研究挑战。
  • 概述可显著提升模型鲁棒性的高影响力未来研究方向。

提出的方法

  • 本文基于假设和方法对异常检测技术构建分类体系。
  • 将方法划分为重建类、不确定性估计和异常值检测等类别。
  • 采用检测准确率、计算成本以及在不同数据分布上的泛化能力等标准评估各类技术。
  • 从检测分布外样本和对抗性样本的能力角度比较不同方法。
  • 分析结合了现有文献的理论与实证洞察。
  • 综合研究成果,突出方法论上的权衡与开放性挑战。

实验结果

研究问题

  • RQ1深度学习中的不同异常检测技术在基本假设和设计原则上存在哪些差异?
  • RQ2重建类、基于不确定性的和异常值检测方法在识别异常输入方面具有哪些相对优势与劣势?
  • RQ3在真实深度学习系统中部署异常检测面临哪些关键挑战?
  • RQ4哪些技术在跨多样化数据分布的泛化能力方面最具潜力?
  • RQ5深度学习异常检测领域中最具关键性的未解研究问题与未来方向是什么?

主要发现

  • 综述指出,重建类方法在检测分布外样本方面表现有效,但在高维数据上可能表现不佳。
  • 不确定性估计技术在识别模型不确定性方面表现优异,尤其在主动学习和分布外检测中。
  • 基于距离或密度的异常值检测方法在高维潜在空间中常因维度灾难而失效。
  • 不存在普遍最优的方法;性能显著依赖于数据分布和模型架构。
  • 在多样化且未见的数据分布上实现可靠泛化仍是重大挑战。
  • 本文强调亟需建立标准化的基准和评估协议,以实现不同方法间的公平比较。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。