Skip to main content
QUICK REVIEW

[论文解读] Anomaly Detection in Univariate Time-series: A Survey on the State-of-the-Art

Mohammad Braei, Sebastian Wagner|arXiv (Cornell University)|Apr 1, 2020
Anomaly Detection Techniques and Applications参考文献 90被引用 154
一句话总结

本综述比较单变量时间序列异常检测的统计、经典机器学习和深度学习方法,在公开数据集上评估了20种方法,基于准确性和运行时间进行比较。

ABSTRACT

Anomaly detection for time-series data has been an important research field for a long time. Seminal work on anomaly detection methods has been focussing on statistical approaches. In recent years an increasing number of machine learning algorithms have been developed to detect anomalies on time-series. Subsequently, researchers tried to improve these techniques using (deep) neural networks. In the light of the increasing number of anomaly detection methods, the body of research lacks a broad comparative evaluation of statistical, machine learning and deep learning methods. This paper studies 20 univariate anomaly detection methods from the all three categories. The evaluation is conducted on publicly available datasets, which serve as benchmarks for time-series anomaly detection. By analyzing the accuracy of each method as well as the computation time of the algorithms, we provide a thorough insight about the performance of these anomaly detection approaches, alongside some general notion of which method is suited for a certain type of data.

研究动机与目标

  • 动机:需要对时间序列异常检测方法进行跨类别的广泛评估。
  • 在单变量时间序列上比较统计、经典机器学习和神经网络方法。
  • 提供关于不同数据特征及性能权衡下的方法适用性见解。

提出的方法

  • 讨论基础概念:异常、时间序列、异常类型以及评估框架。
  • 介绍并将异常检测方法分为统计、经典 ML 和基于神经网络的方法。
  • 描述评估设置,包括数据集使用和超参数,以确保公平比较。
  • 在每个类别中总结代表性方法(例如 AR/ARMA/ARIMA、SES/TES/DES、聚类与 One-Class SVM、自编码器、GANs)。
  • 分析基于预测的检测与基于形状的检测在单变量时间序列中的适用性。

实验结果

研究问题

  • RQ1在单变量时间序列异常检测中,统计、经典 ML 和深度学习方法的相对准确度如何?
  • RQ2在基准数据集上,不同方法家族的计算时间对比如何?
  • RQ3哪些数据特征(平稳性、季节性、滑动窗口等)更偏好某些异常检测方法?
  • RQ4在将这些方法应用于单变量时间序列时,监督、半监督与无监督等实际考虑因素有哪些?

主要发现

  • 本文在多个数据集上对三大方法类别进行了定量比较。
  • 它同时分析准确性和计算时间,以描绘性能权衡。
  • 它讨论了方法对不同数据特性和异常类型(点型、集体型、情境型)的适用性。
  • 它强调性能取决于模型选择(例如 AR 与 ARMA 与 ARIMA、SES/DES/TES、聚类与基于密度的方法)。
  • 它强调不存在单一最佳方法;有效性依赖于数据,并且与预测驱动与基于形状的检测策略相关。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。