Skip to main content
QUICK REVIEW

[论文解读] A Survey of Time Series Anomaly Detection Methods in the AIOps Domain

Zhenyu Zhong, Qiliang Fan|arXiv (Cornell University)|Aug 1, 2023
Anomaly Detection Techniques and Applications被引用 10
一句话总结

在 AIOps 领域对单变量和多变量时间序列异常检测方法的综合综述,涵盖分类、数据集、评估指标和未来方向。

ABSTRACT

Internet-based services have seen remarkable success, generating vast amounts of monitored key performance indicators (KPIs) as univariate or multivariate time series. Monitoring and analyzing these time series are crucial for researchers, service operators, and on-call engineers to detect outliers or anomalies indicating service failures or significant events. Numerous advanced anomaly detection methods have emerged to address availability and performance issues. This review offers a comprehensive overview of time series anomaly detection in Artificial Intelligence for IT operations (AIOps), which uses AI capabilities to automate and optimize operational workflows. Additionally, it explores future directions for real-world and next-generation time-series anomaly detection based on recent advancements.

研究动机与目标

  • 概述 AIOps 领域中时间序列异常检测方法的特征和类别。
  • 提出针对 AIOps 中的 UTS 和 MTS 数据的异常检测技术分类体系。
  • 调查用于 AIOps 异常检测的数据集、基准和评估指标。
  • 突出 AIOps 中的数据规模、噪声、标注工作量、不平衡和概念漂移等挑战。
  • 提出在 AIOps 中现实部署以及下一代方法的发展方向。

提出的方法

  • 采用涵盖数据库选择、综述检索和文献检索的即兴/随笔式文献综述方法。
  • 通过提取现有异常检测方法的特征来建立分类体系。
  • 将 UTS 方法分为经典、监督、半监督和无监督几类。
  • 评述 AIOps 中的数据来源、输入数据类型、异常类型、问题表述以及主要挑战。
  • 提供数据集、软件和评估指标的讨论,并在可用时给出链接。

实验结果

研究问题

  • RQ1RQ1:定义每种异常检测方法的关键特征是什么,以及它们如何进行分类?
  • RQ2RQ2:现有技术如何应对 AIOps 时间序列异常检测中的挑战,以及它们的贡献是什么?
  • RQ3RQ3:存在于 AIOps 时间序列异常检测的开源数据集和评估指标有哪些,是否有公开的软件包?

主要发现

  • 提供了 AIOps 领域时间序列异常检测方法的结构化分类体系。
  • 指出数据来源(系统相关、用户感知、服务性能)和输入类型(UTS 和 MTS)是方法设计的核心。
  • 概述主要挑战:高维性、噪声、标注工作量、数据不平衡以及由于频繁变动导致的模式漂移。
  • 总结公开数据集、基准和软件链接以支持可复现性。
  • 讨论用于评估 AIOps 异常检测方法的常用评估指标。
  • 提出现实世界部署和下一代方法的未来研究方向。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。