QUICK REVIEW

[论文解读] Weakly Supervised Anomaly Detection: A Survey

Minqi Jiang, Chaochuan Hou|arXiv (Cornell University)|Feb 9, 2023

Anomaly Detection Techniques and Applications被引用 20

一句话总结

本综述将 Weakly Supervised Anomaly Detection (WSAD) 方法按不完整、不精确、不准确的监督划分，覆盖表格、图、时序和图像/视频数据，详细介绍定义、算法与未来方向，并发布代码与资源。

ABSTRACT

Anomaly detection (AD) is a crucial task in machine learning with various applications, such as detecting emerging diseases, identifying financial frauds, and detecting fake news. However, obtaining complete, accurate, and precise labels for AD tasks can be expensive and challenging due to the cost and difficulties in data annotation. To address this issue, researchers have developed AD methods that can work with incomplete, inexact, and inaccurate supervision, collectively summarized as weakly supervised anomaly detection (WSAD) methods. In this study, we present the first comprehensive survey of WSAD methods by categorizing them into the above three weak supervision settings across four data modalities (i.e., tabular, graph, time-series, and image/video data). For each setting, we provide formal definitions, key algorithms, and potential future directions. To support future research, we conduct experiments on a selected setting and release the source code, along with a collection of WSAD methods and data.

研究动机与目标

在标注成本高或不可用时激励异常检测，并识别三种弱监督设置（不完整、不精确、不准确）。
在每种设置下提供正式定义、主干算法和面向各模态的见解。
综述关键挑战和待解决的问题，以指导未来的 WSAD 研究。
发布实验资源，包括代码以及 WSAD 方法和数据集合，以支持复现和比较。

提出的方法

将 WSAD 方法分为三种设置：不完整、不精确、不准确的监督，覆盖四种数据模态（表格、图、时序、图像/视频）。
总结不完整监督的核心算法族群（异常特征表示学习、异常分数学习、图标签传播、主动学习、强化学习）。
总结不精确监督的核心算法族群（基于多实例学习的 MIL 变体、异常回归/设计，以及超越 MIL 的学习策略）。
总结不准确监督的核心算法族群（使用多个带噪标签的集成学习、去噪网络，以及监督修正）。
讨论开放性问题和未来方向，包括跨模态迁移、少样本/元学习、自动超参数调优以及高效的标注获取。

实验结果

研究问题

RQ1在不完整、不精确、不准确的监督下，哪些正式定义可刻画 WSAD？
RQ2在不同模态下的每种 WSAD 设置中，主要的算法族及其优缺点是什么？
RQ3推动 WSAD 研究的常见开放挑战和有前景的方向是什么？
RQ4有哪些资源（代码、数据集）可用于支持 WSAD 方法的复现和进一步研究？

主要发现

本文首次对 WSAD 进行全面综述，按弱监督类型和数据模态对方法进行组织。
它详细介绍了不完整、不精确、不准确监督的正式问题定义、主干算法和未来方向。
它强调了代表性方法及其骨干，如异常特征表示学习、异常分数学习、基于 MIL 的不精确监督，以及用于不准确监督的集成/去噪方法。
在选定的设置上进行了实验以支持未来研究，作者发布了源代码和一组 WSAD 方法与数据。
该综述识别出开放性问题以及跨模态将技术从时序传递到视频 AD 的机会，以及主动学习和元学习作为有希望的方向。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。