Skip to main content
QUICK REVIEW

[논문 리뷰] Weakly Supervised Anomaly Detection: A Survey

Minqi Jiang, Chaochuan Hou|arXiv (Cornell University)|2023. 02. 09.
Anomaly Detection Techniques and Applications인용 수 20
한 줄 요약

이 의견서는 Weakly Supervised Anomaly Detection (WSAD) 방법을 표 형식, 그래프, 시계열, 영상/비디오 데이터에 걸쳐 불완전한 감독, 부정확한 감독, 정확하지 않은 감독으로 분류하고, 정의, 알고리즘, 향후 방향을 자세히 설명하며 코드와 자원을 공개합니다.

ABSTRACT

Anomaly detection (AD) is a crucial task in machine learning with various applications, such as detecting emerging diseases, identifying financial frauds, and detecting fake news. However, obtaining complete, accurate, and precise labels for AD tasks can be expensive and challenging due to the cost and difficulties in data annotation. To address this issue, researchers have developed AD methods that can work with incomplete, inexact, and inaccurate supervision, collectively summarized as weakly supervised anomaly detection (WSAD) methods. In this study, we present the first comprehensive survey of WSAD methods by categorizing them into the above three weak supervision settings across four data modalities (i.e., tabular, graph, time-series, and image/video data). For each setting, we provide formal definitions, key algorithms, and potential future directions. To support future research, we conduct experiments on a selected setting and release the source code, along with a collection of WSAD methods and data.

연구 동기 및 목표

  • 레이블 비용이 많이 들거나 사용 가능하지 않을 때 이상 탐지를 동기부여하고 세 가지 약한 감독 설정(불완전함, 부정확함, 부정확성)을 식별합니다.
  • 각 설정에서 WSAD에 대한 형식적 정의, 백본 알고리즘, 모달리티별 통찰을 제공합니다.
  • 향후 WSAD 연구를 안내하기 위한 주요 도전과제와 해결되지 않은 문제를 조사합니다.
  • 재현성과 비교를 지원하기 위한 코드 및 WSAD 방법 및 데이터 모음 등 실험 자원을 공개합니다.

제안 방법

  • WSAD 방법을 네 가지 데이터 모달리티(tabular, graph, time-series, image/video)에서 불완전한, 정확하지 않은, 부정확한 감독의 세 가지 설정으로 분류합니다.
  • 불완전한 감독에 대한 핵심 알고리즘 계열 요약(이상치 특징 표현 학습, 이상치 점수 학습, 그래프 라벨 전파, 능동 학습, 강화 학습).
  • 부정확한 감독에 대한 핵심 알고리즘 계열 요약(MIL 변형 기반 다중-인스턴스 학습, 이상치 회귀/설계, MIL을 넘어서는 학습 전략).
  • 부정확한 감독에 대한 핵심 알고리즘 계열 요약(다중 노이즈 라벨을 이용한 앙상블 학습, 디노이징 네트워크, 감독 교정).
  • 교차 모달리티 전이, 소샷/메타학습, 자동 하이퍼파라미터 튜닝, 효율적 라벨 획득 등 향후 방향 및 남은 질문을 논의합니다.

실험 결과

연구 질문

  • RQ1불완전한, 부정확한, 정확하지 않은 감독 하에서 WSAD를 특징짓는 형식적 정의는 무엇인가?
  • RQ2다양한 모달리티에서 각 WSAD 설정의 주요 알고리즘 계열과 장단점은 무엇인가?
  • RQ3WSAD 연구를 발전시키기 위한 일반적인 도전과제와 유망한 방향은 무엇인가?
  • RQ4재현을 지원하고 WSAD 방법의 추가 연구를 돕기 위한 리소스(코드, 데이터세트)는 무엇인가?

주요 결과

  • 본 논문은 WSAD의 최초 종합적 설문으로 약한 감독 유형 및 데이터 모달리티별로 방법을 조직합니다.
  • 불완전한, 부정확한, 정확하지 않은 감독에 대한 형식적 문제 정의, 백본 알고리즘, 향후 방향을 자세히 설명합니다.
  • 이상치 특징 표현 학습, 이상치 점수 학습, MIL 기반 부정확한 감독, 정확하지 않은 감독에 대한 앙상블/디노이징 접근법 등의 대표적인 방법 및 백본을 강조합니다.
  • 선정된 설정에서의 실험을 통해 향후 연구를 지원하고, 저자들은 소스 코드와 WSAD 방법 및 데이터 모음을 공개합니다.
  • 이 설문은 시계열과 비디오 AD 간의 기술 이전, 능동 학습 및 메타 학습과 같은 교차 모달리티 기회와 같은 개방 문제 및 가능 방향을 식별합니다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.