[논문 리뷰] Set Features for Fine-grained Anomaly Detection
SINBAD 모델은 각 샘플을 무작위 방향의 히스토그램 프로젝션과 가우시안(또는 kNN) 밀도 추정을 사용하여 학습 없이도 미세한 조합 이상치를 탐지합니다.
Fine-grained anomaly detection has recently been dominated by segmentation based approaches. These approaches first classify each element of the sample (e.g., image patch) as normal or anomalous and then classify the entire sample as anomalous if it contains anomalous elements. However, such approaches do not extend to scenarios where the anomalies are expressed by an unusual combination of normal elements. In this paper, we overcome this limitation by proposing set features that model each sample by the distribution its elements. We compute the anomaly score of each sample using a simple density estimation method. Our simple-to-implement approach outperforms the state-of-the-art in image-level logical anomaly detection (+3.4%) and sequence-level time-series anomaly detection (+2.4%).
연구 동기 및 목표
- 정상 요소들의 비정상적인 조합에서 발생하는 이상치를 탐지할 필요성을 제기한다.
- 샘플을 순서에 상관없는 집합으로 기술하고, 요소의 배치를 무시하며 분포 특성을 포착하는 방법을 제안한다.
- 세트 디스크립터를 이용한 간단하고 효과적인 밀도 추정 기반 이상치 점수를 제공한다.
- 훈련이나 데이터 증강 없이 이미지 수준의 논리적 이상치(MVTec-LOCO) 및 시계열 데이터 세트에서 최첨단 성능을 보여준다.
제안 방법
- 각 샘플을 요소들의 집합(이미지 패치 또는 시계열 창)으로 표현한다.
- 사전 학습된 네트워크나 수작업 특징을 사용하여 요소 특징을 추출한다.
- 다수의 무작위 방향으로 요소를 투사하고 값을 1차원 히스토그램으로 구간화하여 세트당 히스토그램을 계산한다; 투사 방향과 특징 차원에 걸쳐 이를 연결한다.
- 가우시안 밀도 추정기로 정상 데이터를 추정하고 음의 로그 우도(Mahalanobis 거리 또는 kNN 화이트닝)에 의한 이상치 점수를 매긴다.
- 다중 해상도 수준에서 적용한다(이미지의 서로 다른 ResNet 블록; 시계열의 윈도우 피라미드) 및 점수를 융합한다.
- 지역화된 이상치를 다루기 위해 다중 크롭을 사용하고 프로젝션 및 수준 간 점수를 결합한다.
실험 결과
연구 질문
- RQ1세그먼트 수준이나 전역 평균에 의존하지 않고 샘플의 요소 분포를 무작위 순서의 집합으로 모델링하여 이상치를 탐지할 수 있는가?
- RQ2세트 요소의 임의 프로젝션 히스토그램 표현이 이미지 및 시계열 데이터에서 미세한 또는 논리적 이상치에 대해 판별력을 제공하는가?
- RQ3세트 특징의 단순한 밀도 추정 기반 점수가 MVTec-LOCO와 시계열 데이터 세트에서 최첨단의 분할 기반 및 재구성 기반 방법과 어떻게 비교되는가?
주요 결과
| 클래스 | f-AnoGAN | MNAD | ST | SPADE | PCore | GCAD | SINBAD |
|---|---|---|---|---|---|---|---|
| Breakfast box | 69.4 | 59.9 | 68.9 | 81.8 | 77.7 | 87.0 | 96.5 |
| Juice bottle | 82.4 | 70.5 | 82.9 | 91.9 | 83.7 | 100.0 | 96.6 |
| Pushpins | 59.1 | 51.7 | 59.5 | 60.5 | 62.2 | 97.5 | 83.4 |
| Screw bag | 49.7 | 60.8 | 55.5 | 46.8 | 55.3 | 56.0 | 78.6 |
| Splicing connectors | 68.8 | 57.6 | 65.4 | 73.8 | 63.3 | 89.7 | 89.3 |
| Avg. Logical | 65.9 | 60.1 | 66.4 | 71.0 | 69.0 | 86.0 | 88.9 |
| Breakfast box (Structural) | 50.7 | 60.2 | 68.4 | 74.7 | 74.8 | 80.9 | 87.5 |
| Juice bottle (Structural) | 77.8 | 84.1 | 99.3 | 84.9 | 86.7 | 98.9 | 93.1 |
| Pushpins (Structural) | 74.9 | 76.7 | 90.3 | 58.1 | 77.6 | 74.9 | 74.2 |
| Screw bag (Structural) | 46.1 | 56.8 | 87.0 | 59.8 | 86.6 | 70.5 | 92.2 |
| Splicing connectors (Structural) | 63.8 | 73.2 | 96.8 | 57.1 | 68.7 | 78.3 | 76.7 |
| Avg. Structural | 62.7 | 70.2 | 88.3 | 66.9 | 78.9 | 80.7 | 84.7 |
| Avg. Total | 64.3 | 65.1 | 77.4 | 68.9 | 74.0 | 83.4 | 86.8 |
- 세트 기반 특징이 MVTec-LOCO에서 이미지 수준의 논리적 이상 탐지에서 최첨단을 능가한다.
- 시계열 이상 탐지에서 이 방법은 증강이나 학습 없이도 강한 성과를 보이며 심층 베이스라인과 비교할 때 유리하다.
- 무작위 방향 히스토그램 디스크립터가 단순 평균보다 정상 집합과 이상 집합 간의 분포 차이를 더 효과적으로 포착한다.
- kNN 화이트닝 또는 가우시안 모델링이 마할라노비스 스타일 점수를 사용하는 것이 순수 가우시안 점수보다 강건함을 향상시킨다.
- 다중-다층(여러 ResNet 레벨, 여러 시계열 윈도우 스케일) 및 크롭 기반 앙상블이 국부적 이상 탐지에서 성능을 향상시킨다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.