QUICK REVIEW

[논문 리뷰] Interpretable Graph-Level Anomaly Detection via Contrast with Normal Prototypes

Qi Zhao, Kai Ming Ting|arXiv (Cornell University)|2026. 02. 11.

Advanced Graph Neural Networks인용 수 0

한 줄 요약

ProtoGLAD는 정상 그래프를 다수의 프로토타입으로 클러스터링하고 가장 가까운 정상 클러스터까지의 거리로 이상치를 탐지하며 대조적(contrastive) 설명을 제공하는 해석 가능한 프로토타입 기반 GLAD 프레임워크를 제시한다.

ABSTRACT

The task of graph-level anomaly detection (GLAD) is to identify anomalous graphs that deviate significantly from the majority of graphs in a dataset. While deep GLAD methods have shown promising performance, their black-box nature limits their reliability and deployment in real-world applications. Although some recent methods have made attempts to provide explanations for anomaly detection results, they either provide explanations without referencing normal graphs, or rely on abstract latent vectors as prototypes rather than concrete graphs from the dataset. To address these limitations, we propose Prototype-based Graph-Level Anomaly Detection (ProtoGLAD), an interpretable unsupervised framework that provides explanation for each detected anomaly by explicitly contrasting with its nearest normal prototype graph. It employs a point-set kernel to iteratively discover multiple normal prototype graphs and their associated clusters from the dataset, then identifying graphs distant from all discovered normal clusters as anomalies. Extensive experiments on multiple real-world datasets demonstrate that ProtoGLAD achieves competitive anomaly detection performance compared to state-of-the-art GLAD methods while providing better human-interpretable prototype-based explanations.

연구 동기 및 목표

그래프 데이터셋에서 다수의 그래프 중에서 벗어난 이상 그래프를 식별한다.
이상 그래프를 구체적인 정상 프로토타입과 대조시켜 인간이 해석할 수 있는 설명을 제공한다.
GLAD에서 다양한 정상 패턴을 포착하기 위해 다수의 정상 그래프 프로토타입을 발견한다.
프로토타입 기반 설명을 제공하면서도 경쟁력 있는 탐지 성능을 유지한다.

제안 방법

Weisfeiler-Lehman (WL) 스킴으로 그래프를 이스레이션 커널(IK) 매핑된 노드 특징으로 임베딩하여 그래프 임베딩을 얻는다.
각 그래프를 노드 임베딩의 평균으로 표현하여 고정 차원의 그래프 표현을 얻는다.
점집합 커널( Isolation Kernel 포함)로 그래프와 그래프 집합(클러스터 분포) 간의 유사성을 측정한다.
고밀도 프로토타입 그래프에서 클러스터를 threshold가 충족될 때까지 확장하여 다수의 정상 프로토타입을 발견하고, 각 그래프를 클러스터 평균과의 최대 유사도로 가장 가까운 클러스터에 할당한다.
최대 점집합 유사도로 어떤 정상 클러스터에도 속하지 않는 그래프를 이상치로 간주하고 이상치 점수를 산출한다.
가장 가까운 정상 프로토타입과의 유사도에 따라 노드 수준의 점수를 매겨, 이상 유발 서브구조를 강조하여 설명한다.

실험 결과

연구 질문

RQ1데이터에서 발견된 구체적인 정상 프로토타입 집합과 그래프를 대조하여 그래프 수준의 이상치를 탐지할 수 있는가?
RQ2프로토타입 기반 GLAD가 잠재 벡터 프로토타입이나 순전히 자기참조 점수보다 더 해석 가능하고 설명을 제공하는가?
RQ3WL 임베딩 내 데이터 의존적 Isolation Kernel 사용이 탐지 성능과 해석 가능성에 미치는 영향은 무엇인가?
RQ4다수의 정상 프로토타입이 정상성 패턴을 더 잘 포착하고 데이터셋 간 강건성을 향상시키는가?

주요 결과

데이터셋	ProtoGLAD	GLADC	GLocalKD	SIGNET	WL-iForest	OCGTL	GLADPro	평균 순위
AIDS	0.980 ± 0.005	0.967 ± 0.005	0.969 ± 0.012	0.976 ± 0.009	0.614 ± 0.031	0.975 ± 0.021	0.526 ± 0.148	1.25
BZR	0.856 ± 0.005	0.678 ± 0.032	0.681 ± 0.056	0.779 ± 0.069	0.528 ± 0.023	0.519 ± 0.031	0.606 ± 0.095	4.63
COX2	0.709 ± 0.015	0.615 ± 0.044	0.602 ± 0.059	0.645 ± 0.078	0.512 ± 0.033	0.598 ± 0.034	0.637 ± 0.094	3.38
DD	0.788 ± 0.006	0.703 ± 0.034	0.753 ± 0.043	0.712 ± 0.024	0.704 ± 0.011	0.711 ± 0.022	0.766 ± 0.016	2.50
MUTAG	0.898 ± 0.005	0.732 ± 0.021	0.833 ± 0.023	0.766 ± 0.018	0.711 ± 0.002	0.657 ± 0.021	0.891 ± 0.057	1.25
PROTEINS	0.794 ± 0.026	0.699 ± 0.056	0.761 ± 0.034	0.733 ± 0.034	0.621 ± 0.025	0.656 ± 0.024	0.736 ± 0.029	1.25
NCI1	0.701 ± 0.024	0.683 ± 0.045	0.653 ± 0.028	0.713 ± 0.044	0.504 ± 0.018	0.637 ± 0.012	0.592 ± 0.006	4.13
DHFR	0.624 ± 0.056	0.612 ± 0.026	0.618 ± 0.022	0.634 ± 0.033	0.517 ± 0.015	0.598 ± 0.023	0.609 ± 0.084	4.13

ProtoGLAD은 여덟 개 실제 데이터셋에서 평균 순위 최상위(1.25)를 달성한다.
ProtoGLAD은 8개 데이터셋 중 6개의 데이터셋에서 최고 성능을 달성하고, 남은 두 개(NCI1 및 DHFR)에서는 경쟁력을 보인다.
표 1은 AIDS, BZR, COX2, DD, MUTAG, PROTEINS, NCI1, DHFR 데이터셋에서 더 높은 AUC를 제공하고 두 가지 어려운 경우에서도 경쟁력을 갖춘 ProtoGLAD를 보여준다.
ProtoGLAD는 탐지된 이상치를 가장 가까운 정상 프로토타입 및 클러스터와 연결하고 노드 수준 기여 점수를 포함하여 명확하고 대조적인 설명을 제공한다.
본 방법은 SIGNET이나 GLADPro와 같은 베이스라인에서 항상 존재하는 것이 아니더라도 해석 가능한 프로토타입 기반 설명을 제공하면서 경쟁력 있는 이상 탐지 성능을 보여준다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.