[論文レビュー] Interpretable Graph-Level Anomaly Detection via Contrast with Normal Prototypes
ProtoGLADは、解釈可能なプロトタイプベースのGLADフレームワークを提示し、正常グラフを複数のプロトタイプにクラスタリングし、最も近い正規クラスタからの距離によって異常を検出し、対照的な説明を提供します。
The task of graph-level anomaly detection (GLAD) is to identify anomalous graphs that deviate significantly from the majority of graphs in a dataset. While deep GLAD methods have shown promising performance, their black-box nature limits their reliability and deployment in real-world applications. Although some recent methods have made attempts to provide explanations for anomaly detection results, they either provide explanations without referencing normal graphs, or rely on abstract latent vectors as prototypes rather than concrete graphs from the dataset. To address these limitations, we propose Prototype-based Graph-Level Anomaly Detection (ProtoGLAD), an interpretable unsupervised framework that provides explanation for each detected anomaly by explicitly contrasting with its nearest normal prototype graph. It employs a point-set kernel to iteratively discover multiple normal prototype graphs and their associated clusters from the dataset, then identifying graphs distant from all discovered normal clusters as anomalies. Extensive experiments on multiple real-world datasets demonstrate that ProtoGLAD achieves competitive anomaly detection performance compared to state-of-the-art GLAD methods while providing better human-interpretable prototype-based explanations.
研究の動機と目的
- グラフデータセット内で多数派から逸脱する異常なグラフを特定する。
- 実在の正規プロトタイプと対照させることによって人間が解釈できる説明を提供する。
- GLADにおける多様な正規パターンを捉えるための複数の正規グラフプロトタイプを発見する。
- プロトタイプベースの説明を提供しつつ競争力のある検出性能を維持する。
提案手法
- Weisfeiler-Lehman (WL) スキームと Isolation Kernel (IK) を用いてノード特徴をマッピングし、グラフ埋め込みを取得する。
- 各グラフをノード埋め込みの平均として表現し、固定次元のグラフ表現を得る。
- グラフとグラフ集合(クラスタ分布)との類似度を測るために点集合カーネル(Isolation Kernelを用いる)。
- 高密度なプロトタイプグラフからクラスタを閾値に達するまで成長させて複数の正規プロトタイプを発見する。各グラフをクラスタ平均への最大類似度によって最も近いクラスタへ割り当てる。
- 異常スコアは任意の正規クラスタへの最大点集合類似度として計算し、すべてのクラスタから遠いグラフを異常と識別する。
- ノードレベルの説明は、最も近い正規プロトタイプとの類似度に基づくノードスコアを付与し、異常を生み出す部分構造を強調する。)
実験結果
リサーチクエスチョン
- RQ1データから発見された具体的な正規プロトタイプの集合と対照することにより、グラフレベルの異常を検出できるか?
- RQ2プロトタイプベースのGLADは、潜在ベクトルのプロトタイプや単なる自己参照スコアよりも解釈性の高い説明をもたらすか?
- RQ3WL埋め込み内でデータ依存のIsolation Kernelを使用することが検出性能と解釈性に与える影響は何か?
- RQ4複数の正規プロトタイプは正規性パターンをよりよく捉え、データセット間での頑健性を向上させるか?
主な発見
| Dataset | ProtoGLAD | GLADC | GLocalKD | SIGNET | WL-iForest | OCGTL | GLADPro | Avg Rank |
|---|---|---|---|---|---|---|---|---|
| AIDS | 0.980 ± 0.005 | 0.967 ± 0.005 | 0.969 ± 0.012 | 0.976 ± 0.009 | 0.614 ± 0.031 | 0.975 ± 0.021 | 0.526 ± 0.148 | 1.25 |
| BZR | 0.856 ± 0.005 | 0.678 ± 0.032 | 0.681 ± 0.056 | 0.779 ± 0.069 | 0.528 ± 0.023 | 0.519 ± 0.031 | 0.606 ± 0.095 | 4.63 |
| COX2 | 0.709 ± 0.015 | 0.615 ± 0.044 | 0.602 ± 0.059 | 0.645 ± 0.078 | 0.512 ± 0.033 | 0.598 ± 0.034 | 0.637 ± 0.094 | 3.38 |
| DD | 0.788 ± 0.006 | 0.703 ± 0.034 | 0.753 ± 0.043 | 0.712 ± 0.024 | 0.704 ± 0.011 | 0.711 ± 0.022 | 0.766 ± 0.016 | 2.50 |
| MUTAG | 0.898 ± 0.005 | 0.732 ± 0.021 | 0.833 ± 0.023 | 0.766 ± 0.018 | 0.711 ± 0.002 | 0.657 ± 0.021 | 0.891 ± 0.057 | 1.25 |
| PROTEINS | 0.794 ± 0.026 | 0.699 ± 0.056 | 0.761 ± 0.034 | 0.733 ± 0.034 | 0.621 ± 0.025 | 0.656 ± 0.024 | 0.736 ± 0.029 | 1.25 |
| NCI1 | 0.701 ± 0.024 | 0.683 ± 0.045 | 0.653 ± 0.028 | 0.713 ± 0.044 | 0.504 ± 0.018 | 0.637 ± 0.012 | 0.592 ± 0.006 | 4.13 |
| DHFR | 0.624 ± 0.056 | 0.612 ± 0.026 | 0.618 ± 0.022 | 0.634 ± 0.033 | 0.517 ± 0.015 | 0.598 ± 0.023 | 0.609 ± 0.084 | 4.13 |
- ProtoGLADは8つの実世界データセットを横断して平均順位1.25を達成する。
- ProtoGLADは8データセット中6データセットで最高性能を達成し、残りの2つ(NCI1とDHFR)でも競争力がある。
- Table 1はAIDS、BZR、COX2、DD、MUTAG、PROTEINS、NCI1、DHFRデータセットでより高いAUCを示し、2つの難例でも競争力のある結果を示す。
- ProtoGLADは検出された異常を最も近い正規プロトタイプおよびクラスタと結びつけ、ノードレベルの寄与スコアを含む、明確で対照的な説明を提供する。
- この手法は、SIGNETやGLADProのようなベースラインでは常に提供されない、解釈可能なプロトタイプベースの説明を提供しつつ、競争力のある異常検出性能を示す。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。