Skip to main content
QUICK REVIEW

[논문 리뷰] Partitioning Message Passing for Graph Fraud Detection

Wei Zhuo, Zemin Liu|arXiv (Cornell University)|2024. 11. 16.
Graph Labeling and Dimension Problems인용 수 7
한 줄 요약

Partitioning Message Passing (PMP) 은 그래프에서 이웃 클래스를 구분하여 GNN 집계의 라벨 불균형과 이질적 호모필리/헤테로필리 문제를 해결합니다. 노드별로 클래스 인식 필터와 루트-특정 가중치 생성기를 사용하여 사기 이웃과 정상 이웃으로부터 정보를 적응적으로 융합합니다.

ABSTRACT

Label imbalance and homophily-heterophily mixture are the fundamental problems encountered when applying Graph Neural Networks (GNNs) to Graph Fraud Detection (GFD) tasks. Existing GNN-based GFD models are designed to augment graph structure to accommodate the inductive bias of GNNs towards homophily, by excluding heterophilic neighbors during message passing. In our work, we argue that the key to applying GNNs for GFD is not to exclude but to {\em distinguish} neighbors with different labels. Grounded in this perspective, we introduce Partitioning Message Passing (PMP), an intuitive yet effective message passing paradigm expressly crafted for GFD. Specifically, in the neighbor aggregation stage of PMP, neighbors with different classes are aggregated with distinct node-specific aggregation functions. By this means, the center node can adaptively adjust the information aggregated from its heterophilic and homophilic neighbors, thus avoiding the model gradient being dominated by benign nodes which occupy the majority of the population. We theoretically establish a connection between the spatial formulation of PMP and spectral analysis to characterize that PMP operates an adaptive node-specific spectral graph filter, which demonstrates the capability of PMP to handle heterophily-homophily mixed graphs. Extensive experimental results show that PMP can significantly boost the performance on GFD tasks.

연구 동기 및 목표

  • 레이블 불균형과 이질 혼합(헤테로필리-호모필리)을 가진 그래프에서 강인한 사기 탐지를 유도한다.
  • 에지(edge)를 제외하지 않고 이웃 레이블 정보를 활용하는 메시지 패싱 패러다임을 개발한다.
  • 노드별, 클래스 인식 필터와 가중치 생성기를 통해 집계를 적응적으로 만든다.
  • 공간적 PMP 의 형태와 노드-특정 스펙트럴 필터링 간 이론적 연계를 제공한다.
  • 여러 데이터셋에서 최첨단 GFD 방법 대비 실험적 이점을 입증한다.

제안 방법

  • 이웃을 클래스별로 분할하여 사기, 정상, 미라벨(neutral/unlabeled) 이웃에 대해 각각의 집계 함수를 사용한다.
  • 미라벨 이웃은 중심 노드 의존 가중치 alpha_i^l 로 사기와 정상 집계의 가중 결합으로 표현된다.
  • 중심 노드 표현으로부터 노드특정 W_fr,i 와 W_be,i 를 생성하는 가중치 생성기 Psi_fr 와 Psi_be 를 도입한다.
  • 노드별로 g_fr^i(L) 와 g_be^i(L) 를 이용한 적응적 노드별 스펙트럴 필터로 PMP 를 모델링하여 헤테로필리-호모필리 적응을 가능하게 한다.
  • R 관계에 걸친 미니배치 학습으로 학습하고 관계별 노드 표현을 연결(concatenation) 풀링과 MLP 로 결합한다.

실험 결과

연구 질문

  • RQ1그래프 augmentation 없이 그래프 사기 탐지에서 GNN 이 라벨 불균형을 효과적으로 다룰 수 있는가?
  • RQ2단일 프레임워크가 호모필리-헤테로필리 이웃의 영향을 구별하여 사기 탐지 정확도를 향상시킬 수 있는가?
  • RQ3노드별 클래스 인식 집계 가중치가 불균형 그래프에서 사기 패턴에 대한 강건성을 향상시키는가?
  • RQ4PMP 의 공간적 형식과 스펙트럴 그래프 필터링 사이의 이 theoretical 관계는 무엇인가?
  • RQ5PMP 기반 모델이 벤치마크 데이터셋에서 기존 GFD 방법보다 우수한가?

주요 결과

  • PMP 는 Yelp, Amazon, T-Finance, T-Social 데이터세트에서 AUC, F1-Macro, G-Mean 등의 다양한 지표에서 일관되게 baseline 방법을 능가한다.
  • 메시지 패싱 중 사기 이웃과 정상 이웃을 구별하는 것이 균일한 집계보다 성능을 향상시킨다.
  • 미라벨 이웃의 가중 결합을 통한 적응적 혼합은 에지 라벨의 불확실성을 더 잘 다룬다.
  • 루트-특정 노드생성 가중치 매트릭스는 지역 그래프 구조에 대한 노드별 적응을 가능하게 하여 소수 클래스 신호 전달을 강화한다.
  • 이론적 분석은 PMP 가 노드별 스펙트럴 필터를 구현하여 헤테로필리-호모필리 혼합에 적응적으로 대응함을 보인다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.