[논문 리뷰] Robust Counterfactual Explanations on Graph Neural Networks
RCExplainer를 도입하여 GNN의 일반적 결정 영역을 선형 결정 경계로 모델링하고 엣지 기반 설명 네트워크를 학습시켜 강건하고 간결한 엣지 서브셋으로 견고한 반사실적 설명을 생성한다.
Massive deployment of Graph Neural Networks (GNNs) in high-stake applications generates a strong demand for explanations that are robust to noise and align well with human intuition. Most existing methods generate explanations by identifying a subgraph of an input graph that has a strong correlation with the prediction. These explanations are not robust to noise because independently optimizing the correlation for a single input can easily overfit noise. Moreover, they do not align well with human intuition because removing an identified subgraph from an input graph does not necessarily change the prediction result. In this paper, we propose a novel method to generate robust counterfactual explanations on GNNs by explicitly modelling the common decision logic of GNNs on similar input graphs. Our explanations are naturally robust to noise because they are produced from the common decision boundaries of a GNN that govern the predictions of many similar input graphs. The explanations also align well with human intuition because removing the set of edges identified by an explanation from the input graph changes the prediction significantly. Exhaustive experiments on many public datasets demonstrate the superior performance of our method.
연구 동기 및 목표
- 고위험 GNN 애플리케이션에서 반사실적이고 강건한 설명의 필요성을 동기부여한다.
- 다수의 유사한 그래프에서 GNN의 일반적인 결정 논리를 선형 결정 경계(LDB)로 모델링하여 결정 영역을 형성한다.
- 노이즈에 대해 안정적이면서도 예측을 바꾸는 최소한의 엣지 서브셋을 얻을 수 있는 학습 목표를 개발한다.
- 새 그래프에 대해 재학습이 필요하지 않은 빠른 엔드투엔드 설명 생성을 가능하게 한다.
- 충실도, 강건성, 정확도 및 효율성을 최신 baselines와 비교한 포괄적 실증 증거를 제공한다.
제안 방법
- 마지막 층 비선형성으로부터의 선형 결정 경계의 부분집합에 의해 유도되는 볼록 다면체(결정 영역)로 GNN 결정 논리를 모델링한다.
- LDB를 샘플링하고 Submodular Cost Submodular Cover 문제를 해결하여 영역 외부의 잘못 분류를 제로로 하여 영역을 최대한 많이 차지하도록 결정 영역을 추출한다.
- 그리디 경계 선택으로 결정 영역을 구성하고 여러 클래스를 커버하도록 영역을 벗겨낸다.
- GNN의 마지막 합성 계층에서 얻은 노드 임베딩을 기반으로 엣지 우선순위 M_ij를 출력하는 엣지-설명 네트워크 f_theta를 학습시켜 M_ij > 0.5인 엣지들로 S를 구성한다.
- 엔드투엔드 손실을 L_same(같은 결정 영역에 대한 G_theta의 일관성), L_opp(G_prime_theta와의 반사실 대조)와 희소성 및 이산성 규제항들로 정의하여 희소하고 거의 이진인 설명 행렬을 얻는다.
- 설명에 대한 시간 복잡도는 O(|E|)이며, 해설기 네트워크를 재학습 없이 재사용할 수 있으므로 추론 효율성이 높음을 논의한다.
실험 결과
연구 질문
- RQ1비교 가능한 그래프들에서 공통의 결정 영역을 활용하여 GNN에 대해 강건한 반사실적 설명을 도출할 수 있는가?
- RQ2GNN에서 샘플링된 선형 결정 경계가 입력 노이즈에 대해 안정적이고 전이 가능한 설명을 제공하는가?
- RQ3엣지 기반 설명 프레임워크는 충실도, 강건성 및 효율성 측면에서 기존 GNN 설명 방법과 어떻게 비교되는가?
- RQ4엔드투엔드로 학습된 설명기가 보지 못한 그래프에 일반화될 수 있는 희소하고 reliably한 반사실적 엣지 세트를 생성할 수 있는가?
주요 결과
- RCExplainer는 다양한 희소도에서 데이터세트에 대해 우수한 충실도(반사실 강도)를 달성한다.
- RCExplainer가 생성한 설명은 입력 노이즈에 더 강건하여 강건성 평가에서 더 높은 AUC를 보인다.
- 결정 영역 기반 설명(LDB)을 사용하면 공통 논리에 의존하지 않는 방법보다 충실도가 향상된다.
- 엣지 기반 설명은 빠른 추론과 함께 O(|E|)의 시간 복잡도로 빠르게 엔드투엔드 학습이 가능하다.
- baselines와 비교할 때 RCExplainer와 RCExp-NoLDB는 설명 생성에 선형 결정 경계를 통합하는 이점을 보여준다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.