QUICK REVIEW

[논문 리뷰] On Explainability of Graph Neural Networks via Subgraph Explorations

Hao Yuan, Haiyang Yu|arXiv (Cornell University)|2021. 02. 09.

Explainable Artificial Intelligence (XAI)참고 문헌 49인용 수 89

한 줄 요약

SubgraphX는 Monte Carlo Tree Search와 Shapley-값 기반 스코어링을 사용하여 중요한 연결된 부분그래프를 식별함으로써 GNN 예측을 설명하고, 효율적인 근사치를 통해 합리적인 계산으로 설명의 품질을 향상시킨다.

ABSTRACT

We consider the problem of explaining the predictions of graph neural networks (GNNs), which otherwise are considered as black boxes. Existing methods invariably focus on explaining the importance of graph nodes or edges but ignore the substructures of graphs, which are more intuitive and human-intelligible. In this work, we propose a novel method, known as SubgraphX, to explain GNNs by identifying important subgraphs. Given a trained GNN model and an input graph, our SubgraphX explains its predictions by efficiently exploring different subgraphs with Monte Carlo tree search. To make the tree search more effective, we propose to use Shapley values as a measure of subgraph importance, which can also capture the interactions among different subgraphs. To expedite computations, we propose efficient approximation schemes to compute Shapley values for graph data. Our work represents the first attempt to explain GNNs via identifying subgraphs explicitly and directly. Experimental results show that our SubgraphX achieves significantly improved explanations, while keeping computations at a reasonable level.

연구 동기 및 목표

노드/엣지 설명을 넘어서는 GNN에서 부분그래프 수준 설명의 필요성을 제시한다.
GNN 예측을 설명하는 중요한 연결된 부분그래프를 식별하기 위한 SubgraphX를 제안한다.
부분그래프 탐색을 위한 효율적인 Shapley-값 기반 스코어링 및 Monte Carlo Tree Search 프레임워크를 개발한다.
그래프 분류 및 노드 분류 작업에서 효과성과 효율성을 입증한다.

제안 방법

설명을 크기 상한 아래에서 가장 중요한 연결된 부분그래프를 찾는 문제로 형식화한다. 이때 Score(f, G, Gi)를 사용한다.
부분그래프를 탐색하기 위해 몬테카를로 트리 탐색(MCTS)을 사용하여 부분그래프를 탐색하고 가지치기 기반의 액션과 UCB에서 영감을 받은 선택 규칙을 적용한다.
그래프 구조 간의 상호작용을 포착하기 위해 Shapley 값을 부분그래프 중요도 점수로 채택한다.
Shapley 값을 근사화하기 위해 상호작용을 L홉 이웃으로 제한하고 연합에 대해 몬테카를로 샘플링을 수행한다.
그래프 구조를 보존하면서 f를 평가하기 위해 입력에 제로 패딩으로 교란을 적용하여 주변 기여를 계산한다.

실험 결과

연구 질문

RQ1부분그래프 수준의 설명이 GNN에 대해 노드/엣지 설명보다 더 직관적이고 신뢰할 만한 인사이트를 제공할 수 있는가?
RQ2그래프 구성요소 간의 상호작용을 반영하기 위해 부분그래프 중요도를 어떻게 정량화할 수 있는가?
RQ3Shapley-값 기반 점수를 사용하는 SubgraphX의 경우 설명 충실도와 계산 효율성 간의 트레이드오프는 무엇인가?
RQ4그래프 분류 및 노드/링크 예측 작업에서 SubgraphX의 성능은 어느 정도인가?
RQ5실제 그래프에서 Shapley 값 계산을 확장 가능하게 만들기 위한 실용적인 근사 방법은 무엇인가?

주요 결과

SubgraphX는 고립된 엣지나 노드가 아니라 연결된 부분그래프를 식별함으로써 인간이 더 쉽게 이해할 수 있는 설명을 제공한다.
Shapley-값 스코어링은 부분그래프 간의 상호작용을 포착하고 충실한 설명을 제공한다.
근사 방법(L-홉 가지치기 및 몬테카를로 연합 샘플링)을 사용하면 SubgraphX는 정확한 Shapley 계산에 비해 비용은 크게 줄이면서도 충실도에서 경쟁력을 가진다.
BA-2Motifs 및 MUTAG 같은 그래프에서 SubgraphX는 실제 모티프나 화학적으로 관련된 그룹에 해당하는 주요 부분구조를 국지화한다.
데이터셋과 모델(GCN/GAT/GIN) 전반에 걸쳐 SubgraphX는 매칭된 희소성 수준에서 기초선보다 충실도 면에서 앞서며 합리적인 실행 시간을 보인다.
SubgraphX 설명은 그래프 분류, 노드 분류 및 링크 예측 작업에 계속 적용할 수 있다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.