QUICK REVIEW

[논문 리뷰] Uncertainty in Graph Neural Networks: A Survey

Fangxin Wang, Yuqing Liu|arXiv (Cornell University)|2024. 03. 11.

Neural Networks and Applications인용 수 7

한 줄 요약

그래프 신경망(GNN)에서의 불확실성에 대한 포괄적 조사로, 불확실성의 원천, 정량화 방법, 평가 지표, 그리고 하위 작업에서 불확실성을 활용하는 방법을 상세히 다룸.

ABSTRACT

Graph Neural Networks (GNNs) have been extensively used in various real-world applications. However, the predictive uncertainty of GNNs stemming from diverse sources such as inherent randomness in data and model training errors can lead to unstable and erroneous predictions. Therefore, identifying, quantifying, and utilizing uncertainty are essential to enhance the performance of the model for the downstream tasks as well as the reliability of the GNN predictions. This survey aims to provide a comprehensive overview of the GNNs from the perspective of uncertainty with an emphasis on its integration in graph learning. We compare and summarize existing graph uncertainty theory and methods, alongside the corresponding downstream tasks. Thereby, we bridge the gap between theory and practice, meanwhile connecting different GNN communities. Moreover, our work provides valuable insights into promising directions in this field.

연구 동기 및 목표

GNN에서의 예측 불확실성의 원천을 식별하고 분류하기 (알레이터릭, 에피스테믹, 분포적 및 기타 등).
단일 결정론적 모델, 매개변수가 무작위인 단일 모델, 그리고 앙상블을 포함한 GNN의 불확실성 정량화 방법을 검토합니다.
정량화된 불확실성이 다운스트림 그래프 작업과 신뢰성 향상에 어떻게 활용되는지 매핑합니다(예: 능동학습, OOD 탐지, 이상 탐지).
이론적 불확실성 프레임워크를 실용적 그래프 학습 애플리케이션과 연결하고 향후 연구 방향을 제시합니다.

제안 방법

불확실성 정량화 방법을 세 가지 계열로 분류합니다: 단일 결정론적 모델(직접, 베이지안 기반, 빈도론 기반), 매개변수가 무작위인 단일 모델(베이지안 방법, MC 샘플링), 그리고 앙상블/다른 접근법.
불확실성 평가 지표를 논의합니다(예측 불확실성, 상호정보량을 통한 모델/데이터 불확실성, OOD 탐지를 위한 분포적 불확실성) 및 보편적 지표의 부재를 언급합니다.
그래프 능동학습과 자체학습에서 노드 선택 시 불확실성의 사용을 설명합니다. 엔트로피, 정보 밀도, 다양성 지표 포함.
노드- 간선- 그래프 수준의 불확실성 인식 GNN 모델링을 조사합니다. DropEdge, 그래프 가우시안 프로세스, 베이지안 GNN과 같은 메커니즘 포함.

Figure 1: Overall Framework: (1) identifying sources of uncertainty (Section 2 ), (2) quantifying uncertainty (Section 3 ) and (3) utilizing uncertainty for downstream tasks (Section 4 ).

실험 결과

연구 질문

RQ1그래프 신경망에서의 불확실성의 뚜렷한 원천은 무엇이며 어떻게 분류할 수 있는가(알레이터릭, 에피스테믹, 분포적, 공허성, 불일치 등)?
RQ2GNN에서 불확실성을 정량화하는 방법은 무엇이며 모델 가정과 계산 비용 측면에서 어떻게 다른가?
RQ3정량화된 불확실성을 다운스트림 그래프 작업(예: 능동학습, 이상 탐지, OOD 탐지, 강건성)에 어떻게 효과적으로 활용할 수 있는가?

주요 결과

GNN의 불확실성은 데이터의 무작위성, 모델 학습 오차, 분포적 변화에서 비롯되며 알레이터릭, 에피스테믹, 분포적 원천으로 분류할 수 있다.
베이지안 및 앙상블 방법은 더 풍부한 불확실성 추정치를 제공하지만 계산 비용이 더 크고, 직접적인 및 빈도론적 접근은 효율성을 제공하지만 보정 품질은 다를 수 있다.
불확실성 평가의 적합성은 작업과 원천에 따라 다르며, 최대 소프트맥스 확률, 엔트로피, 상호정보량, 보정 기반 측정치 등이 있지만 보편적 표준은 없다.
노드-, 간선-, 그래프 수준의 불확실성 인식 기법(예: ConfGCN, DropEdge, UaGGP)은 그래프 학습에서 견고성, OOD 탐지 및 해석 가능성을 다룬다.
그래프에서의 능동학습과 자체학습은 불확실성 신호의 이점을 얻으며 대표성과 다양성과의 결합으로 분포 변화에 따른 문제를 완화한다.
이상 탐지(OOD, 이상값, 잘못 분류)에 대한 불균형 여부와 다양한 불확실성 정량 방법을 선택하고 적용하기 위한 체계적 프레임워크가 필요하다.

Figure 2: Bridge uncertainty quantification models and evaluation methods by uncertainty sources. The diamond shape represents the separation of uncertainty sources. Quantification models linked to any diamond indicate their ability to separate the corresponding uncertainty source. We merge "Model U

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.