Skip to main content
QUICK REVIEW

[논문 리뷰] Uncertainty Quantification over Graph with Conformalized Graph Neural Networks

Kexin Huang, Ying Jin|arXiv (Cornell University)|2023. 05. 23.
Advanced Graph Neural Networks인용 수 13
한 줄 요약

CF-GNN은 그래프-구조 데이터에 컨폼얼 예측(conformal prediction)을 확장하여 목표 커버리지와 주목할 만한 효율성 개선(최대 74%)을 보장하는 불확실성 집합을 제공한다.

ABSTRACT

Graph Neural Networks (GNNs) are powerful machine learning prediction models on graph-structured data. However, GNNs lack rigorous uncertainty estimates, limiting their reliable deployment in settings where the cost of errors is significant. We propose conformalized GNN (CF-GNN), extending conformal prediction (CP) to graph-based models for guaranteed uncertainty estimates. Given an entity in the graph, CF-GNN produces a prediction set/interval that provably contains the true label with pre-defined coverage probability (e.g. 90%). We establish a permutation invariance condition that enables the validity of CP on graph data and provide an exact characterization of the test-time coverage. Moreover, besides valid coverage, it is crucial to reduce the prediction set size/interval length for practical use. We observe a key connection between non-conformity scores and network structures, which motivates us to develop a topology-aware output correction model that learns to update the prediction and produces more efficient prediction sets/intervals. Extensive experiments show that CF-GNN achieves any pre-defined target marginal coverage while significantly reducing the prediction set/interval size by up to 74% over the baselines. It also empirically achieves satisfactory conditional coverage over various raw and network features.

연구 동기 및 목표

  • 그래프 신경망(GNNs)의 엄밀한 불확실성 추정치의 부재를 해결한다.
  • 전이(transductive) 그래프 설정에 컨폼얼 예측(CP)을 확장하여 보장된 커버리지를 얻는다.
  • 그래프 교환성(graph exchangeability)과 순열 불변성(permutation invariance) 하에서 테스트 시 커버리지를 특성화한다.
  • CP 비효율성을 감소시키기 위한 토폴로지 인지 보정(topology-aware correction)을 도입한다.
  • 다양한 그래프 데이터셋에서 경험적 타당성과 효율성 향상을 입증한다.

제안 방법

  • 보정 샘플과 테스트 샘플의 순서에 불변인 비적합도 점수 V를 사용하는 분할 컨폼얼 예측(split conformal prediction)을 사용한다(가정 1에 따라).
  • 타당성 입증: 그래프 교환성 하에서 CP는 커버리지가 최소 1-α이 되도록 하고 테스트 시 커버리지를 정확히 특성화한다(정리 3).
  • CF-GNN 도입: 이웃 정보를 활용하여 CP 비효율성을 줄이기 위해 기본 GNN 예측을 후처리하는 보정 GNN.
  • 보정 GNN을 해석가능한 비효율성 손실(differentiable inefficiency loss)로 훈련시키고, CP 집합 크기/구간을 시뮬레이션하며, held-out 보정 분할을 사용한다.
  • 두 가지 일반적인 비적합도 점수(분류용 Adaptive Prediction Set, CQR 회귀용)를 V의 예시로 제시한다.
  • 기저 훈련 과정을 변경하지 않고도 모든 사전 학습된 GNN과의 호환성을 유지한다.

실험 결과

연구 질문

  • RQ1컨폼얼 예측이 그래프의 전이형 GNN에 대해 유효하고 목표 커버리지를 갖는 불확실성 집합을 제공할 수 있는가?
  • RQ2그래프 기반 데이터 분할과 순열 불변성 하에서 정확한 테스트 시 커버리지 분포는 무엇인가?
  • RQ3커버리지를 해치지 않으면서 그래프에서 CP의 비효율성(집합 크기 또는 구간 길이)을 어떻게 줄일 수 있는가?
  • RQ4이웃 정보를 집계하는 토폴로지 인지 보정이 다양한 데이터셋과 GNN 아키텍처에서 CP 효율성을 향상시키는가?
  • RQ5CF-GNN 예측이 네트워크 특성에 대해 만족스러운(근사) 조건부 커버리지를 유지하는가?

주요 결과

  • CF-GNN은 기본 UQ 방법이 목표에 도달하지 못하는 데이터셋에서 목표 경험적 한계 커버리지를 달성하여 통계적 타당성을 입증한다.
  • 예측 집합/구간 크기가 기본 GNN에 대한 직접 CP와 비교하여 상당히 감소했다(최대 74%).
  • 이 방법은 순열 불변성과 그래프 교환성을 보존하여 유효한 커버리지 보장을 뒷받침한다.
  • CF-GNN은 다양한 그래프 특징에 대해 만족스러운 조건부 커버리지를 보여줘 실용적 신뢰성을 나타낸다.
  • 효율성 향상은 실험에서 사용된 기본 모델을 넘어서 여러 GNN 아키텍처에서도 일반화된다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.