[논문 리뷰] On Graph Neural Network Fairness in the Presence of Heterophilous Neighborhoods
이 논문은 그래프 이웃에서 국소적 유사성(호모필리)이 그래프 신경망(GNN)의 공정성에 미치는 영향을 조사한다. 결과적으로, 동일한 민감한 속성이 지배하는 이웃에서는 호모필릭 GNN이 불공정성을 악화시킨다. 이에 따라 이질적(헤테로필릭) GNN 설계—비유사 레이블 패턴을 다룰 수 있도록 설계된 것—는 성능을 희생시키지 않고도 공정성을 최대 25% 향상시킬 수 있으며, 특히 클래스와 민감한 속성 간 유사성이 다를 경우에 효과적이다.
We study the task of node classification for graph neural networks (GNNs) and establish a connection between group fairness, as measured by statistical parity and equal opportunity, and local assortativity, i.e., the tendency of linked nodes to have similar attributes. Such assortativity is often induced by homophily, the tendency for nodes of similar properties to connect. Homophily can be common in social networks where systemic factors have forced individuals into communities which share a sensitive attribute. Through synthetic graphs, we study the interplay between locally occurring homophily and fair predictions, finding that not all node neighborhoods are equal in this respect -- neighborhoods dominated by one category of a sensitive attribute often struggle to obtain fair treatment, especially in the case of diverging local class and sensitive attribute homophily. After determining that a relationship between local homophily and fairness exists, we investigate if the issue of unfairness can be associated to the design of the applied GNN model. We show that by adopting heterophilous GNN designs capable of handling disassortative group labels, group fairness in locally heterophilous neighborhoods can be improved by up to 25% over homophilous designs in real and synthetic datasets.
연구 동기 및 목표
- . 이 논문은 그래프 이웃의 국소적 유사성이 GNN 예측의 공정성에 어떻게 영향을 미치는지 조사한다.
- 전반적인 메트릭이 하위 집단 수준의 불공정성을 가림에도 불구하고, 국소적 이웃 수준에서의 공정성 이해 부족의 격차를 메운다.
- 이 연구는 전통적인 호모필릭 설계에 비해 이질적 GNN 아키텍처가 공정성을 향상시킬 수 있는지 평가하는 것을 목표로 한다.
- 민감한 속성이 특징에 약하게 표현될 경우, 유사성에 의해 특징 편향이 어떻게 악화되는지 분석한다.
- 특히 실생활 네트워크에서 체계적 분리가 존재하는 경우, 이웃 구조와 공정성 결과 간의 연결 고리를 통해 공정한 GNN 설계를 이끌어내는 것이 목적이다.
제안 방법
- . 저자들은 클래스 레이블, 민감한 속성, 특징 편향에서의 유사성을 제어할 수 있는 새로운 합성 그래프 생성 프레임워크를 설계한다.
- . 다양한 수준의 국소적 유사성에서 통계적 평등성(ΔSP)과 동등 기회(ΔEO) 메트릭을 사용해 공정성을 평가한다.
- . 합성 및 실생활 그래프에서 호모필릭 GNNs(GCN, GAT 등)와 이질적 GNNs(H2GCN, FA-GCN 등)를 비교한다.
- . 국소적 이웃 유사성은 민감한 속성 유사성(h_s)과 클래스 유사성(h_c)을 통해 측정되며, 이들의 이질성 분석이 가능해진다.
- . 민감한 속성의 특징 인코딩에서 노이즈 수준(e)을 변화시켜 집합 메커니즘의 영향을 분리한다.
- . 실험은 합성 데이터와 실생활 데이터셋(Pokec 및 NBA)에서 수행되며, 공정성은 전반적 및 고유사성 이웃에서 국소적으로 측정된다.
실험 결과
연구 질문
- RQ1. 노드의 이웃에서 국소적 유사성이 공정성에 어떤 영향을 미치는가? 특히 한 가지 민감한 속성이 지배하는 이웃에서는 어떻게 되는가?
- RQ2. 클래스와 민감한 속성 유사성이 다를 경우, 호모필릭 GNN이 불공정성을 얼마나 악화시키는가?
- RQ3. 이질적 GNN 아키텍처는 국소적으로 이질적 또는 이질성이 있는 이웃에서 기존 호모필릭 모델에 비해 공정성을 향상시킬 수 있는가?
- RQ4. 민감한 속성이 특징에 약하게 표현될 경우, 이에 따른 특징 편향이 호모필릭 GNN에 의해 어떻게 악화되는가?
- RQ5. 높은 국소적 유사성이 지속될 경우, 데이터 익명화나 적대적 편향 제거가 불공정성을 완화하는 데 충분한가?
주요 결과
- . 합성 데이터에서, 민감한 속성 유사성이 높은 이웃에서는 호모필릭 GNN이 공정성을 악화시키며, 이는 이질적 모델 대비 ΔSP가 18%, ΔEO가 35% 감소한 결과를 보였다.
- . 이질적 GNN은 합성 및 실생활 데이터셋에서 호모필릭 모델 대비 공정성을 최대 25% 향상시키며, 특히 국소적 유사성이 다를 경우에 효과적이다.
- . 민감한 속성이 상당한 노이즈(e = 0.25)로 인코딩되어 있어도, 호모필릭 GNN은 높은 불공정성을 유지하며, 특징 편향이 강하게 악화됨을 보여준다.
- . 이질적 모델은 초기 불공정성이 낮음에도 불구하고 공정성 메트릭에서 상대적으로 더 큰 향상을 보이며, 편향에 대한 강건성을 보여준다.
- . 실생활 데이터에서, Pokec는 낮은 클래스 유사성 영역(h_c < 0.4)에서 심각한 공정성 격차를 보였으며, 이는 민감한 속성 유사성이 높을 경우 더욱 두드러졌다.
- . NBA 데이터셋에서는 이질적 모델이 공정성(ΔSP 0.08에서 0.04로)과 정확도(0.63에서 0.72로)를 모두 향상시켜 성능과 공정성 간의 트레이드오프 없이 효과를 입증했다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.