[论文解读] On Graph Neural Network Fairness in the Presence of Heterophilous Neighborhoods
本文研究了图邻域中的局部同质性如何影响图神经网络(GNN)的公平性,表明同质性GNN在由单一敏感属性主导的邻域中会加剧不公平性。研究提出,通过设计处理异质性标签模式的异质性GNN——可将公平性提升最多25%而不损失性能,尤其在类别与敏感属性同质性相悖的区域表现更优。
We study the task of node classification for graph neural networks (GNNs) and establish a connection between group fairness, as measured by statistical parity and equal opportunity, and local assortativity, i.e., the tendency of linked nodes to have similar attributes. Such assortativity is often induced by homophily, the tendency for nodes of similar properties to connect. Homophily can be common in social networks where systemic factors have forced individuals into communities which share a sensitive attribute. Through synthetic graphs, we study the interplay between locally occurring homophily and fair predictions, finding that not all node neighborhoods are equal in this respect -- neighborhoods dominated by one category of a sensitive attribute often struggle to obtain fair treatment, especially in the case of diverging local class and sensitive attribute homophily. After determining that a relationship between local homophily and fairness exists, we investigate if the issue of unfairness can be associated to the design of the applied GNN model. We show that by adopting heterophilous GNN designs capable of handling disassortative group labels, group fairness in locally heterophilous neighborhoods can be improved by up to 25% over homophilous designs in real and synthetic datasets.
研究动机与目标
- 本文研究图邻域中的局部同质性如何影响GNN预测的公平性。
- 填补了在局部邻域层面理解公平性的空白,尤其在全局度量可能掩盖子群体不公平性的情况下。
- 本研究旨在评估异质性GNN架构是否相比传统同质性设计能提升公平性。
- 研究分析了由于同质性导致的特征偏差放大,特别是在敏感属性在特征中编码较弱的情况下。
- 旨在通过将邻域结构与公平性结果关联,指导公平GNN的设计,尤其在存在系统性隔离的现实世界网络中。
提出的方法
- 作者设计了一种新颖的合成图生成框架,可控制类别标签、敏感属性和特征偏差中的同质性。
- 通过统计公平性(ΔSP)和等机会(ΔEO)度量,在不同局部同质性水平下评估公平性。
- 在合成图和真实世界图上,对比同质性GNN(如GCN、GAT)与异质性GNN(如H2GCN、FA-GCN)。
- 通过h_s(敏感属性同质性)和h_c(类别同质性)量化局部邻域同质性,实现对两者差异的分析。
- 通过在敏感属性特征编码中改变噪声水平(e),隔离聚合机制的影响。
- 实验在合成数据和真实世界数据集(Pokec和NBA)上进行,公平性在全局和高同质性邻域中分别测量。
实验结果
研究问题
- RQ1节点邻域中的局部同质性如何影响GNN预测的公平性,特别是在由单一敏感属性主导的邻域中?
- RQ2同质性GNN在类别与敏感属性同质性相悖的区域中,其不公平性被放大到何种程度?
- RQ3异质性GNN架构是否能相比同质性模型提升公平性,尤其在局部异质性或同质性相悖的邻域中?
- RQ4当特征中对敏感属性的编码较弱时,这种特征偏差如何被同质性GNN放大?
- RQ5当高局部同质性持续存在时,数据匿名化或对抗性去偏是否足以缓解不公平性?
主要发现
- 在合成数据中,同质性GNN在高敏感属性同质性邻域中显著降低公平性,ΔSP和ΔEO分别较异质性模型下降18%和35%。
- 在合成和真实世界数据集中,异质性GNN相比同质性模型将公平性提升最多25%,尤其在局部同质性相悖区域表现更优。
- 即使敏感属性编码中加入显著噪声(e = 0.25),同质性GNN仍保持高度不公平,表明其对特征偏差有强烈放大效应。
- 尽管初始不公平性较低,异质性模型在公平性度量上仍表现出更大的相对改进,表明其对偏差具有更强鲁棒性。
- 在真实世界数据中,Pokec在低类别同质性区域(h_c < 0.4)表现出显著的公平性差异,尤其当敏感属性同质性较高时。
- 在NBA数据集中,异质性模型将公平性(ΔSP从0.08降至0.04)和准确率(从0.63升至0.72)同时提升,表明性能与公平性之间无权衡。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。