Skip to main content
QUICK REVIEW

[论文解读] A Comprehensive Survey on Trustworthy Graph Neural Networks: Privacy, Robustness, Fairness, and Explainability

Enyan Dai, Tianxiang Zhao|arXiv (Cornell University)|Apr 18, 2022
Adversarial Robustness in Machine Learning被引用 67
一句话总结

一个全面的综述,覆盖可信任的 GNNs 在隐私、鲁棒性、公平性和可解释性方面;提供分类体系、框架和未来方向。

ABSTRACT

Graph Neural Networks (GNNs) have made rapid developments in the recent years. Due to their great ability in modeling graph-structured data, GNNs are vastly used in various applications, including high-stakes scenarios such as financial analysis, traffic predictions, and drug discovery. Despite their great potential in benefiting humans in the real world, recent study shows that GNNs can leak private information, are vulnerable to adversarial attacks, can inherit and magnify societal bias from training data and lack interpretability, which have risk of causing unintentional harm to the users and society. For example, existing works demonstrate that attackers can fool the GNNs to give the outcome they desire with unnoticeable perturbation on training graph. GNNs trained on social networks may embed the discrimination in their decision process, strengthening the undesirable societal bias. Consequently, trustworthy GNNs in various aspects are emerging to prevent the harm from GNN models and increase the users' trust in GNNs. In this paper, we give a comprehensive survey of GNNs in the computational aspects of privacy, robustness, fairness, and explainability. For each aspect, we give the taxonomy of the related methods and formulate the general frameworks for the multiple categories of trustworthy GNNs. We also discuss the future research directions of each aspect and connections between these aspects to help achieve trustworthiness.

研究动机与目标

  • 提出关于 GNNs 的隐私攻击与防御的全面分类体系。
  • 评估鲁棒性以及攻击/防御机制,包括可扩展攻击和自解释的 GNNs。
  • 分析图结构数据中的公平性问题,并提出公平的 GNN 模型。
  • 总结 GNNs 的可解释性方法及其与其他可信度维度的相互作用。
  • 讨论隐私、鲁棒性、公平性和可解释性之间的未来方向和联系。

提出的方法

  • 引入标准符号和 GNN 基础知识以框架可信度。
  • 提供隐私攻击的分类体系,包括成员资格推断、重构、属性推断和模型提取,并给出攻击者知识设定(白盒/黑盒)。
  • 描述使用影子数据集和攻击模型的隐私攻击统一监督框架。
  • 总结隐私保护的 GNN 方法(例如差分隐私、联邦学习、去学习、对抗隐私)及其在图数据上的适用性。
  • 综述鲁棒性、攻击的可扩展性、图后门攻击及防御。
  • 综述公平性定义和公平 GNN 模型,并讨论可解释性方法及挑战。
  • 突出隐私、鲁棒性、公平性和可解释性之间的相互作用与跨领域联系。

实验结果

研究问题

  • RQ1GNNs 存在哪些隐私风险,哪些攻击类型威胁到图结构数据和模型?
  • RQ2哪些防御和隐私保护技术对 GNNs 有效,以及它们如何扩展到图数据?
  • RQ3公平性关切在 GNNs 中如何体现,哪些模型可以在图上减轻偏见?
  • RQ4GNNs 存在哪些可解释性方法,解释如何在其他维度提升可信度?
  • RQ5将隐私、鲁棒性、公平性和可解释性联系起来的开放挑战与未来方向是什么?

主要发现

  • 本论文提供了关于 GNNs 的隐私攻击的详细分类,包括成员资格推断、重构、属性推断和模型提取。
  • 它引入攻击者知识设定(白盒和黑盒)并描述隐私攻击的统一监督框架。
  • 它综述了隐私保护的 GNN 方法,如差分隐私和联邦学习,并讨论了它们在图数据上的适用性。
  • 它涵盖鲁棒性主题,包括可扩展和后门攻击以及专为 GNNs 设计的防御。
  • 它回顾公平性定义和公平 GNN 模型,并讨论图领域中的可解释性方法和挑战。
  • 它分析隐私、鲁棒性、公平性和可解释性之间的相互联系,强调跨方面的收益与风险。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。