Skip to main content
QUICK REVIEW

[论文解读] Privacy-Preserving Graph Neural Network for Node Classification.

Jun Zhou, Chaochao Chen|arXiv (Cornell University)|May 25, 2020
Privacy-Preserving Technologies in Data参考文献 51被引用 26
一句话总结

该论文提出了一种隐私保护图神经网络(PPGNN)框架,用于节点分类,使数据持有者能够在不共享原始特征或边的情况下实现协作训练。通过在数据持有者与半诚实服务器之间分割计算——将私有数据保留在本地,同时将非敏感操作委托给服务器——该方法在数据被不同参与方隔离的情况下,仍能实现与在明文数据上训练的标准GNN相当的性能。

ABSTRACT

Recently, Graph Neural Network (GNN) has achieved remarkable progresses in various real-world tasks on graph data, consisting of node features and the adjacent information between different nodes. High-performance GNN models always depend on both rich features and complete edge information in graph. However, such information could possibly be isolated by different data holders in practice, which is the so-called data isolation problem. To solve this problem, in this paper, we propose a Privacy-Preserving GNN (PPGNN) learning paradigm for node classification task, which can be generalized to existing GNN models. Specifically, we split the computation graph into two parts. We leave the private data (i.e., features, edges, and labels) related computations on data holders, and delegate the rest of computations to a semi-honest server. We conduct experiments on three benchmarks and the results demonstrate that PPGNN significantly outperforms the GNN models trained on the isolated data and has comparable performance with the traditional GNN trained on the mixed plaintext data.

研究动机与目标

  • 解决图机器学习中的数据隔离问题,即特征和边由不同参与方持有。
  • 在不向不可信方暴露私有节点特征、边或标签的情况下,实现协作节点分类。
  • 设计一种可推广的框架,与现有GNN架构兼容。
  • 在严格的隐私约束下保持高模型性能。

提出的方法

  • 计算图被划分为两部分:私有计算保留在数据持有者本地,非私有操作则卸载到半诚实服务器。
  • 私有数据(包括节点特征、边和标签)从未被共享;仅交换中间表示。
  • 通过仅隔离计算中敏感的部分,该方法支持与现有GNN模型的集成。
  • 安全聚合机制确保服务器无法了解任一数据持有者的私有输入。
  • 通过最小化消息传递和聚合过程中的信息泄露,该框架保持了模型准确性。
  • 该方法具有通用性,可应用于多种GNN架构,而无需重新设计架构。

实验结果

研究问题

  • RQ1当特征和边由不同数据持有者持有且不共享原始数据时,能否有效训练GNN?
  • RQ2如何在不损害模型性能的前提下,保护GNN中消息传递过程的隐私?
  • RQ3隐私保护的GNN在多大程度上可以达到在完全可用明文数据上训练的标准GNN的性能?
  • RQ4所提出的框架能否在不同GNN架构间实现通用化?

主要发现

  • PPGNN在三个基准数据集上实现的性能与在完全可用明文数据上训练的标准GNN相当。
  • 与未共享特征和边的孤立数据上训练的GNN相比,该模型显著表现更优。
  • 隐私保护设计成功防止了敏感信息泄露,同时保持了高预测准确性。
  • 该框架可良好推广至现有GNN模型,实现在无需重训练或架构修改情况下的安全协作。
  • 结果证实,安全计算可有效集成到GNN训练中,而不会牺牲模型效用。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。