Skip to main content
QUICK REVIEW

[論文レビュー] Privacy-Preserving Graph Neural Network for Node Classification.

Jun Zhou, Chaochao Chen|arXiv (Cornell University)|May 25, 2020
Privacy-Preserving Technologies in Data参考文献 51被引用数 26
ひとこと要約

この論文は、ノード分類のためのプライバシー保護型グラフニューラルネットワーク(PPGNN)フレームワークを提案する。このフレームワークにより、データ所有者間で生の特徴量やエッジを共有せずに協調学習が可能になる。プライベートなデータをローカルに保ちながら、非機密的な処理を半信頼性サーバーに委譲することで、計算をデータ所有者とサーバーの間で分割する。この方法により、データが複数の参加者に分散している状況でも、平文データで学習した標準的なGNNと同等の性能を達成する。

ABSTRACT

Recently, Graph Neural Network (GNN) has achieved remarkable progresses in various real-world tasks on graph data, consisting of node features and the adjacent information between different nodes. High-performance GNN models always depend on both rich features and complete edge information in graph. However, such information could possibly be isolated by different data holders in practice, which is the so-called data isolation problem. To solve this problem, in this paper, we propose a Privacy-Preserving GNN (PPGNN) learning paradigm for node classification task, which can be generalized to existing GNN models. Specifically, we split the computation graph into two parts. We leave the private data (i.e., features, edges, and labels) related computations on data holders, and delegate the rest of computations to a semi-honest server. We conduct experiments on three benchmarks and the results demonstrate that PPGNN significantly outperforms the GNN models trained on the isolated data and has comparable performance with the traditional GNN trained on the mixed plaintext data.

研究の動機と目的

  • グラフ機械学習におけるデータ隔離問題に対処すること。これは、特徴量とエッジが異なる参加者によって所有されている状況を指す。
  • 信頼できない参加者にプライベートなノード特徴量、エッジ、ラベルを暴露せずに、協調的なノード分類を可能にすること。
  • 既存のGNNアーキテクチャと互換性がある汎用的なフレームワークを設計すること。
  • 学習中に厳密なプライバシー制約のもとでも高いモデル性能を維持すること。

提案手法

  • 計算グラフを2つの部分に分割する。プライベートな計算はデータ所有者で実行され、非プライベートな処理は半信頼性サーバーにオフロードされる。
  • ノード特徴量、エッジ、ラベルを含むプライベートデータは一切共有されず、中間表現のみがやり取りされる。
  • 計算のうち機密性の高い部分を隔離することで、既存のGNNモデルとの統合を可能にする。
  • 安全な集約メカニズムにより、サーバーが個々のデータ所有者のプライベート入力について何も学習しないようにする。
  • メッセージパッシングおよび集約の過程での情報漏洩を最小限に抑えることで、モデルの精度を維持する。
  • アーキテクチャの再設計なしに、さまざまなGNNアーキテクチャに一般化して適用可能である。

実験結果

リサーチクエスチョン

  • RQ1生のデータを共有せずに、特徴量とエッジが異なるデータ所有者に分散している状況でも、GNNを効果的に学習できるか?
  • RQ2GNNのメッセージパッシング中に、モデル性能を損なわせることなくプライバシーをどのように保護できるか?
  • RQ3プライバシー保護型GNNは、完全に利用可能な平文データで学習した標準GNNとどの程度性能を同等に保てるか?
  • RQ4提案されたフレームワークは、さまざまなGNNアーキテクチャに一般化可能か?

主な発見

  • PPGNNは、3つのベンチマークデータセットにおいて、完全に利用可能な平文データで学習した標準GNNと同等の性能を達成した。
  • 特徴量とエッジが共有されていない孤立したデータで学習したGNNに比べて、顕著に優れた性能を示した。
  • プライバシー保護設計により、機密情報の漏洩を効果的に防止しながら、高い予測精度を維持した。
  • 既存のGNNモデルに容易に適用可能であり、再学習やアーキテクチャの変更なしに安全な協働学習を実現した。
  • 安全な計算がGNN学習に効果的に統合可能であり、モデルの有用性を損なわないことが結果から確認された。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。