Skip to main content
QUICK REVIEW

[論文レビュー] Neo-GNNs: Neighborhood Overlap-aware Graph Neural Networks for Link Prediction

Seongjun Yun, Seoyoon Kim|arXiv (Cornell University)|Jun 9, 2022
Advanced Graph Neural Networks被引用数 47
ひとこと要約

Neo-GNNs は隣接行列から構造的特徴を学習し、リンク予測のための重なり合う近傍を推定し、特徴ベースの GNNs と適応的に組み合わせることで、OGB データセットで最先端の成績を達成します。

ABSTRACT

Graph Neural Networks (GNNs) have been widely applied to various fields for learning over graph-structured data. They have shown significant improvements over traditional heuristic methods in various tasks such as node classification and graph classification. However, since GNNs heavily rely on smoothed node features rather than graph structure, they often show poor performance than simple heuristic methods in link prediction where the structural information, e.g., overlapped neighborhoods, degrees, and shortest paths, is crucial. To address this limitation, we propose Neighborhood Overlap-aware Graph Neural Networks (Neo-GNNs) that learn useful structural features from an adjacency matrix and estimate overlapped neighborhoods for link prediction. Our Neo-GNNs generalize neighborhood overlap-based heuristic methods and handle overlapped multi-hop neighborhoods. Our extensive experiments on Open Graph Benchmark datasets (OGB) demonstrate that Neo-GNNs consistently achieve state-of-the-art performance in link prediction. Our code is publicly available at https://github.com/seongjunyun/Neo_GNNs.

研究の動機と目的

  • 特徴を平滑化した GNN に頼るだけでなく、構造認識を伴うリンク予測の必要性を動機づける。
  • 隣接行列から構造的特徴を学習し、重なり合う近傍をモデル化する Neo-GNNs を導入する。
  • 多-hop 近傍に対する重なり認識型集約機構を開発する。
  • 構造的(Neo-GNN)スコアと従来の特徴ベース GNN スコアをエンドツーエンドの枠組みで適応的に組み合わせることを可能にする。
  • OGB の4つのリンク予測データセットで最先端の性能を示す。

提案手法

  • 構造的特徴生成器 F_theta は、ノードとエッジ用の2つの MLP を用いて隣接行列からノードの構造的特徴を学習する(式6)。
  • 近傍重複認識集約は、x_struct から対角行列 X_struct を構築し、Z = A X_struct を計算して重なりのある隣接情報を捉える(式7および式8)。
  • 式9 とともに Z = g_Phi(sum_{l=1}^L beta^{l-1} A^l X_struct) により多段階の近傍にも拡張する。
  • 構造スコアに基づく予測を特徴ベース GNN スコアと、学習可能な alpha を介して組み合わせる: y_hat_{ij} = alpha * sigma(z_i^T z_j) + (1 - alpha) * sigma(s(h_i, h_j))(式11)。
  • Neo-GNN、構造スコア、および特徴ベース GNN スコアの3つの BCE 損失でエンドツーエンドに学習する(式12)。
  • 疎行列表現と A^l 项の事前計算によりスケーラブルな計算を提供する(3.3 の計算量の議論)。

実験結果

リサーチクエスチョン

  • RQ1隣接行列から構造的特徴を学習することは、ノード特徴に依存する従来のGNNを超えたリンク予測の改善につながるか?
  • RQ2多-hop 重なりを含む近傍の重なりを、リンク予測のための GNN にどのように効果的に組み込むことができるか?
  • RQ3構造スコアと特徴ベース GNN スコアを適応的に組み合わせることは、多様なデータセットで優れた性能をもたらすか?
  • RQ4Neo-GNNs は近傍重なりヒューリスティクス(Common Neighbors、Adamic Adar、Resource Allocation)をどれほど一般化できるか?

主な発見

MethodOGB-PpaOGB-CollabOGB-DdiOGB-Citation2
Common Neighbors27.65±0.0050.06±0.0017.73±0.0076.20±0.00
Adamic Adar32.45±0.0053.00±0.0018.61±0.0076.12±0.00
Resource Allocation49.33±0.0052.89±0.006.23±0.0076.20±0.00
Matrix Factorization27.83±2.0238.74±0.3017.92±3.5753.08±4.19
Node2Vec17.24±0.7641.36±0.6921.95±1.5853.47±0.12
MLP0.47±0.0519.98±0.96N/A28.99±0.16
GCN16.98±1.3347.01±0.7944.60±8.8784.79±0.24
GraphSAGE13.93±2.3848.60±0.4648.01±9.0282.64±0.01
JK-Net11.40±2.0448.84±0.8357.98±6.88OOM
GATOOM44.89±1.2329.51±6.40OOM
SEAL48.15±4.1754.37±0.0226.25±6.0086.32±0.52
Neo-GNN49.13±0.6057.52±0.3763.57±3.5287.26±0.84
  • Neo-GNNs はリンク予測の4つの OGB データセットで一貫して最先端の性能を達成している。
  • w/o GCN の Neo-GNNs はほとんどのデータセットでベースライン GNN を上回り、構造情報の価値を示している。
  • 適応的結合 alpha はデータセット固有の構造信号と特徴信号のバランスを可能にし、単独の成分よりも性能を向上させることが多い。
  • 多-hop の重なり近傍(L > 1)によって性能が向上し、β の減衰因子が遠いホップからの寄与を制御する。
  • Neo-GNNs は近傍重なりのヒューリスティクスを回復・整合させることができ、OGB-PPA で Resource Allocation、Adamic Adar、Common Neighbors とのスピarman 相関が高いことを示している。
  • Neo-GNNs は入力ノード特徴なしでも最高結果を達成することがあり、構造認識学習の強さを示している。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。