Skip to main content
QUICK REVIEW

[論文レビュー] Subgraph Neural Networks

Emily Alsentzer, Samuel G. Finlayson|arXiv (Cornell University)|Jun 18, 2020
Advanced Graph Neural Networks参考文献 84被引用数 44
ひとこと要約

SubGNN は3つのプロパティ認識チャネル(位置・隣接・構造)とアンカーパッチルーティングを備えた新しいサブグラフレベルのメッセージ伝搬フレームワークを通じて、解きほぐされたサブグラフ表現を学習し、合成データセットと実世界データセットのサブグラフ分類で高い性能を達成します。

ABSTRACT

Deep learning methods for graphs achieve remarkable performance on many node-level and graph-level prediction tasks. However, despite the proliferation of the methods and their success, prevailing Graph Neural Networks (GNNs) neglect subgraphs, rendering subgraph prediction tasks challenging to tackle in many impactful applications. Further, subgraph prediction tasks present several unique challenges: subgraphs can have non-trivial internal topology, but also carry a notion of position and external connectivity information relative to the underlying graph in which they exist. Here, we introduce SubGNN, a subgraph neural network to learn disentangled subgraph representations. We propose a novel subgraph routing mechanism that propagates neural messages between the subgraph's components and randomly sampled anchor patches from the underlying graph, yielding highly accurate subgraph representations. SubGNN specifies three channels, each designed to capture a distinct aspect of subgraph topology, and we provide empirical evidence that the channels encode their intended properties. We design a series of new synthetic and real-world subgraph datasets. Empirical results for subgraph classification on eight datasets show that SubGNN achieves considerable performance gains, outperforming strong baseline methods, including node-level and graph-level GNNs, by 19.8% over the strongest baseline. SubGNN performs exceptionally well on challenging biomedical datasets where subgraphs have complex topology and even comprise multiple disconnected components.

研究の動機と目的

  • ノードレベルやグラフレベルの予測とは独立したタスクとして、サブグラフ予測を動機づける。
  • 位置・隣接・構造を捉えるサブグラフに焦点を当てたメッセージ伝搬アーキテクチャを提案する。
  • 基盤グラフ全体から情報を集約するためのアンカーパッチルーティングを導入する。
  • 合成データセットおよび実世界のサブグラフ分類データセットでの経験的な利得を実証する。

提案手法

  • 複数の成分とラベルを持つ可能性のあるサブグラフ S を定義する。
  • サブグラフ成分上で機能するサブグラフレベルのメッセージ伝搬スキーム E_S を導入する。
  • 3つのチャネル(Position、Neighborhood、Structure)を導入し、専用のアンカーパッチサンプリング、エンコーディング、類似性ルーティングを備える。
  • 各チャネルごとに性質認識出力 z_x,c を計算し、それらを最終的なサブグラフ埋め込み z_S に集約する。
  • 固定されたアンカーパッチと類似性の事前計算をオプションとした計算効率の高いアーキテクチャを提供する。
  • サブグラフを含む教師なし学習・半教師あり学習、または他の予測タスクへの拡張可能性を示す。

実験結果

リサーチクエスチョン

  • RQ1サブグラフをどのように表現して、内部のトポロジー、境界構造、ホストグラフ内の相対的位置を捉えることができるか?
  • RQ2チャネル固有のルーティングを備えたサブグラフ中心の GNN は、サブグラフ分類タスクでノードレベルやグラフレベルのベースラインより優れているか?
  • RQ3アンカーパッチと性質認識ルーティングは、サブグラフの特性(位置、隣接、構造)を効果的に分離して正確な予測を可能にするか?
  • RQ4サブグラフのトポロジーを対象とした合成ベンチマークと、実世界の生物医学・社会データセットでの SubGNN バリアントの性能はどうか?

主な発見

Methoddensitycut ratiocorenesscomponent
SubGNN (Ours)0.919 \pm 0.0160.629 \pm 0.0390.659 \pm 0.0920.958 \pm 0.098
  • SubGNN は合成データセットでベースラインを平均77.4%、実世界データセットで平均125.2%上回る。
  • SubGNN は全体のサブグラフ分類タスクで最も強力なベースラインを19.8%改善する。
  • チャネルアブレーションは、各チャネルの性能がそれぞれの導入バイアスと一致することを示す(例:構造チャネルは境界-構造タスクで優れる、位置チャネルは内部成分の関係で優れる)。
  • サブグラフが複雑なトポロジーや複数の成分を持つ難易度の高い生物医学データセットで SubGNN は強力な結果を達成する。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。