Skip to main content
QUICK REVIEW

[论文解读] N-GCN: Multi-scale Graph Convolution for Semi-supervised Node Classification

Sami Abu-El-Haija, Amol Kapoor|arXiv (Cornell University)|Feb 24, 2018
Advanced Graph Neural Networks参考文献 19被引用 78
一句话总结

N-GCN 在标准化邻接矩阵的不同幂上训练多个 GCN 实例,以捕捉多尺度图信息,并学习一个联合分类器,将它们的输出结合起来,以提升半监督节点分类。它在若干基准数据集上达到最先进的结果,并扩展到 N-SAGE 变体。

ABSTRACT

Graph Convolutional Networks (GCNs) have shown significant improvements in semi-supervised learning on graph-structured data. Concurrently, unsupervised learning of graph embeddings has benefited from the information contained in random walks. In this paper, we propose a model: Network of GCNs (N-GCN), which marries these two lines of work. At its core, N-GCN trains multiple instances of GCNs over node pairs discovered at different distances in random walks, and learns a combination of the instance outputs which optimizes the classification objective. Our experiments show that our proposed N-GCN model improves state-of-the-art baselines on all of the challenging node classification tasks we consider: Cora, Citeseer, Pubmed, and PPI. In addition, our proposed method has other desirable properties, including generalization to recently proposed semi-supervised learning methods such as GraphSAGE, allowing us to propose N-SAGE, and resilience to adversarial input perturbations.

研究动机与目标

  • 将 GCN 与基于随机游走的多尺度图信息结合用于半监督节点分类的动机。
  • 开发一个处理归一化邻接矩阵的多次幂的 GCN 网络(N-GCN)。
  • 对所有 GCN 模块和分类器进行联合训练,以选择有用的多尺度表示。
  • 在标准数据集上展示最先进的性能,并分析对扰动的鲁棒性。

提出的方法

  • 创建 K 个 GCN 的实例,每个输入不同幂次的归一化邻接矩阵 Â A(包括 Â A^0 = I)。
  • 将 K 个 GCN 的输出拼接并输入到全连接分类器(N-GCN_fc)。
  • 或者,学习一个对 GCN 输出的软注意力组合(N-GCN_a),以自适应地对尺度进行加权。
  • 端到端训练,在带标签的节点上使用交叉熵损失;可选地对中间层施加监督,鼓励每个 GCN 都有用。
  • 通过 Network-of-Graph-Models 框架将其推广到其他图模型(如 GraphSAGE)。
  • 在标准图基准数据集上评估(Cora、Citeseer、PubMed、PPI),并与基线(GCN、SAGE、DCNN 等)进行比较。

实验结果

研究问题

  • RQ1显式地利用来自不同随机游走步长的多尺度信息,是否能在半监督节点分类上超越普通 GCN?
  • RQ2在邻接矩阵的幂上工作的 GCN 网络是否能够学习有效地结合远距离和局部信息?
  • RQ3提出的 N-GCN 对输入扰动和特征噪声是否鲁棒?
  • RQ4在基准数据集上,N-GCN 与相关方法(如 DCNN、GraphSAGE)相比如何?
  • RQ5该方法能否推广到 GCN 之外的其他图模型(如 SAGE)?

主要发现

方法CiteseerCoraPubMedPPI
DCNN (our implementation)71.181.379.344.0
GCN (our implementation)71.281.078.846.2
SAGE (our implementation)63.577.477.659.8
N-GCN (our)72.283.079.546.8
N-SAGE (our)71.081.879.465.0
  • N-GCN 在 Cora、Citeseer、PubMed 和 PPI 数据集上相对于强基线取得了最先进的准确率。
  • 使用多尺度 GCN(K>1)比单尺度 GCN 提升性能,且随着 K 增大提升更大。
  • 基于注意力的和全连接分类变体(N-GCN_a、N-GCN_fc)均优于基线,展示了多尺度融合的有效性。
  • 在特征扰动下,N-GCN 和相关多尺度模型优于普通 GCN 与 SAGE,显示对丢失特征的鲁棒性。
  • 更深的单路径 GCN/SAGE 并不始终提升准确率,而 N-GCN 从多尺度、浅层组件中受益。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。