[论文解读] SUGAR: Subgraph Neural Network with Reinforcement Pooling and Self-Supervised Mutual Information Mechanism
SUGAR 引入了一个子图级别的 GNN,通过强化学习池化自适应选择突出子图,并通过自监督互信息目标来增强子图表示,以用于图分类和可解释性。
Graph representation learning has attracted increasing research attention. However, most existing studies fuse all structural features and node attributes to provide an overarching view of graphs, neglecting finer substructures' semantics, and suffering from interpretation enigmas. This paper presents a novel hierarchical subgraph-level selection and embedding based graph neural network for graph classification, namely SUGAR, to learn more discriminative subgraph representations and respond in an explanatory way. SUGAR reconstructs a sketched graph by extracting striking subgraphs as the representative part of the original graph to reveal subgraph-level patterns. To adaptively select striking subgraphs without prior knowledge, we develop a reinforcement pooling mechanism, which improves the generalization ability of the model. To differentiate subgraph representations among graphs, we present a self-supervised mutual information mechanism to encourage subgraph embedding to be mindful of the global graph structural properties by maximizing their mutual information. Extensive experiments on six typical bioinformatics datasets demonstrate a significant and consistent improvement in model quality with competitive performance and interpretability.
研究动机与目标
- 开发一个图级表示学习框架,聚焦于显著子图而非全局聚合。
- 利用强化学习,在不需要大量领域知识的情况下实现自适应子图选择。
- 通过互信息将子图嵌入与全局图属性对齐来提升子图嵌入。
- 通过识别驱动图分类的子图来提升可解释性。
提出的方法
- 用 BFS 对高位中心节点周围的子图进行采样和编码,以形成一组子图。
- 使用 GNN 对子图内的节点表示进行编码,并采用子图内注意力机制来获得子图嵌入。
- 使用基于强化学习的 top-k 池化自适应选择最具代表性的子图并形成草图图。
- 在草图图上构建子图间注意力,以细化子图嵌入。
- 在局部子图嵌入与全局图表示之间应用自监督互信息目标,以促进全局感知。
- 使用联合损失进行训练,该损失结合了图分类损失和基于 MI 的正则化,以及标准的 L2 正则化。
实验结果
研究问题
- RQ1与基线方法相比,SUGAR 是否在生物信息学数据集上实现更优的图分类性能?
- RQ2子图编码器设计和子图大小如何影响 SUGAR 的性能?
- RQ3强化池化机制对性能的影响是什么?
- RQ4自监督互信息机制对表示质量的影响?
- RQ5SUGAR 是否能够识别并解释在图中占主导地位的子图?
主要发现
- SUGAR 在六个生物信息学数据集上实现了最先进或高度有竞争力的准确率,平均排名较低。
- 该方法在 MUTAG、PTC、PROTEINS、D&D、NCI1、NCI109 的平均排名中持续位居第一。
- 强化池化使对信息性子图的自适应选择成为可能并提升泛化能力。
- 互信息引导使子图嵌入与全局图结构对齐,提升辨别力。
- SUGAR 通过突出显示驱动分类决策的子图,提供可解释的洞见。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。