[论文解读] Graph2Seq: Graph to Sequence Learning with Attention-based Neural Networks
Graph2Seq 提供一个端到端的图到序列模型,具备双向图编码器和基于注意力的解码器,在包括 bAbI、Shortest Path 和 WikiSQL 的图结构到序列任务上达到业界领先水平。该编码器汇聚有向邻域信息并产生用于带注意力的 RNN 解码器的图嵌入。
The celebrated Sequence to Sequence learning (Seq2Seq) technique and its numerous variants achieve excellent performance on many tasks. However, many machine learning tasks have inputs naturally represented as graphs; existing Seq2Seq models face a significant challenge in achieving accurate conversion from graph form to the appropriate sequence. To address this challenge, we introduce a novel general end-to-end graph-to-sequence neural encoder-decoder model that maps an input graph to a sequence of vectors and uses an attention-based LSTM method to decode the target sequence from these vectors. Our method first generates the node and graph embeddings using an improved graph-based neural network with a novel aggregation strategy to incorporate edge direction information in the node embeddings. We further introduce an attention mechanism that aligns node embeddings and the decoding sequence to better cope with large graphs. Experimental results on bAbI, Shortest Path, and Natural Language Generation tasks demonstrate that our model achieves state-of-the-art performance and significantly outperforms existing graph neural networks, Seq2Seq, and Tree2Seq models; using the proposed bi-directional node embedding aggregation strategy, the model can converge rapidly to the optimal performance.
研究动机与目标
- 开发一个通用的端到端图到序列模型,将图输入映射到序列输出。
- 学习表达性强的节点和图嵌入,纳入边的方向信息。
- 实现基于注意力的解码,将图表示与输出序列对齐。
提出的方法
- 图编码器通过使用单独的聚合器(均值、LSTM、池化)对前向和后向邻域进行聚合,学习最多 K 跳的双向节点嵌入。
- 两种图嵌入方案(基于池化的和带超节点的节点嵌入)从节点嵌入构建图级表示。
- 基于注意力的 RNN 解码器使用在节点嵌入上计算的上下文向量来生成目标序列。
- 对齐模型 a(j) 计算解码器状态与节点嵌入之间的分数,以生成解码的注意力权重。
- 训练最大化给定输入图的正确描述的条件对数概率;推理时使用宽度为 5 的束搜索。
- 该模型可兼容替代的图编码器和解码器(例如 GCNs、Tree/Set 变体),以实现扩展性。
实验结果
研究问题
- RQ1一个通用的编码-解码框架是否能够在不同任务中有效地将图结构输入转换为序列?
- RQ2双向、边感知的图编码器是否能提升图到序列的表现,尤其是在较大图上?
- RQ3对节点嵌入的注意力如何影响图到序列任务的解码质量?
- RQ4不同的图嵌入策略(基于池化与基于节点的)如何影响在不同图结构上的性能?
- RQ5将 Graph2Seq 应用于真实世界的图到序列任务(如 SQL-to-English 生成)时会带来哪些提升?
主要发现
- 在 WikiSQL 上,Graph2Seq 的变体优于 Seq2Seq、Tree2Seq、Graph2Seq 基线,其中 Graph2Seq-PGE 达到 38.97 BLEU-4。
- 在合成和 SP 任务中,Graph2Seq 的准确性优于 LSTM,并在 GGS-NN 和 GCN 上具有竞争力甚至更优,尤其在较大图上。
- 消融研究表明注意力显著提升性能(>=14.9%的改进),在 DAG、DCG、SEQ 图上均有体现。
- 均值聚合与基于池化的图嵌入通常能取得很好的结果,双向聚合在较大图上相对于单向变体提升性能。
- 增加跳数可以提升模型性能和收敛性,双向聚合达到最佳性能所需的跳数更少。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。