Skip to main content
QUICK REVIEW

[论文解读] Graph Embedding with Rich Information through Bipartite Heterogeneous Network.

Guolei Sun, Xiangliang Zhang|arXiv (Cornell University)|Oct 18, 2017
Advanced Graph Neural Networks参考文献 21被引用 2
一句话总结

该论文提出了一种新颖的图嵌入框架,通过构建异构二分网络,利用具有灵活邻域探索能力的有偏随机游走,从节点和边中挖掘丰富的文本信息,以学习增强的表示。与基线方法相比,该方法在Cora数据集上的Micro-F1和Macro-F1分别提升了10%和7%。

ABSTRACT

Graph embedding has attracted increasing attention due to its critical application in social network analysis. Most existing algorithms for graph embedding only rely on the typology information and fail to use the copious information in nodes as well as edges. As a result, their performance for many tasks may not be satisfactory. In this paper, we proposed a novel and general framework of representation learning for graph with rich text information through constructing a bipartite heterogeneous network. Specially, we designed a biased random walk to explore the constructed heterogeneous network with the notion of flexible neighborhood. The efficacy of our method is demonstrated by extensive comparison experiments with several baselines on various datasets. It improves the Micro-F1 and Macro-F1 of node classification by 10% and 7% on Cora dataset.

研究动机与目标

  • 解决现有图嵌入方法忽略节点和边中丰富文本信息的局限性。
  • 开发一种通用的表示学习框架,将节点和边的属性整合到图嵌入中。
  • 通过利用异构网络结构,提升下游任务(如节点分类)的性能。
  • 通过构建的异构二分网络中的有偏随机游走,设计一种灵活的邻域探索策略。

提出的方法

  • 通过将节点和边建模为具有丰富文本属性的不同类型,构建异构二分网络。
  • 引入一种有偏随机游走机制,根据节点和边的文本信息优先选择路径。
  • 定义灵活的邻域探索策略,以在随机游走过程中平衡局部与全局结构信息。
  • 利用有偏随机游走生成的序列学习节点的低维向量表示。
  • 使用跳字模型结合负采样进行端到端训练,以保留结构和文本关系。

实验结果

研究问题

  • RQ1将节点和边中的丰富文本信息整合是否能提升图表示学习?
  • RQ2所提出的具有灵活邻域探索的有偏随机游走与标准随机游走相比,在捕捉异构网络结构方面表现如何?
  • RQ3该框架在节点分类任务上的性能提升程度如何?
  • RQ4该方法在具有不同文本丰富程度的多种数据集上是否具备泛化能力?

主要发现

  • 与基线方法相比,该方法在Cora数据集上的节点分类任务中实现了10%的Micro-F1提升。
  • 在Cora数据集上观察到7%的Macro-F1提升,表明对罕见或低频类别的分类性能更好。
  • 大量实验结果证实了该框架在多个数据集和任务上的有效性。
  • 通过构建异构二分网络整合丰富文本信息,可生成更具信息量的节点表示。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。