Skip to main content
QUICK REVIEW

[论文解读] DyLink2Vec: Effective Feature Representation for Link Prediction in Dynamic Networks

Mahmudur Rahman, Tanay Kumar Saha|arXiv (Cornell University)|Apr 16, 2018
Complex Network Analysis Techniques参考文献 23被引用 29
一句话总结

DyLink2Vec 提出了一种用于动态网络中节点对实例的度量嵌入方法,将链接预测建模为最优编码问题,通过梯度下降最小化重构误差。该方法在真实世界动态网络中的链接预测任务上优于现有方法,通过学习到的特征表示有效捕捉了时间上的链接模式。

ABSTRACT

The temporal dynamics of a complex system such as a social network or a communication network can be studied by understanding the patterns of link appearance and disappearance over time. A critical task along this understanding is to predict the link state of the network at a future time given a collection of link states at earlier time points. In existing literature, this task is known as link prediction in dynamic networks. Solving this task is more difficult than its counterpart in static networks because an effective feature representation of node-pair instances for the case of dynamic network is hard to obtain. To overcome this problem, we propose a novel method for metric embedding of node-pair instances of a dynamic network. The proposed method models the metric embedding task as an optimal coding problem where the objective is to minimize the reconstruction error, and it solves this optimization task using a gradient descent method. We validate the effectiveness of the learned feature representation by utilizing it for link prediction in various real-life dynamic networks. Specifically, we show that our proposed link prediction model, which uses the extracted feature representation for the training instances, outperforms several existing methods that use well-known link prediction features.

研究动机与目标

  • 解决动态网络中节点对实例的有效特征表示问题,其中时间链接模式至关重要但尚未被充分利用。
  • 克服静态链接预测方法的局限性,这些方法忽略时间动态性或通过展平序列扭曲时间有序特征。
  • 开发一种度量嵌入框架,保留时间顺序并捕捉动态网络快照中的演化拓扑信号。
  • 通过学习编码结构和时间模式的低维表示,提升链接预测的准确性。
  • 使用具有不同时间动态特性的现实世界动态网络数据集,证明所提方法相对于现有方法的优越性。

提出的方法

  • 将度量嵌入任务建模为最优编码问题,以最小化多个时间快照下节点对表示的重构误差。
  • 使用梯度下降优化嵌入空间,学习保持时间与拓扑关系的连续向量表示。
  • 使用历史时间窗口构建训练实例:$\widehat{E}$(过去链接)和$\overline{E}$(未来链接),以建模时间过渡。
  • 通过编码随时间推移的链接出现与消失序列,学习节点对嵌入,捕捉演化的网络动态。
  • 将学习到的嵌入作为下游分类模型的输入特征,用于未来时间点的链接预测。
  • 使用重构损失函数,鼓励时间上接近的节点对具有相似的嵌入,以保留时间顺序。

实验结果

研究问题

  • RQ1度量嵌入方法能否有效捕捉动态网络中的时间动态性,从而提升链接预测性能?
  • RQ2DyLink2Vec 与依赖于拓扑特征或时间序列特征的静态和时序链接预测方法相比,性能如何?
  • RQ3在 DyLink2Vec 中,历史时间快照数量的变化对链接预测性能有何影响?
  • RQ4训练数据中的类别不平衡如何影响 DyLink2Vec 在链接预测任务中的性能?
  • RQ5所学习的嵌入在不同类型的动态网络(如合作网络和社会网络)中具有多大程度的泛化能力?

主要发现

  • DyLink2Vec 在链接预测任务上优于多种最先进方法,包括基于拓扑特征、时间序列建模、深度学习和张量分解的方法。
  • 在合作网络中,DyLink2Vec 达到了 NDGC_{50} 为 0.82 和 PRAUC 为 0.89 的性能,显著优于竞争方法。
  • 随着历史时间快照数量的增加,性能持续提升,合作数据集在 8 个快照时达到峰值,之后因优化复杂度增加而下降。
  • 在 Facebook1 数据集中,性能随着快照数量的增加而持续改善,表明远距离历史链接对预测仍具信息量。
  • 类别不平衡对性能产生负面影响,当负样本比例超过 1:1 时,PRAUC 和 NDGC_{50} 下降,支持对负样本对进行欠采样。
  • 该方法在多种动态网络中表现出鲁棒性和泛化能力,包括 Enron、Facebook2 和更具挑战性的 Facebook1 网络,在这些网络中均显著优于基线方法。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。