[论文解读] Predicting Links and Inferring Attributes using a Social-Attribute Network (SAN)
本文通过整合监督式与非监督式链接预测及属性推断算法,扩展了社交属性网络(SAN)框架,表明推断缺失属性可提升链接预测的准确性。基于大规模公开的Google+数据集,作者在多种算法上均展现出一致的性能提升,证实属性推断可增强SAN中的链接预测性能。
The eects of social inuence and homophily suggest that both network structure and node attribute information should inform the tasks of link prediction and node attribute inference. Recently, Yin et al. [28, 29] proposed Social-Attribute Network (SAN), an attribute-augmented social network, to integrate network structure and node attributes to perform both link prediction and attribute inference. They focused on generalizing the random walk with restart algorithm to the SAN framework and showed improved performance. In this paper, we extend the SAN framework with several leading supervised and unsupervised link prediction algorithms and demonstrate performance improvement for each algorithm on both link prediction and attribute inference. Moreover, we make the novel observation that attribute inference can help inform link prediction, i.e., link prediction accuracy is further improved by rst inferring missing attributes. We comprehensively evaluate these algorithms and compare them with other existing algorithms using a novel, largescale Google+ dataset, which we make publicly available 1 .
研究动机与目标
- 通过在统一框架中整合网络结构与节点属性,提升链接预测与节点属性推断性能。
- 将最先进的监督式与非监督式学习算法扩展至社交属性网络(SAN)模型,以同时处理两项任务。
- 探究属性推断是否可作为前置步骤以提升链接预测性能。
- 在新发布的、大规模的Google+数据集上评估所提出的扩展方法。
- 对所提出方法与SAN框架中现有算法进行全面比较。
提出的方法
- 通过引入监督式与非监督式链接预测算法(如节点嵌入与矩阵分解技术)扩展社交属性网络(SAN)框架。
- 将属性推断整合至链接预测流程中,利用推断出的属性作为输入特征,以提升链接预测性能。
- 采用多任务学习方法,在SAN框架内联合优化链接预测与属性推断。
- 将随机游走带重启算法适配至SAN设置,扩展其在带属性网络中的适用性。
- 应用特征表示学习,将网络拓扑结构与节点属性编码为低维嵌入。
- 使用Google+数据集——从真实社交互动与用户属性中收集——在大规模环境下训练与评估模型。
实验结果
研究问题
- RQ1监督式与非监督式链接预测算法能否在SAN框架内有效扩展以提升性能?
- RQ2在链接预测前推断缺失的节点属性是否能带来可测量的链接预测准确率提升?
- RQ3所提出方法在链接预测与属性推断任务上的性能与现有算法相比如何?
- RQ4在社交网络中,整合属性信息在多大程度上增强了链接预测模型的预测能力?
- RQ5在网络结构与节点属性之间,哪一者对预测缺失链接与缺失属性的贡献更大?
主要发现
- 将属性推断作为预处理步骤显著提升了链接预测的准确性,表明两项任务之间存在双向益处。
- 所有测试的监督式与非监督式算法在扩展后的SAN框架中应用时,相比基线方法均表现出性能提升。
- 所提出的框架在大规模Google+数据集的多个评估指标上均实现一致的性能增益,验证了其可扩展性与鲁棒性。
- 作者观察到,属性推断对链接预测有显著贡献,表明缺失属性是关键的预测信号来源。
- 公开发布的Google+数据集为链接预测与属性推断研究的可复现性与未来基准测试提供了支持。
- 在属性数据稀疏或不完整的情况下,扩展后的SAN框架在链接预测与属性推断任务中均优于现有算法。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。