Skip to main content
QUICK REVIEW

[论文解读] On the Interplay between Social and Topical Structure

Daniel M. Romero, Chenhao Tan|arXiv (Cornell University)|Dec 5, 2011
Complex Network Analysis Techniques参考文献 30被引用 84
一句话总结

本文利用话题标签作为话题的代理指标,研究了推特上社交网络与话题兴趣之间的相互作用。研究发现,话题重叠(共同话题标签)能以高准确度预测社交链接,而早期采用者网络结构——尤其是弱连接——能预测未来话题标签的流行度,且在低或高图密度时达到最佳流行度。

ABSTRACT

People's interests and people's social relationships are intuitively connected, but understanding their interplay and whether they can help predict each other has remained an open question. We examine the interface of two decisive structures forming the backbone of online social media: the graph structure of social networks - who connects with whom - and the set structure of topical affiliations - who is interested in what. In studying this interface, we identify key relationships whereby each of these structures can be understood in terms of the other. The context for our analysis is Twitter, a complex social network of both follower relationships and communication relationships. On Twitter, "hashtags" are used to label conversation topics, and we examine hashtag usage alongside these social structures. We find that the hashtags that users adopt can predict their social relationships, and also that the social relationships between the initial adopters of a hashtag can predict the future popularity of that hashtag. By studying weighted social relationships, we observe that while strong reciprocated ties are the easiest to predict from hashtag structure, they are also much less useful than weak directed ties for predicting hashtag popularity. Importantly, we show that computationally simple structural determinants can provide remarkable performance in both tasks. While our analyses focus on Twitter, we view our findings as broadly applicable to topical affiliations and social relationships in a host of diverse contexts, including the movies people watch, the brands people like, or the locations people frequent.

研究动机与目标

  • 理解通过话题标签体现的话题归属关系在多大程度上可预测推特上的社交网络链接。
  • 研究早期采用者网络的结构特性是否可预测某一话题(话题标签)的未来流行度。
  • 比较不同类型社交关系——尤其是强互惠关系与弱单向关系——在话题传播预测中的表现。
  • 评估简单、计算高效的特征在预测社交链接与话题流行度方面的性能。
  • 探讨研究发现是否可推广至其他涉及社交与话题结构的领域。

提出的方法

  • 使用推特数据,以话题标签作为用户话题兴趣的指标,构建话题归属关系的集合结构。
  • 应用逻辑回归模型,基于话题重叠(如话题标签集合的Jaccard相似度)和诱导子图属性预测社交链接。
  • 构建两个社交网络:关注者网络(无向)和@消息网络(有向且加权),以模拟不同类型的关系。
  • 分析每个话题标签的早期采用者所构成的子图,提取结构特征,如密度、大小和连通性。
  • 使用AUC等指标评估预测性能,并在不同关系强度阈值(如@网络中k条消息)下比较结果。
  • 采用基本相似度度量(如Jaccard、Dice)和图论特征,建模话题结构与社交结构之间的关系。

实验结果

研究问题

  • RQ1用户之间的话题重叠(共同话题标签)能否有效预测推特上社交链接的形成?
  • RQ2话题标签的早期采用者网络的结构特性在多大程度上可预测其未来的流行度?
  • RQ3不同类型社交关系——互惠与非互惠、强关系与弱关系——如何影响社交链接与话题流行度的预测?
  • RQ4早期采用者网络密度与话题标签最终流行度之间是否存在非单调关系?
  • RQ5在链接预测与流行度预测任务中,关注者网络与@消息网络的预测性能如何比较?

主要发现

  • 话题重叠,尤其是最小共同话题标签集合的大小,是预测社交链接的高效且计算成本低廉的指标,AUC表现优异。
  • 将话题重叠与诱导子图的结构特征(如密度、聚类系数)结合,可显著提升链接预测的准确性。
  • 早期采用者网络的结构可有效预测话题标签的流行度,且在极低和极高网络密度时均达到流行度峰值。
  • 在@消息网络中,弱有向关系更容易从话题结构中预测,但对预测未来话题标签流行度的参考价值低于强关系。
  • 强互惠关系最易从话题结构中预测,但在预测话题扩散方面,其表现不如弱关系。
  • 早期采用者网络结构的预测能力在不同关系强度阈值下均表现稳健,且密度与流行度之间不存在单调关系。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。