Skip to main content
QUICK REVIEW

[论文解读] Topical homophily in online social systems.

Felipe Maciel Cardoso, Sandro Meloni|arXiv (Cornell University)|Jul 20, 2017
Complex Network Analysis Techniques被引用 9
一句话总结

本文通过使用话题标签来建模用户兴趣并衡量社交关系中的基于话题的相似性,研究了Twitter中的主题同质性。研究发现,用户与具有相似兴趣的人建立连接的可能性显著更高,且主题相似性强烈预测关系强度,为在线社交系统中的同质性提供了可量化的度量方法。

ABSTRACT

Understanding the dynamics of social interactions is crucial to comprehend human behavior. The emergence of online social media has enabled access to data regarding people relationships at a large scale. Twitter, specifically, is an information oriented network, with users sharing and consuming information. In this work, we study whether users tend to be in contact with people interested in similar topics, i.e., topical homophily. To do so, we propose an approach based on the use of hashtags to extract information topics from Twitter messages and model users' interests. Our results show that, on average, users are connected with other users similar to them and stronger relationships are due to a higher topical similarity. Furthermore, we show that topical homophily provides interesting information that can eventually allow inferring users' connectivity. Our work, besides providing a way to assess the topical similarity of users, quantifies topical homophily among individuals, contributing to a better understanding of how complex social systems are structured.

研究动机与目标

  • 探究在线社交网络中的用户是否倾向于与对相似话题感兴趣的用户建立连接,这种现象被称为主题同质性。
  • 开发一种基于话题标签作为话题指标,从Twitter数据中提取和建模用户兴趣的方法。
  • 量化主题同质性的程度,并评估其在塑造社交网络结构中的作用。
  • 评估主题相似性是否能够预测或推断在线社交系统中的用户连通模式。

提出的方法

  • 从Twitter消息中提取话题标签,以识别和将用户兴趣分类为不同的主题。
  • 基于用户使用的话题标签的频率和分布构建用户兴趣档案。
  • 使用基于向量的相似性度量方法(例如余弦相似性)计算用户之间的主题相似性。
  • 分析社交网络连接与计算出的主题相似性之间的关系,以评估同质性效应。
  • 应用统计模型,检验主题相似性与关系强度之间的相关性。

实验结果

研究问题

  • RQ1用户在多大程度上倾向于与在Twitter上具有相似话题兴趣的用户建立连接?
  • RQ2用户之间的主题相似性与他们社交关系的强度之间存在何种相关性?
  • RQ3主题同质性能否用于预测或推断在线社交网络中的用户连通性?
  • RQ4大规模Twitter互动中主题同质性的定量程度是多少?

主要发现

  • 平均而言,用户更可能与具有相似话题兴趣的用户建立连接,表明Twitter网络中存在强烈的主题同质性。
  • 更强的社交关系与用户之间更高的主题相似性显著相关。
  • 基于话题标签使用得出的主题相似性可作为用户连通模式的可靠预测因子。
  • 本研究对主题同质性进行了量化,提供了一个可测量的框架,用于基于共享兴趣理解社交网络结构。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。