[论文解读] Social Contagion: An Empirical Study of Information Spread on Digg and Twitter Follower Graphs
本文通过分析提取的粉丝关系图和实时用户活动,实证研究了 Digg 和 Twitter 上的信息传播,发现 Digg 的传播级联具有高密度和社区驱动特征,而 Twitter 的传播级联则更呈树状且浅层。研究证明,网络结构显著影响信息传播,Digg 的互联网络使信息传播更快、更广泛,而 Twitter 的稀疏、分层传播则传播较慢。
Social networks have emerged as a critical factor in information dissemination, search, marketing, expertise and influence discovery, and potentially an important tool for mobilizing people. Social media has made social networks ubiquitous, and also given researchers access to massive quantities of data for empirical analysis. These data sets offer a rich source of evidence for studying dynamics of individual and group behavior, the structure of networks and global patterns of the flow of information on them. However, in most previous studies, the structure of the underlying networks was not directly visible but had to be inferred from the flow of information from one individual to another. As a result, we do not yet understand dynamics of information spread on networks or how the structure of the network affects it. We address this gap by analyzing data from two popular social news sites. Specifically, we extract follower graphs of active Digg and Twitter users and track how interest in news stories cascades through the graph. We compare and contrast properties of information cascades on both sites and elucidate what they tell us about dynamics of information flow on networks.
研究动机与目标
- 理解网络结构如何影响真实社交网络中信息传播的动力学。
- 在用户行为相似的前提下,比较和对比 Digg 和 Twitter 上信息级联的宏观特性。
- 解决先前研究的局限性——即从信息流推断网络结构——通过使用独立提取的粉丝关系图。
- 提出一种新度量方法,用于量化网络凝聚力,以评估社区结构对信息传播的影响。
- 提供实证证据,说明网络拓扑结构如何塑造病毒式内容的传播速度、深度和覆盖范围。
提出的方法
- 收集了 Digg 和 Twitter 的完整活动日志,包括点赞、转发和嵌入的 URL,以追踪信息级联随时间的传播。
- 提取了两个平台活跃用户的完整粉丝关系图,以获得独立于信息流的真实网络拓扑。
- 通过识别第一个点赞或转发某条新闻的用户,并追踪后续用户的传播链,来追踪新闻传播。
- 定义并计算了新的宏观度量指标,包括一种用于评估社区结构对传播影响的网络凝聚力度量。
- 结合标准级联度量(如大小、深度、广度)与网络拓扑分析,比较 Digg 和 Twitter 的传播动态。
- 采用树采样方法,当存在多条传播路径时,通过随机选择激活边来重建级联结构。
实验结果
研究问题
- RQ1Digg 和 Twitter 的粉丝关系图的结构特性如何影响信息传播?
- RQ2网络拓扑结构(如社区密度或树状程度)在多大程度上影响级联的深度和广度?
- RQ3尽管用户行为相似,Digg 上的信息级联特性与 Twitter 上有何不同?
- RQ4网络凝聚力对信息传播的速度和覆盖范围有何影响?
- RQ5与仅从信息流推断相比,揭示底层网络结构如何提高级联重建的准确性?
主要发现
- Digg 的级联显著更具互联性和社区驱动性,许多级联通过高度连接的子图传播。
- Twitter 的级联表现出更明显的树状结构,冗余路径更少,网络凝聚力低于 Digg。
- 尽管用户行为相似,Digg 的网络更密集、更高度互联,导致信息传播更快、更广泛。
- 两个平台的最大级联直径都较大,但 Digg 的级联更可能呈现浅层且宽广的特征,这得益于网络聚类。
- 新引入的网络凝聚力度量显示,社区结构在加速 Digg 上的信息传播中起着关键作用。
- 先前研究中常见的网络推断图缺失边的问题,可能导致级联重建不准确,尤其在 Digg 这类密集网络中更为显著。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。