Skip to main content
QUICK REVIEW

[论文解读] The Bursty Dynamics of the Twitter Information Network

Seth A. Myers, Jure Leskovec|arXiv (Cornell University)|Mar 11, 2014
Complex Network Analysis Techniques参考文献 27被引用 39
一句话总结

本文研究了Twitter上信息传播如何引发网络结构的突发性变化,例如关注关系的突然激增。通过追踪转发曝光度和内容相似性的模型,作者发现当用户首次接触到与自身兼容但此前未知的内容源时,新关注关系的激增最可能发生,从而能够准确预测网络动态的峰值。

ABSTRACT

In online social media systems users are not only posting, consuming, and resharing content, but also creating new and destroying existing connections in the underlying social network. While each of these two types of dynamics has individually been studied in the past, much less is known about the connection between the two. How does user information posting and seeking behavior interact with the evolution of the underlying social network structure? Here, we study ways in which network structure reacts to users posting and sharing content. We examine the complete dynamics of the Twitter information network, where users post and reshare information while they also create and destroy connections. We find that the dynamics of network structure can be characterized by steady rates of change, interrupted by sudden bursts. Information diffusion in the form of cascades of post re-sharing often creates such sudden bursts of new connections, which significantly change users' local network structure. These bursts transform users' networks of followers to become structurally more cohesive as well as more homogenous in terms of follower interests. We also explore the effect of the information content on the dynamics of the network and find evidence that the appearance of new topics and real-world events can lead to significant changes in edge creations and deletions. Lastly, we develop a model that quantifies the dynamics of the network and the occurrence of these bursts as a function of the information spreading through the network. The model can successfully predict which information diffusion events will lead to bursts in network dynamics.

研究动机与目标

  • 理解信息传播如何影响Twitter等社交网络的结构演化。
  • 识别并探究大规模内容分享事件是否以及如何引发关注网络动态的突发性变化(即“爆发”)。
  • 开发一个预测模型,识别哪些信息传播事件将引发新连接的爆发。
  • 分析内容兼容性与曝光度在驱动关注获取爆发中的作用。

提出的方法

  • 本研究分析了一个包含1310万名英语Twitter用户的子图,追踪了12亿条推文、1.123亿次新连接和3920万次删除操作随时间的变化。
  • 通过测量边创建与删除事件的爆发程度来建模网络动态,识别网络变化背景流中的中断现象。
  • 利用转发曝光度(用户推文被他人看到的次数)、转发频率以及内容相似性等特征,开发预测模型以预测关注爆发的可能性。
  • 模型结合了转发爆发与后续关注爆发之间的时序相关性,使用标准分数量化爆发强度。
  • 比较了转发与转发曝光在预测能力上的差异,发现对有影响力且内容兼容的用户曝光是关注激增的更强预测因子。
  • 研究使用零模型和自回归分析,将信息传播的影响与网络基线演化过程分离。

实验结果

研究问题

  • RQ1是什么触发了Twitter上关注关系创建与删除的突发性激增?
  • RQ2通过转发传播的信息在多大程度上影响了用户网络的结构演化?
  • RQ3在多大程度上可以根据信息传播模式预测关注激增的发生?
  • RQ4内容兼容性以及接触新且相似的用户在多大程度上会触发关注获取的激增?

主要发现

  • Twitter网络呈现出持续的背景性边变化流,平均每月有9%的连接发生变化,其间穿插着与信息级联事件相关的突发性变化。
  • 信息传播事件,尤其是大规模转发级联,会引发新关注关系的协同爆发,同时在较小程度上引发取消关注的爆发。
  • 转发曝光次数(即用户内容被他人看到的次数)比原始转发次数更能有效预测关注爆发。
  • 首次接触到来自大量兼容且此前未知的关注者内容的用户,最有可能经历关注关系的突发性增长。
  • 该模型能够以高精度成功预测关注爆发事件,优于仅依赖转发频率的基线模型。
  • 研究发现,高转发频率的用户并不一定引发爆发;相反,当内容首次触达新且兼容的受众时,爆发最可能发生。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。