Skip to main content
QUICK REVIEW

[论文解读] Artificial Inflation: The True Story of Trends in Sina Weibo

Louis Yu, Sitaram Asur|arXiv (Cornell University)|Feb 1, 2012
China's Socioeconomic Reforms and Governance参考文献 8被引用 23
一句话总结

本文研究了新浪微博话题趋势的动力学机制,发现推动趋势的49%转发来自仅占1.08%的虚假账号,这些账号制造了人为的流量膨胀。研究证明,移除这些虚假账号后,趋势行为恢复为类似推特的模式,揭示了中国微博平台在病毒式传播方面存在系统性操纵。

ABSTRACT

There has been a tremendous rise in the growth of online social networks all over the world in recent years. This has facilitated users to generate a large amount of real-time content at an incessant rate, all competing with each other to attract enough attention and become trends. While Western online social networks such as Twitter have been well studied, characteristics of the popular Chinese microblogging network Sina Weibo have not been. In this paper, we analyze in detail the temporal aspect of trends and trend-setters in Sina Weibo, constrasting it with earlier observations on Twitter. First, we look at the formation, persistence and decay of trends and examine the key topics that trend in Sina Weibo. One of our key findings is that retweets are much more common in Sina Weibo and contribute a lot to creating trends. When we look closer, we observe that a large percentage of trends in Sina Weibo are due to the continuous retweets of a small amount of fraudulent accounts. These fake accounts are set up to artificially inflate certain posts causing them to shoot up into Sina Weibo's trending list, which are in turn displayed as the most popular topics to users.

研究动机与目标

  • 理解新浪微博话题趋势的形成、持续与消退机制,并与推特进行对比。
  • 研究转发在新浪微博上塑造和维持趋势方面的作用,与西方平台进行比较。
  • 识别并分析虚假账号人为抬高特定话题使其上热门的现象及其影响。
  • 评估移除虚假用户活动后,是否能使趋势动力学恢复为类似推特所观察到的自然趋势演化模式。
  • 探索最受人为膨胀影响的账号特征,及其在商业活动或内容分享中的角色。

提出的方法

  • 收集并分析了新浪微博30天的趋势关键词数据,追踪推文数量和时间戳。
  • 通过将推文与用户账号关联,并分析随时间推移的转发链,追踪转发传播。
  • 基于高转发量和重复性行为,使用统计阈值识别可疑账号。
  • 根据资料档案和用户类型,将账号分类为认证、专家或非认证账号。
  • 通过移除虚假账号的转发,测量其对趋势演化模式的影响。
  • 使用幂律分布分析建模转发频率,并检测用户行为中的异常现象。

实验结果

研究问题

  • RQ1新浪微博话题趋势的增长、持续与衰减过程与推特相比有何异同?
  • RQ2转发在新浪微博趋势形成与持续时间中所起的作用有多大?
  • RQ3推动趋势的转发中,有多少比例来自欺诈性或机器人行为的账号?
  • RQ4哪些类型的账号(如认证账号、商业账号、用户生成内容账号)最易受人为膨胀影响?
  • RQ5移除疑似虚假账号的转发后,趋势动力学是否恢复为类似推特的自然衰减模式?

主要发现

  • 转发在新浪微博推动趋势方面的作用显著大于在推特上的作用,每条帖子的转发集中度更高。
  • 仅占采样用户1.08%的虚假账号,却贡献了与趋势关键词相关的全部转发中的49%。
  • 98%的趋势关键词出现在被疑似垃圾信息账号转发的帖子中,表明其在人为膨胀中几乎无处不在。
  • 4,665名用户(所有被转发帖子用户中的68%)的内容被疑似垃圾信息账号放大,其中79%为认证或专家账号。
  • 被转发次数最多的前10名账号主要为以笑话、故事和测验内容为主的用户生成内容平台,其中仅2名为认证账号。
  • 在移除疑似虚假账号的推文后,话题趋势的演化遵循与推特相似的自然衰减模式,证实人为膨胀是导致异常趋势行为的主要原因。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。