[论文解读] Prevalence of Low-Credibility Information on Twitter During the COVID-19 Outbreak
本论文估算COVID-19期间Twitter上低可信信息的盛行率,分析机器人参与,并识别协调放大与政治化的迹象。
As the novel coronavirus spreads across the world, concerns regarding the spreading of misinformation about it are also growing. Here we estimate the prevalence of links to low-credibility information on Twitter during the outbreak, and the role of bots in spreading these links. We find that the combined volume of tweets linking to low-credibility information is comparable to the volume of New York Times articles and CDC links. Content analysis reveals a politicization of the pandemic. The majority of this content spreads via retweets. Social bots are involved in both posting and amplifying low-credibility information, although the majority of volume is generated by likely humans. Some of these accounts appear to amplify low-credibility sources in a coordinated fashion.
研究动机与目标
- 估算关于COVID-19在Twitter上推文中链接的低可信信息的盛行率。
- 描述社会化机器人在发布和放大低可信内容中的角色。
- 探索低可信信息协调放大的迹象。
- 分析与COVID-19相关的低可信内容的主题,以评估疫情的政治化。
提出的方法
- 使用既定标签标准对570个低可信来源的域名级可信度进行注释。
- 创建两个数据集:DS1 来自包含COVID-19标签和链接的推文的随机10%样本,DS2 来自包含低可信链接的推文。
- 展开短链接以识别真实域名,并在分析中排除推特及其他社交媒体链接。
- 使用 BotometerLite 检测机器人,将账户以0.5阈值分类为类机器人。
- 构建共享低可信链接的账户的相似度网络,以识别协调放大。
- 分析 DS2 中的文章标题,以识别常见的低可信主题。
实验结果
研究问题
- RQ1在COVID-19爆发期间,指向低可信来源的推文体积份额是多少?
- RQ2这部分体积中有多少是由社会机器人生成或放大?
- RQ3是否存在分享低可信链接的账户之间的协调放大证据?
- RQ4与COVID-19相关的低可信内容中,哪些主题最为普遍?
主要发现
- DS1中低可信链接占总推文体积的0.89%,与nytimes.com相当(0.98%),高于cdc.gov(<0.65%)。
- 大约68%的低可信链接通过转发分享,高于nytimes.com的转发率。
- 机器人账户对低可信推文体积的贡献比例高于可靠来源,在推文层面机器人比例为低可信为12.1%、nytimes.com为6.5%、总体链接为10.6%。
- 在转发中的机器人参与存在,类机器人账户吸引的转发机器人用户对低可信内容的比率高于对可靠来源。
- 相似度网络显示共享大量相同低可信来源的账户形成密集连接的簇,暗示协调放大。
- 词云分析显示疫情政治化,主题包括美国政治、爆发状态及经济问题;ZeroHedge 是一个突出低可信来源。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。