Skip to main content
QUICK REVIEW

[论文解读] Understanding the perception of COVID-19 policies by mining a multilanguage Twitter dataset

Christian López, Malolan Vasu|arXiv (Cornell University)|Mar 23, 2020
Misinformation and Its Impacts被引用 106
一句话总结

该论文使用 NLP、文本挖掘和网络分析分析多语言 Twitter 数据,以捕捉 COVID-19 政策随时间的话语,并介绍来自疫情早期阶段的全球多语言推文数据集。

ABSTRACT

The objective of this work is to explore popular discourse about the COVID-19 pandemic and policies implemented to manage it. Using Natural Language Processing, Text Mining, and Network Analysis to analyze corpus of tweets that relate to the COVID-19 pandemic, we identify common responses to the pandemic and how these responses differ across time. Moreover, insights as to how information and misinformation were transmitted via Twitter, starting at the early stages of this pandemic, are presented. Finally, this work introduces a dataset of tweets collected from all over the world, in multiple languages, dating back to January 22nd, when the total cases of reported COVID-19 were below 600 worldwide. The insights presented in this work could help inform decision makers in the face of future pandemics, and the dataset introduced can be used to acquire valuable knowledge to help mitigate the COVID-19 pandemic.

研究动机与目标

  • 探索关于 COVID-19 及相关政策的热门话语。
  • 确定对疫情的反应如何随时间演变。
  • 了解在疫情早期阶段,信息和错误信息在 Twitter 上的传播。
  • 提供一个用于未来疫情研究的多语言 Twitter 数据集。

提出的方法

  • 使用自然语言处理来处理与 COVID-19 相关的推文。
  • 应用文本挖掘技术提取主题和情感。
  • 采用网络分析研究信息传播和话语联系。
  • 分析随时间变化的回应的时序变化。
  • 编制并发布一个自 2020 年 1 月 22 日起的多语言 Twitter 数据集。

实验结果

研究问题

  • RQ1在随时间的推移中,关于 COVID-19 政策的 Twitter 话语的主导主题是什么?
  • RQ2对疫情的回应如何在不同语言和地区之间差异?
  • RQ3疫情早期阶段信息和错误信息如何在 Twitter 上传播?
  • RQ4多语言推文数据集能为未来疫情决策提供哪些洞见?

主要发现

  • 对疫情及政策措施的常见反应的识别。
  • 证据表明自 2020 年初起信息和错误信息如何在 Twitter 上传播。
  • 关于 COVID-19 政策话语如何演变的时序洞察。
  • 一个公开可用的覆盖全球推文(自 2020 年 1 月 22 日起)的多语言推文数据集。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。