[论文解读] Discussing Privacy and Surveillance on Twitter: A Case Study of COVID-19
本研究利用LDA主题建模和基于NLTK的情感分析,分析了2020年3月至4月期间Twitter上关于新冠疫情初期隐私与监控的讨论。研究发现,公众对政府和企业监控的负面情绪持续上升,尤其与接触追踪应用程序和Zoom等视频会议工具相关,负面情绪从29%上升至33%,而正面情绪则从37%下降至28%。
Technology is uniquely positioned to help us analyze large amounts of information to provide valuable insight during widespread public health concerns, like the ongoing COVID-19 pandemic. In fact, information technology companies like Apple and Google have recently launched tools for contact tracing-the ability to process location data to determine the people who have been in contact with a possible patient, in order to contain the spread of the virus. While China and Singapore have successfully led the effort, more and more countries are now implementing such surveillance systems, raising potential privacy concerns about this long term surveillance. For example, it is not clear what happens to the information post-pandemic because people are more likely to share their information during a global crisis without governments having to elaborate on their data policies. Digital Ethnography on Twitter, which has over 330 million users worldwide, with a majority in the United States where the pandemic has the worst effects provides a unique opportunity to learn about real-time opinions of the general public about current affairs in a rather naturalistic setting. Consequently, it might be useful to highlight the privacy concerns of users, should they exist, through analysis of Twitter data and information sharing policies during unprecedented public health outbreaks. This will allow governments to protect their citizens both during and after health emergencies.
研究动机与目标
- 了解公众在新冠疫情早期阶段关于隐私与监控的讨论如何演变。
- 识别Twitter上关于监控与隐私讨论中的主要主题与话题。
- 评估公众对监控措施的态度,特别是与疫情期间接触追踪和数据收集相关的措施。
- 考察媒体报道和技术事件(例如Zoom漏洞)在塑造公众对隐私与监控态度方面的作用。
提出的方法
- 使用GetOldTweets和Tweepy API收集Twitter数据,聚焦于2020年3月1日至4月20日期间包含'coronavirus'和'privacy'等关键词的推文。
- 应用潜在狄利克雷分布(LDA)主题建模方法,设定10个主题,以识别关于隐私与监控的重复性讨论主题。
- 使用NLTK的朴素贝叶斯分类器进行情感分析,将推文分类为正面、负面或中性。
- 追踪推文数量、转发数和点赞数的随时间变化趋势,以评估用户对隐私相关内容的参与度。
- 采用文本预处理技术,包括分词、去除停用词和词干提取,以准备数据用于分析。
- 将情感变化与外部事件相关联,例如关于监控和Zoom安全漏洞的重大新闻报道。
实验结果
研究问题
- RQ1涉及新冠疫情监控的各类讨论话题有哪些?它们的出现频率如何?
- RQ2公众对监控的态度在疫情初期几个月内如何演变?
- RQ3媒体报道和技术事件在塑造公众对隐私与监控的态度方面发挥什么作用?
主要发现
- 对监控的负面情绪从3月的29%上升至4月的33%,表明公众担忧持续加剧。
- 对监控的正面情绪从3月的37%下降至4月的28%,尤其体现在‘非常正面’情绪的减少。
- 中性情绪保持主导地位,分别占3月的34%和4月的38%,表明大多数推文传递的是事实信息而非观点。
- 互动量最高的推文是一篇关于广泛监控的事实性文章链接,而非情绪化内容。
- 主题建模显示,讨论主要围绕政府监控、数据保护以及接触追踪应用和视频会议工具相关的隐私问题展开。
- 2020年3月23日推文数量激增,与《纽约时报》发表的一篇关于监控的评论文章时间点吻合,表明媒体报道对公众讨论具有显著影响。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。