[论文解读] "Go eat a bat, Chang!": On the Emergence of Sinophobic Behavior on Web Communities in the Face of COVID-19
本研究利用来自 Twitter 和 4chan 的 /pol/ 论坛的大规模数据集,调查了新冠疫情爆发期间网络社区中排华行为的兴起。研究发现,排华内容在主流和边缘平台均显著上升,语言特征发生明显变化——Twitter 上对中国的指责增加,而 /pol/ 上则涌现出诸如 'kungflu' 和 'asshoe' 等新俚语,这些现象由现实事件和通过时间词嵌入捕捉到的语义演变所驱动。
The outbreak of the COVID-19 pandemic has changed our lives in unprecedented ways. In the face of the projected catastrophic consequences, many countries have enacted social distancing measures in an attempt to limit the spread of the virus. Under these conditions, the Web has become an indispensable medium for information acquisition, communication, and entertainment. At the same time, unfortunately, the Web is being exploited for the dissemination of potentially harmful and disturbing content, such as the spread of conspiracy theories and hateful speech towards specific ethnic groups, in particular towards Chinese people since COVID-19 is believed to have originated from China. In this paper, we make a first attempt to study the emergence of Sinophobic behavior on the Web during the outbreak of the COVID-19 pandemic. We collect two large-scale datasets from Twitter and 4chan's Politically Incorrect board (/pol/) over a time period of approximately five months and analyze them to investigate whether there is a rise or important differences with regard to the dissemination of Sinophobic content. We find that COVID-19 indeed drives the rise of Sinophobia on the Web and that the dissemination of Sinophobic content is a cross-platform phenomenon: it exists on fringe Web communities like \\dspol, and to a lesser extent on mainstream ones like Twitter. Also, using word embeddings over time, we characterize the evolution and emergence of new Sinophobic slurs on both Twitter and /pol/. Finally, we find interesting differences in the context in which words related to Chinese people are used on the Web before and after the COVID-19 outbreak: on Twitter we observe a shift towards blaming China for the situation, while on /pol/ we find a shift towards using more (and new) Sinophobic slurs.
研究动机与目标
- 理解排华行为在新冠疫情早期阶段如何在网页社区中出现并演变。
- 调查排华内容的传播是否为跨平台现象,涵盖主流与边缘在线社区。
- 分析疫情爆发前后与中国人相关的语言使用变化。
- 识别并追踪新排华俚语的出现及其随时间的语义演变。
提出的方法
- 收集覆盖疫情早期阶段五个月的 Twitter 和 4chan 的 /pol/ 论坛的大规模数据集。
- 对用户发帖进行时间分析,追踪疫情爆发前后排华内容流行度的变化。
- 应用时间词嵌入技术,建模 'chinese'、'virus'、'bat'、'pangolin' 等术语以及 'chink' 和 'chinazi' 等俚语的语义演变。
- 计算关键术语之间的余弦相似度,以衡量其在话语语境中的语义关联性与演变。
- 基于图的分析,识别排华术语在共现关系与网络结构中的模式。
- 比较 Twitter 和 /pol/ 上的语言行为,以检测仇恨言论表达的平台特异性差异。
实验结果
研究问题
- RQ1在新冠疫情爆发前后,Twitter 和 /pol/ 上排华内容的流行度如何变化?
- RQ2在主流平台(如 Twitter)与边缘社区(如 /pol/)中,排华俚语的类型及其演变有何关键差异?
- RQ3在这些平台上,'Chinese'、'virus'、'bat' 和 'pangolin' 等术语之间的语义关系如何随时间演变?
- RQ4疫情期间出现了哪些新的排华俚语?它们如何反映关于 SARS-CoV-2 起源的 discourse 演变?
- RQ5与疫情相关的现实事件在多大程度上与排华内容的激增及语义演变相关?
主要发现
- 在新冠疫情爆发后,Twitter 和 /pol/ 上均观察到排华内容显著增加,Twitter 上 'chinazi' 使用频率上升,/pol/ 上则更常使用 'chink' 等俚语。
- 在两个平台上,'chinese' 与 'virus' 之间的余弦相似度随时间推移而增加,表明中国身份与病毒之间的语义关联日益紧密,尤其自 2020 年 1 月 19 日起。
- 在 /pol/ 上,'kungflu' 一词自 2020 年 1 月后出现,成为新的排华俚语,反映出将疫情重新定义为源自中国的疾病的努力。
- 在 Twitter 上,'asshoe' 一词作为讽刺中文英语发音的俚语出现,表明仇恨言论在该平台的语言演化具有独特性。
- 词嵌入分析显示,'chinese' 与 'bat' 之间的语义关系自 2020 年 1 月 26 日起显著增强,与关于病毒动物溯源的猜测增加相吻合。
- 尽管两个平台的排华言论均有所增加,但 /pol/ 上的转变更集中于新俚语的泛滥,而 Twitter 上则更多表现为对中国的疫情责任归咎。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。