[论文解读] Analyzing the Targets of Hate in Online Social Media
本论文使用句子结构检测器分析 Whisper 和 Twitter 上的仇恨言论目标,创建了大规模仇恨言论数据集,并将目标分为九类仇恨类别。
Social media systems allow Internet users a congenial platform to freely express their thoughts and opinions. Although this property represents incredible and unique communication opportunities, it also brings along important challenges. Online hate speech is an archetypal example of such challenges. Despite its magnitude and scale, there is a significant gap in understanding the nature of hate speech on social media. In this paper, we provide the first of a kind systematic large scale measurement study of the main targets of hate speech in online social media. To do that, we gather traces from two social media systems: Whisper and Twitter. We then develop and validate a methodology to identify hate speech on both these systems. Our results identify online hate speech forms and offer a broader understanding of the phenomenon, providing directions for prevention and detection approaches.
研究动机与目标
- 通过解决在流行社交媒体中对在线仇恨言论缺乏宏观理解的问题来推动本研究。
- 开发一种基于句子结构的可扩展方法,用于识别社交媒体帖文中的仇恨言论。
- 为 Whisper 和 Twitter 构建并验证仇恨言论数据集。
- 对仇恨目标进行特征化,以揭示在线仇恨的普遍形式和模式。
提出的方法
- 将仇恨言论定义为由对群体特征的偏见驱动的冒犯。
- 使用句子结构模式检测形式为 I <intensity> <userintent> <hatetarget> 的仇恨帖文。
- 以 <one word> people 等模板以及 Hatebase 词表( offensivity >50)进行仇恨目标分析。
- 从 Hatebase 抓取仇恨词并筛选高冒犯性词汇(满足 >50% 的 116 个词)。
- 人工将仇恨目标分类为九个类别(Race, Behavior, Physical, Sexual orientation, Class, Gender, Ethnicity, Disability, Religion)再加上 Other。
实验结果
研究问题
- RQ1Twitter 与 Whisper 帖文中仇恨言论的主要目标是什么?
- RQ2不同仇恨类别在这两个平台上的流行程度如何?
- RQ3基于模式的方法是否能够可靠识别仇恨言论以构建大规模数据集?
- RQ4在类别分布方面,Whisper(匿名)和 Twitter(公开)的仇恨目标是否存在差异?
主要发现
- 该方法识别出含有仇恨言论的 tweets 20,305 条和 whispers 7,604 条。
- 最常见的仇恨目标在两个平台上都包括 Race、Behavior 和 Physical。
- Whisper 在某些部分显示出与 Race 相关的仇恨比例较低,以及 Non-race 分类比例较高,可能是由于事前筛选。
- 九个定义的仇恨类别覆盖了大多数目标(两个数据集中大多数目标落在 Race、Behavior、Physical)。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。