Skip to main content
QUICK REVIEW

[论文解读] Leveraging Affective Bidirectional Transformers for Offensive Language Detection

AbdelRahim Elmadany, Chiyu Zhang|arXiv (Cornell University)|May 1, 2020
Hate Speech and Cyberbullying Detection参考文献 25被引用 6
一句话总结

本文提出了一种基于微调情感双向变压器的深度学习方法,用于检测阿拉伯语中的攻击性语言和仇恨言论。通过利用预训练的情感和情绪模型进行迁移学习,并应用自动数据增强技术,作者在官方测试数据上实现了89.60%的准确率和82.31%的宏平均F1分数,优于原始BERT模型。

ABSTRACT

Social media are pervasive in our life, making it necessary to ensure safe online experiences by detecting and removing offensive and hate speech. In this work, we report our submission to the Offensive Language and hate-speech Detection shared task organized with the 4th Workshop on Open-Source Arabic Corpora and Processing Tools Arabic (OSACT4). We focus on developing purely deep learning systems, without a need for feature engineering. For that purpose, we develop an effective method for automatic data augmentation and show the utility of training both offensive and hate speech models off (i.e., by fine-tuning) previously trained affective models (i.e., sentiment and emotion). Our best models are significantly better than a vanilla BERT model, with 89.60% acc (82.31% macro F1) for hate speech and 95.20% acc (70.51% macro F1) on official TEST data.

研究动机与目标

  • 开发一种完全基于深度学习的系统,用于攻击性语言和仇恨言论检测,无需人工特征工程。
  • 探索从预训练情感模型(情感和情绪)进行迁移学习在攻击性语言检测中的有效性。
  • 通过一种专为阿拉伯语文本设计的自动数据增强技术,提升模型的泛化能力。
  • 在阿拉伯语攻击性语言和仇恨言论检测的OSACT4共享任务中实现最先进性能。

提出的方法

  • 微调预训练的情感模型(情感和情绪)作为攻击性语言和仇恨言论检测的基础。
  • 应用自动数据增强方法,以增加训练数据的多样性并提升模型鲁棒性。
  • 使用增强后的数据端到端训练深度神经网络,无需手工设计特征。
  • 采用基于BERT的架构作为主干模型,并添加任务特定的分类头层。
  • 在OSACT4共享任务数据集上,使用交叉熵损失和标准微调流程对模型进行优化。
  • 使用准确率和宏平均F1作为主要指标,在官方测试集上评估模型性能。

实验结果

研究问题

  • RQ1在不进行特征工程的情况下,预训练的情感模型是否能显著提升阿拉伯语中攻击性语言检测的性能?
  • RQ2自动数据增强在提升低资源环境下攻击性语言检测模型泛化能力方面有多有效?
  • RQ3与从零开始训练相比,从情感和情绪模型进行迁移学习是否能带来更好的仇恨言论检测性能?
  • RQ4微调后的情感变压器在阿拉伯语攻击性语言检测中,相较于原始BERT模型,优势有多大?

主要发现

  • 所提出的方法在仇恨言论检测任务中实现了89.60%的准确率和82.31%的宏平均F1分数,显著优于原始BERT模型。
  • 在攻击性语言检测任务中,模型在官方测试数据上达到了95.20%的准确率和70.51%的宏平均F1分数,表现出强劲性能。
  • 微调预训练的情感模型相较于标准BERT微调带来了显著性能提升,表明情感先验具有重要价值。
  • 自动数据增强技术有助于提升模型在低资源阿拉伯语文本上的泛化能力和鲁棒性。
  • 结果证实,从情感和情绪模型进行迁移学习是阿拉伯语攻击性语言检测中一种可行且有效的策略。
  • 该系统在OSACT4共享任务中实现了最先进性能,验证了所提方法的有效性。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。