QUICK REVIEW

[论文解读] Abusive Language Detection with Graph Convolutional Networks

Pushkar Mishra, Marco Del Tredici|arXiv (Cornell University)|Apr 5, 2019

Hate Speech and Cyberbullying Detection参考文献 18被引用 46

一句话总结

本文提出了一种异构图方法和图卷积网络，用于建模在线社区和语言行为以进行滥用语言检测，在基线方法之上取得更优结果。

ABSTRACT

Abuse on the Internet represents a significant societal problem of our time. Previous research on automated abusive language detection in Twitter has shown that community-based profiling of users is a promising technique for this task. However, existing approaches only capture shallow properties of online communities by modeling follower-following relationships. In contrast, working with graph convolutional networks (GCNs), we present the first approach that captures not only the structure of online communities but also the linguistic behavior of the users within them. We show that such a heterogeneous graph-structured modeling of communities significantly advances the current state of the art in abusive language detection.

研究动机与目标

通过将作者的语言行为纳入考虑，动机在于超越仅使用纯结构的社区特征。
提出一种两图表示（社区图和扩展的作者-推文图）以同时捕捉社交结构和文本内容。
开发一种基于半监督GCN的方法，以学习反映语言行为与社区结构的作者画像。
使用 Waseem & Hovy Twitter 数据集子集，将基于 GCN 的方法与强基线进行比较。
通过实验证明基于 GCN 的作者画像优于现有方法。

提出的方法

将社区表示为两张图：一张同质的作者图，以及一张扩展的异质图，包含作者节点和推文节点。
在同质图上使用 node2vec 作为基线来获得作者画像。
对扩展图应用两层图卷积网络以学习所有节点的嵌入，使用带标签的推文节点进行半监督训练。
输入特征为二进制词袋向量；作者的特征对其所有推文的特征进行聚合。
在带标签的推文节点上使用交叉熵损失进行训练，并从第一层 GCN 提取 200 维嵌入作为作者。
与基线比较：基于字符 n-gram 的逻辑回归（lr），以及在两张图上使用 node2vec 的作者画像的 lr+auth、lr+extd，以及 lr+gcn。

实验结果

研究问题

RQ1包含作者及其推文的异构图是否能在滥用语言检测方面超越仅包含作者的图？
RQ2通过 GCN 引入语言信号是否能改善作者画像和推文分类，相较于 node2vec 基线？
RQ3基于 GCN 的画像在 racism、sexism 和总体分类指标上的表现如何？

主要发现

方法	种族主义 P	种族主义 R	种族主义 F1	性别歧视 P	性别歧视 R	性别歧视 F1	总体 P	总体 R	总体 F1
lr	80.59	70.62	75.28	83.12	62.54	71.38	83.18	75.62	78.75
lr + auth	77.95	78.35	78.15	87.28	78.41	82.61	85.26	83.28	84.18
lr + extd	77.95	78.35	78.15	87.02	78.73	82.67	85.17	83.33	84.17
gcn †	74.12	64.95	69.23	82.48	82.22	82.35	81.90	79.42	80.56
lr + gcn †	79.08	79.90	79.49	88.24	80.95	84.44	86.23	84.73	85.42

lr+gcn 方法显著优于所有其他方法（p<0.05，配对t检验）。
作者画像来自 GCN 同时捕捉到社区结构和语言行为，解决了常规模型作者画像的错误分类。
GCN 单独使用在 sexism 上召回率高但精确率较低，并且由于少量滥用作者贡献混合内容，在 racism 上表现不佳。
将 lr 与 GCN 结合（lr+gcn）通过引入推文级字符 n-gram 特征缓解了 racism 的问题。
在扩展图上基于 node2vec 的作者画像对比仅社区图几乎没有提升，与 GCN 方一致。
总体上，lr+gcn 在 racism、sexism 和 clean 类别上实现了最佳的宏平均精确率、召回率和 F1。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。