Skip to main content
QUICK REVIEW

[论文解读] Before Name-calling: Dynamics and Triggers of Ad Hominem Fallacies in Web Argumentation

Ivan Habernal, Henning Wachsmuth|arXiv (Cornell University)|Feb 19, 2018
Wikis in Education and Collaboration参考文献 45被引用 65
一句话总结

本文通过大规模标注和Reddit的Change My View数据集上的神经网络建模,研究了网络论辩中人身攻击谬误的动力学特征与语言触发因素。提出了一种多维的人身攻击分类体系,利用可解释神经网络识别修辞触发因素,并通过自注意力嵌入神经网络实现了81.0%的预测准确率,为在线辩论中的早期预警信号提供了洞见。

ABSTRACT

Arguing without committing a fallacy is one of the main requirements of an ideal debate. But even when debating rules are strictly enforced and fallacious arguments punished, arguers often lapse into attacking the opponent by an ad hominem argument. As existing research lacks solid empirical investigation of the typology of ad hominem arguments as well as their potential causes, this paper fills this gap by (1) performing several large-scale annotation studies, (2) experimenting with various neural architectures and validating our working hypotheses, such as controversy or reasonableness, and (3) providing linguistic insights into triggers of ad hominem using explainable neural network architectures.

研究动机与目标

  • 探究现实世界网络论辩中人身攻击谬误的定性与定量特征,挑战其稀少或易识别的假设。
  • 确定人类与机器可靠检测人身攻击谬误所需的最小论辩上下文,评估对话语境在谬误识别中的作用。
  • 识别在人身攻击前出现的语言与修辞触发因素,超越孤立案例,理解论辩话语中的累积过程。
  • 开发并验证一种具备可解释注意力机制的神经网络模型,实现人身攻击的预测,为在线讨论中的早期预警信号提供洞见。

提出的方法

  • 在Change My View(CMV)数据集的1,000多个Reddit线程中,开展了大规模众包标注,对人身攻击谬误进行标注,建立了新的基准数据集。
  • 训练并评估了多种神经网络架构,包括自注意力嵌入神经网络(SSAE-NN),基于论辩上下文预测人身攻击。
  • 应用注意力可视化技术以解释模型预测结果,并提取与后续人身攻击相关联的语言特征。
  • 通过消融研究评估不同话语层次(如孤立语句与对话序列)对检测性能的贡献。
  • 采用多层次分析框架:(1) 孤立状态下的个人攻击,(2) 无对话的直接攻击,(3) 完整人际论辩中的个人攻击。
  • 利用可解释人工智能(XAI)技术分析注意力权重,识别在谬误攻击前出现的修辞手法。

实验结果

研究问题

  • RQ1网络论辩中人身攻击的定性与定量特征是什么?它们与理论分类体系如何对应?
  • RQ2人类与机器学习模型准确检测人身攻击所需的先前论辩上下文有多大?
  • RQ3哪些语言与修辞特征可作为人身攻击的触发因素?这些特征能否通过神经网络预测?

主要发现

  • 通过自注意力嵌入神经网络,模型在预测人身攻击方面达到了81.0%的准确率,表明上下文特征是强有力的预测因子。
  • 人身攻击常由修辞手法(如指责性语言、讽刺、对谬误的指控)预先触发,模型成功学习到这些特征与后续谬误之间的关联。
  • SSAE-NN中的注意力机制突出了特定短语(如对自相矛盾的指控、谬误推理、缺乏证据的指责)作为人身攻击反应的关键触发因素。
  • 讽刺、具有强烈情感色彩的关键词(如“纳粹”、“强奸犯”)以及直接命令句与后续人身攻击行为高度相关,即使这些表达本身并非明显谬误。
  • 研究发现4.1%的评论被标注为人身攻击,其中大多数出现在一系列批判性或对抗性言论之后,表明存在动态累积过程。
  • 误报(假阴性)通常由高词汇密度的陈述或被误判的讽刺引起,表明对微妙或间接攻击的检测仍具挑战性。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。