[论文解读] There is Strength in Numbers: Avoiding the Hypothesis-Only Bias in Natural Language Inference via Ensemble Adversarial Training.
该论文提出集成对抗训练方法,通过联合优化对抗多个对手,减轻自然语言蕴涵(NLI)任务中仅依赖假设的偏差,减少虚假相关性。该方法在12个未见的NLI数据集上提升了零样本泛化能力,且在高维表示下使用更多对手时性能进一步提升。
Natural Language Inference (NLI) datasets contain annotation artefacts resulting in spurious correlations between the natural language utterances and their respective entailment classes. These artefacts are exploited by neural networks even when only considering the hypothesis and ignoring the premise, leading to unwanted biases. Previous work proposed tackling this problem via adversarial training, but this leads to learned sentence representations that still suffer from the same biases. As a solution, we propose using an ensemble of adversaries during the training, encouraging the model to jointly decrease the accuracy of these different adversaries while fitting the data. We show that using an ensemble of adversaries can prevent the bias from being relearned after the model training is completed, further improving how well the model generalises to different NLI datasets. In particular, these models outperformed previous approaches when tested on 12 different NLI datasets not used in the model training. Finally, the optimal number of adversarial classifiers depends on the dimensionality of the sentence representations, with larger dimensional representations benefiting when trained with a greater number of adversaries.
研究动机与目标
- 解决神经网络NLI模型在训练数据中学习标注伪像导致的虚假相关性这一长期存在的问题。
- 克服先前对抗训练方法的局限性,即模型在训练后重新学习相同的偏差,无法彻底消除偏差。
- 通过联合最小化多个对抗分类器的准确率,提升模型在分布外NLI数据集上的泛化能力。
- 探究表示维度与对抗数量之间的关系,以实现有效的偏差缓解。
提出的方法
- 在训练主NLI模型的同时,训练一个专门基于假设预测蕴涵标签的对抗分类器集合。
- 优化主模型以同时最小化所有集合中对抗分类器的准确率,从而鼓励学习到鲁棒的、依赖前提的表示。
- 在训练过程中使用基于梯度的更新方法来更新对抗分类器,确保其对主模型保持挑战性。
- 引入一个控制对抗分类器数量的超参数,其性能取决于句子表示的维度。
- 在整个NLI模型训练过程中端到端应用该方法,无需修改推理阶段或推理时处理流程。
- 通过联合最小化对抗分类器的性能,确保模型依赖前提特征而非假设特异性伪像。
实验结果
研究问题
- RQ1与单个对抗分类器方法相比,集成对抗训练是否能更有效地减少NLI模型中的仅依赖假设的偏差?
- RQ2对多个对抗分类器进行联合优化是否能提升在未见NLI数据集上的零样本泛化能力?
- RQ3对抗分类器的数量与句子表示的维度之间在偏差缓解效果方面有何交互关系?
- RQ4在完成训练后,使用集成对抗训练的模型是否仍能保持对标注伪像的鲁棒性?
主要发现
- 在训练期间未见过的12个NLI数据集上,采用集成对抗训练的模型表现优于先前方法。
- 该方法成功减少了对仅依赖假设线索的依赖,防止模型在训练后重新学习相同的偏差。
- 高维句子表示从更多对抗分类器中受益,表明表示容量与集成规模之间存在正相关关系。
- 该方法实现了改进的零样本泛化能力,展示了在多样化NLI基准数据集上的鲁棒性。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。