Skip to main content
QUICK REVIEW

[论文解读] Atalaya at TASS 2019: Data Augmentation and Robust Embeddings for Sentiment Analysis

Franco M. Luque|arXiv (Cornell University)|Sep 24, 2019
Sentiment Analysis and Opinion Mining被引用 28
一句话总结

该论文提出了一种简单但高效的方法,用于西班牙语推文的情感分析,结合了鲁棒的子词感知嵌入、通过双向翻译实现的数据增强以及一种新颖的实例交叉技术,并采用集成线性模型。尽管架构复杂度极低,该系统在TASS 2019共享任务中仍取得了顶级性能,证明了鲁棒表示与数据增强在小规模、噪声较大的数据集上的强大影响。

ABSTRACT

In this article we describe our participation in TASS 2019, a shared task aimed at the detection of sentiment polarity of Spanish tweets. We combined different representations such as bag-of-words, bag-of-characters, and tweet embeddings. In particular, we trained robust subword-aware word embeddings and computed tweet representations using a weighted-averaging strategy. We also used two data augmentation techniques to deal with data scarcity: two-way translation augmentation, and instance crossover augmentation, a novel technique that generates new instances by combining halves of tweets. In experiments, we trained linear classifiers and ensemble models, obtaining highly competitive results despite the simplicity of our approaches.

研究动机与目标

  • 解决西班牙语推文低资源情感分析中的数据稀缺问题。
  • 通过在9000万条推文上训练的子词感知词嵌入提升模型鲁棒性。
  • 评估新型数据增强技术(包括实例交叉与基于翻译的增强)的有效性。
  • 在不使用复杂深度学习架构的情况下实现具有竞争力的性能。
  • 通过消融研究分析各组件的贡献。

提出的方法

  • 通过加权平均结合词袋(BoW)、字符袋(BoC)和推文嵌入,构建推文表示。
  • 在来自不同西班牙语国家的9000万条推文语料上训练fastText子词感知嵌入,以提升覆盖范围与鲁棒性。
  • 应用两种数据增强策略:双向翻译(翻译为英语、法语、葡萄牙语和阿拉伯语,以及反向翻译)和实例交叉,后者通过组合不同推文的一半内容生成新的训练样本。
  • 通过降噪、否定处理和归一化等预处理步骤,提升语义表示质量。
  • 采用逻辑回归与集成袋装模型作为分类器,并在开发集上进行超参数调优。
  • 通过消融研究隔离各组件(包括表示方法、增强技术与模型类型)的贡献。

实验结果

研究问题

  • RQ1作为一项新颖的无资源数据增强技术,实例交叉增强在低资源设置下对情感分类的提升效果如何?
  • RQ2与标准词嵌入相比,鲁棒的子词感知嵌入在处理如推文这类短文本、噪声较大的数据时,性能提升程度如何?
  • RQ3在低资源情感分析中,经过恰当特征工程与数据增强的简单线性模型能否超越复杂的神经网络?
  • RQ4不同文本表示方法(BoW、BoC、推文嵌入)对整体系统性能的相对贡献是什么?
  • RQ5数据增强技术对多分类情感分析中少数类(NEU、NONE)的分类影响如何?

主要发现

  • 最佳系统在ES数据集测试集上取得了48.42的宏F1分数,在子任务1中排名第二。
  • 实例交叉增强技术提升了F1分数,而未影响整体准确率,表明其对少数类(NEU与NONE)具有特定优势。
  • 推文嵌入的贡献显著高于BoW或BoC表示,完整系统在ES开发集上达到64.37%的准确率与52.77%的宏F1分数。
  • 消融研究显示,若移除嵌入,宏F1分数将降至41.83%,凸显其在性能中的关键作用。
  • 尽管实验有限,跨语言结果表现强劲,系统在子任务2的PE、UY和MX中均排名第一,PE测试集准确率达54.64%。
  • 基于翻译的增强与实例交叉的结合取得了最佳结果,完整系统在所有数据集上均优于基线模型。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。