Skip to main content
QUICK REVIEW

[论文解读] A Deeper Look into Sarcastic Tweets Using Deep Convolutional Neural Networks

Soujanya Poria, Erik Cambria|arXiv (Cornell University)|Oct 27, 2016
Sentiment Analysis and Opinion Mining参考文献 31被引用 204
一句话总结

论文提出一种基于深度 CNN 的讽刺检测框架,能够从预训练模型自动提取情感、情绪和性格特征,并将其与基线 CNN 特征结合,以提高在 Twitter 数据上的检测性能和泛化能力。

ABSTRACT

Sarcasm detection is a key task for many natural language processing tasks. In sentiment analysis, for example, sarcasm can flip the polarity of an "apparently positive" sentence and, hence, negatively affect polarity detection performance. To date, most approaches to sarcasm detection have treated the task primarily as a text categorization problem. Sarcasm, however, can be expressed in very subtle ways and requires a deeper understanding of natural language that standard text categorization techniques cannot grasp. In this work, we develop models based on a pre-trained convolutional neural network for extracting sentiment, emotion and personality features for sarcasm detection. Such features, along with the network's baseline features, allow the proposed models to outperform the state of the art on benchmark datasets. We also address the often ignored generalizability issue of classifying data that have not been seen by the models at learning phase.

研究动机与目标

  • 将讽刺检测作为一个任务来推动在情感分析中可能翻转极性,并且传统文本分类未能完全覆盖。
  • 提出一个深度 CNN 框架,能够从数据中自动学习讽刺特征。
  • 探究预训练的情感、情绪和性格模型是否能够提升讽刺检测。
  • 评估模型在随时间和主题变化的 Twitter 数据上的泛化能力。
  • 评估特征融合和 CNN-SVM 分类策略的有效性。

提出的方法

  • 使用预训练 CNN 将情感、情绪和性格特征提取为讽刺检测的额外输入。
  • 使用从 word2vec 初始化的词嵌入表示句子,并在训练期间允许非静态微调。
  • 在各自的基准上训练独立的情感、情绪和性格 CNN 模型,以生成固定长度的特征向量。
  • 通过特征拼接将基线 CNN 与预训练特征(情感、情绪、性格)结合,并进行 SVM 分类(CNN-SVM)。
  • 探索两种训练范式:端到端的 CNN 分类和将 CNN 提取的特征输入到 SVM 进行最终决策。

实验结果

研究问题

  • RQ1CNN 基于框架能否从数据中自动学习讽刺相关特征?
  • RQ2将预训练的情感、情绪和性格模型与基线 CNN 特征融合时,是否能带来有意义的提升?
  • RQ3这些特征集在平衡和不平衡的讽刺数据集以及跨数据集泛化中的表现如何?
  • RQ4将基线特征与预训练特征结合对检测性能和泛化有什么影响?

主要发现

  • 基线特征在跨数据集的讽刺检测中单独就很强。
  • 在预训练模型中,预训练的情感特征表现为最佳的单独性能。
  • 将基线特征与情感、情绪和性格特征合并可显著提升 F1 分数(尤其在数据集 1 和数据集 3)。
  • CNN-SVM 通常在各特征配置下优于纯 CNN。
  • 该方法在基准数据集上达到最先进或具有竞争力的结果,全部特征结合时尤有显著提升。
  • 泛化测试表明跨数据集的性能具有挑战性,预训练特征有帮助但不能替代强健的训练数据。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。