[论文解读] Modeling Rich Contexts for Sentiment Classification with LSTM
本文提出了一种分层LSTM模型,通过建模转发/回复线程,捕捉社交媒体文本中的长距离上下文依赖关系,显著提升了情感分类的准确率。通过结合词级别和推文级别LSTM,并引入额外的社会和文本上下文特征,该模型在检测对话情境中的反讽和情感漂移方面优于基线方法。
Sentiment analysis on social media data such as tweets and weibo has become a very important and challenging task. Due to the intrinsic properties of such data, tweets are short, noisy, and of divergent topics, and sentiment classification on these data requires to modeling various contexts such as the retweet/reply history of a tweet, and the social context about authors and relationships. While few prior study has approached the issue of modeling contexts in tweet, this paper proposes to use a hierarchical LSTM to model rich contexts in tweet, particularly long-range context. Experimental results show that contexts can help us to perform sentiment classification remarkably better.
研究动机与目标
- 为解决在微博和Twitter等短文本、噪声较大的社交媒体文本中进行情感分类的挑战,其中上下文至关重要但常被忽视。
- 建模推文线程中的长距离上下文依赖关系,特别是转发和回复历史,这些因素会影响情感极性。
- 通过整合社会关系和话语结构等丰富上下文特征,提升情感分类性能。
- 开发一种分层深度学习架构,以捕捉局部推文级别和全局线程级别的依赖关系。
提出的方法
- 提出一种两级分层LSTM架构:词级别LSTM编码单条推文,而推文级别LSTM则建模对话线程中推文的序列。
- 该模型整合了额外的上下文特征,包括社会上下文(关注者/被关注者关系)和文本上下文(主题相似性、话语标记),这些特征均从数据中自动提取。
- 词嵌入在大规模中文推文语料上预训练,并在训练过程中微调,维度为128。
- 分层结构使模型能够学习线程中多条推文之间的长距离依赖关系,缓解了标准RNN中的梯度消失问题。
- 该模型在新收集的14,000条推文、1,600个线程、涵盖50个主题的微博数据集上进行训练和评估。
- 通过3:1:1的训练/验证/测试集划分进行超参数调优,性能通过Macro-F1和准确率衡量。
实验结果
研究问题
- RQ1建模长距离转发/回复历史是否能提升在短文本、噪声较大的社交媒体文本上的情感分类性能?
- RQ2分层LSTM架构在捕捉对话线程中多条推文之间的上下文依赖关系方面有多有效?
- RQ3额外的上下文特征(如社会关系和话语结构)在多大程度上提升了情感分类性能?
- RQ4该模型在检测对话情境中的反讽和情感漂移方面是否优于标准LSTM和其他基线方法?
主要发现
- 分层LSTM(HLSTM)模型在性能上显著优于标准LSTM和SVM基线模型,证明了建模长距离上下文的有效性。
- HLSTM模型在Macro-F1和准确率上均优于标准LSTM,证实长距离依赖关系对准确情感分类至关重要。
- 引入额外上下文特征(HLSTM-f)可进一步提升性能,但由于特征稀疏性,增益有限。
- 案例研究显示,HLSTM能正确分类反讽和模糊的推文(如使用反语或同意/反对标记的推文),而标准LSTM则失败。
- 46.9%的推文与根推文具有相同的情感极性,64.7%的推文与父级推文具有相同的情感极性,表明上下文具有高度预测性。
- 该模型成功检测到情感漂移,例如在使用正面词汇但上下文表达负面情感的推文中识别出反讽。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。