[论文解读] Transformation Networks for Target-Oriented Sentiment Classification
推出 TNet,一种基于 CNN 的模型,具有目标特定变换和上下文保持机制,以提升面向目标的情感分类,在基准数据集上实现了新的最先进水平。
Target-oriented sentiment classification aims at classifying sentiment polarities over individual opinion targets in a sentence. RNN with attention seems a good fit for the characteristics of this task, and indeed it achieves the state-of-the-art performance. After re-examining the drawbacks of attention mechanism and the obstacles that block CNN to perform well in this classification task, we propose a new model to overcome these issues. Instead of attention, our model employs a CNN layer to extract salient features from the transformed word representations originated from a bi-directional RNN layer. Between the two layers, we propose a component to generate target-specific representations of words in the sentence, meanwhile incorporate a mechanism for preserving the original contextual information from the RNN layer. Experiments show that our model achieves a new state-of-the-art performance on a few benchmarks.
研究动机与目标
- 通过解决注意力引起的噪声和 CNN 的局限性,推动改进的面向目标的情感分类。
- 提出新颖的目标特定变换(TST)模块,使词表示对每个目标进行定制。
- 引入上下文保持机制,在深层变换层之间维持上下文信息。
- 采用基于邻近性的带位置信息的 CNN 特征提取,以突出与目标相关的情感词。
- 在多个基准数据集(LAPTOP、REST、TWITTER)上展示最先进的性能。
提出的方法
- 用 BiLSTM 编码上下文,以获得上下文化的词表示。
- 通过动态的目标特定变换(TST)生成对目标特定的词表示,使目标词与各自的上下文词相关联。
- 引入上下文保持机制(无损前传或自适应缩放),在 CPT 层之间保留上下文信息。
- 应用基于邻近性的带位置信息的 CNN,聚焦于接近目标的观点词,随后进行最大池化和 softmax 分类。
实验结果
研究问题
- RQ1用将注意力替换为目标特定变换是否可以改善面向目标的情感分类?
- RQ2具备上下文保持的深层变换结构是否比以往的 CNN 或 RNN 方法更好地捕捉目标-上下文交互?
- RQ3具备近邻感知的 CNN 在对特定目标进行情感分析时对性能有何影响?
- RQ4CPT 层数对分类准确性和稳定性有何影响?
主要发现
- TNet 的变体(LFa 和 AS)在 LAPTOP、REST 和 TWITTER 数据集上均达到最佳性能。
- 具备上下文保持机制的目标特定变换(TST)显著优于消融变体和若干强基线。
- 基于近邻的位权重提升了 CNN 识别正确的目标相关情感短语的能力。
- 最优的 CPT 深度为 2 层;更深的架构因训练难度增加而导致性能下降。
- 用注意力替代 CPT(LSTM-ATT-CNN)在这些任务上通常不及 TNet,尤其是在像 TWITTER 这样的噪声数据上。
- TNet-LF 与 TNet-AS 在对比方法上表现出一致的改进,且统计上显著优于竞争方法。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。