QUICK REVIEW

[论文解读] Open-Domain Targeted Sentiment Analysis via Span-Based Extraction and Classification

Minghao Hu, Yuxing Peng|arXiv (Cornell University)|Jun 10, 2019

Sentiment Analysis and Opinion Mining参考文献 41被引用 23

一句话总结

本文提出了一种基于跨度的提取-分类框架，用于开放域目标情感分析，用直接跨度抽取和基于跨度表示的情感极性分类取代传统的序列标注。该方法显著优于序列标注基线模型，在三个基准数据集上实现了最先进性能，通过减小搜索空间并提升多词目标的情感一致性。

ABSTRACT

Open-domain targeted sentiment analysis aims to detect opinion targets along with their sentiment polarities from a sentence. Prior work typically formulates this task as a sequence tagging problem. However, such formulation suffers from problems such as huge search space and sentiment inconsistency. To address these problems, we propose a span-based extract-then-classify framework, where multiple opinion targets are directly extracted from the sentence under the supervision of target span boundaries, and corresponding polarities are then classified using their span representations. We further investigate three approaches under this framework, namely the pipeline, joint, and collapsed models. Experiments on three benchmark datasets show that our approach consistently outperforms the sequence tagging baseline. Moreover, we find that the pipeline model achieves the best performance compared with the other two models.

研究动机与目标

为解决序列标注在开放域目标情感分析中的局限性，如搜索空间过大以及多词目标的情感不一致问题。
设计一种基于跨度的标注方案，直接对目标跨度及其情感极性进行标注。
在流水线、联合和坍缩训练方案下，评估基于 BERT 的模型在提取-分类框架中的有效性。
证明使用完整目标表示进行跨度级情感极性分类，优于词级标注方法。

提出的方法

使用预训练的 BERT 编码器作为上下文表示的主干网络。
采用启发式多跨度解码算法，从句子中提取多个候选观点目标。
应用基于跨度的情感极性分类器，利用整个目标跨度的池化表示来预测情感极性。
引入一种基于跨度的标注方案，其中每个目标均以起始/结束位置和情感极性进行标注。
比较三种训练范式：流水线（先提取后分类）、联合（共享参数的端到端）和坍缩（将跨度和极性联合预测为一个标签）。
利用跨度表示，通过将整个目标作为一个整体进行建模，确保多词目标间的情感一致性。

实验结果

研究问题

RQ1与序列标注相比，基于跨度的标注方案是否能减小搜索空间并提升开放域目标情感分析的性能？
RQ2在基于跨度的框架下，流水线、联合和坍缩模型在性能和鲁棒性方面如何比较？
RQ3与词级标注相比，基于跨度的情感极性分类能否缓解多词目标中的情感不一致问题？
RQ4提取-分类框架是否在标准基准数据集上优于序列标注基线模型？
RQ5为何在此设置下，流水线模型的性能优于联合和坍缩模型？

主要发现

基于跨度的方法在三个基准数据集（LAPTOP、REST 和 TWITTER）上均达到最先进性能，情感分类的绝对提升分别为 9.97%、8.15% 和 15.4%，显著优于标注基线模型。
流水线模型始终优于联合模型和坍缩模型，表明将提取与分类解耦可提升整体性能。
基于跨度的情感极性分类器有效减少了情感不一致，表现为在不同目标长度下性能稳定，而标注基线模型在目标变长时准确率显著下降。
在 LAPTOP 数据集上，基于跨度的方法在情感分类中达到 81.39% 的准确率，超越了先前的最先进模型。
多目标提取器在长句中尤为有效，而标注方法因复杂度增加和标签组合性增强而表现下降。
案例研究证实，标注基线模型常在多词目标上无法保持情感一致性，而基于跨度的方法通过将完整目标作为整体建模，避免了此问题。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。