[论文解读] A Joint Training Dual-MRC Framework for Aspect Based Sentiment Analysis
该论文提出一种统一的 dual-MRC 框架,将 ABSA 转换为两个问答任务,并联合训练两个 BERT-MRC 模型以提取方面术语、意见术语和情感,在 ABSA 子任务上实现了最先进的结果。
Aspect based sentiment analysis (ABSA) involves three fundamental subtasks: aspect term extraction, opinion term extraction, and aspect-level sentiment classification. Early works only focused on solving one of these subtasks individually. Some recent work focused on solving a combination of two subtasks, e.g., extracting aspect terms along with sentiment polarities or extracting the aspect and opinion terms pair-wisely. More recently, the triple extraction task has been proposed, i.e., extracting the (aspect term, opinion term, sentiment polarity) triples from a sentence. However, previous approaches fail to solve all subtasks in a unified end-to-end framework. In this paper, we propose a complete solution for ABSA. We construct two machine reading comprehension (MRC) problems and solve all subtasks by joint training two BERT-MRC models with parameters sharing. We conduct experiments on these subtasks, and results on several benchmark datasets demonstrate the effectiveness of our proposed framework, which significantly outperforms existing state-of-the-art methods.
研究动机与目标
- 提出需要一个能够端到端处理 AE、OE 与 SC 的统一 ABSA 框架的动机。
- 提出将 ABSA 子任务转换为两个带共享参数的 BERT 回路的 MRC 问题。
- 展示两个 MRC 模型的联合训练以覆盖 AE、OE、SC、AESC、Pair 和 Triple 等任务。
- 在基准 ABSA 数据集上进行评估,并展示相较于最先进方法的改进。
提出的方法
- 两台带共享参数的 BERT-MRC 模型对句子上下文进行编码。
- 左侧 MRC 识别方面术语(AE)的起始/结束跨度。
- 右侧 MRC 识别意见术语(OE)跨度和每个 AT 的情感极性(SC)。
- 联合损失将 AE、OE/SC(AOE)和情感分类目标结合在可调权重下。
- MRC 数据集构建使用 q1: 'Find the aspect terms in the text' 和 q2(AT): 'Find the sentiment polarity and opinion terms for AT in the text'。
实验结果
研究问题
- RQ1是否可以通过双 MRC 建模在统一的端到端框架中解决 ABSA 子任务?
- RQ2带共享参数的 BERT-MRC 模型是否比任务专用方法在 AE、OE、SC、AESC、Pair、Triple 等任务的提取与分类上有改进?
- RQ3端到端的联合训练是否比两阶段或流水线方法在 ABSA 上更有效率?
- RQ4将 ABSA 任务转换为 MRC 查询对边界检测和情感一致性问题有何影响?
主要发现
- dual-MRC 框架可以在单一模型内处理 AE、OE、SC、AESC、Pair、Triple。
- 共享参数的联合训练在基准数据集的多个 ABSA 子任务上实现了最先进或有竞争力的结果。
- 基于跨度的提取结合 MRC 相比先前的统一标注方法在边界检测和情感对齐方面有所提升。
- 推断以流水线方式进行,其中左侧 MRC 输出 AT,右侧 MRC 输出每个 AT 的 OT 和情感。
- 经验结果显示在来自 SemEval ABSA 任务的数据集上相对于基线有显著改进。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。