Skip to main content
QUICK REVIEW

[论文解读] Adapt or Get Left Behind: Domain Adaptation through BERT Language Model Finetuning for Aspect-Target Sentiment Classification

Alexander Rietzler, Sebastian Stabinger|arXiv (Cornell University)|Aug 30, 2019
Sentiment Analysis and Opinion Mining参考文献 20被引用 132
一句话总结

论文提出一个两步方法,先进行领域特定的BERT微调,再进行有监督的ATSC训练,在SemEval 2014餐馆数据集上达到最新的SOTA结果,并且实现了从笔记本领域到餐馆领域以及反向的鲁棒跨领域迁移。

ABSTRACT

Aspect-Target Sentiment Classification (ATSC) is a subtask of Aspect-Based Sentiment Analysis (ABSA), which has many applications e.g. in e-commerce, where data and insights from reviews can be leveraged to create value for businesses and customers. Recently, deep transfer-learning methods have been applied successfully to a myriad of Natural Language Processing (NLP) tasks, including ATSC. Building on top of the prominent BERT language model, we approach ATSC using a two-step procedure: self-supervised domain-specific BERT language model finetuning, followed by supervised task-specific finetuning. Our findings on how to best exploit domain-specific language model finetuning enable us to produce new state-of-the-art performance on the SemEval 2014 Task 4 restaurants dataset. In addition, to explore the real-world robustness of our models, we perform cross-domain evaluation. We show that a cross-domain adapted BERT language model performs significantly better than strong baseline models like vanilla BERT-base and XLNet-base. Finally, we conduct a case study to interpret model prediction errors.

研究动机与目标

  • 将ATSC作为ABSA中的一个细粒度情感任务进行动机阐释,并在现实应用中应对领域转移。
  • 研究领域特定的自监督微调对ATSC性能的影响。
  • 评估跨域迁移和联合域训练,以评估餐馆与笔记本领域的鲁棒性。

提出的方法

  • 两步程序:领域特定的自监督微调BERT语言模型,然后进行有监督的ATSC微调。
  • 通过输入 [CLS] sentence [SEP] target [SEP] 将ATSC 转换为BERT序列对分类。
  • 系统地改变微调领域(餐馆、笔记本,或两者)及训练设置(同领域、跨领域、联合域)。
  • 使用输入削减来解释模型预测并分析错误。

实验结果

研究问题

  • RQ1RQ1:在领域数据上对BERT语言模型进行微调的数量/程度如何影响ATSC的性能?
  • RQ2RQ2:在充分利用领域特定微调的前提下,进行同领域训练可达到的ATSC性能是多少?
  • RQ3RQ3:与同领域基线相比,跨域自适配(领域自适应的LM微调)对ATSC性能有何影响?
  • RQ4RQ4:联合域训练是否提升跨领域的性能?
  • RQ5RQ5:领域自适应后仍存在哪些错误类型,解释方法如何帮助理解它们?

主要发现

  • 领域特定的LM微调显著提升ATSC的准确性,增益在数千万条微调句子后因领域而异而呈现边际递减。
  • 在同领域的领域自适应LM上,餐馆和笔记本的结果接近SOTA,尤其是在餐馆领域取得新的SOTA(87.14%准确率)。
  • 跨域自适应(目标域LM微调模型)在多数情况下优于BERT-base,举例而言,取决于源域/目标域配对,提升约+2.2–3.6个百分点。
  • 联合域训练(Laptops+Restaurants)进一步提升宏观F1,特别是在类别不平衡的数据集中,中性类别的性能受益。
  • 通过输入削减的案例研究表明,领域自适应模型更能捕捉依赖上下文的情感表达和否定,但中性案例仍具有挑战性。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。