Skip to main content
QUICK REVIEW

[论文解读] Example-Based Named Entity Recognition

Morteza Ziyadi, Yuting Sun|arXiv (Cornell University)|Aug 24, 2020
Topic Modeling参考文献 25被引用 29
一句话总结

本文提出了一种无需训练、基于样本的命名实体识别(NER)方法,受问答启发,仅需少量支持样本即可实现对新实体类型的零样本适应。在仅使用每类10个支持样本的情况下,该方法在ATIS和MIT Movie等域外数据集上实现了超过30%的F1分数绝对提升,优于先前的最先进方法,在低样本设置下表现更优。

ABSTRACT

We present a novel approach to named entity recognition (NER) in the presence of scarce data that we call example-based NER. Our train-free few-shot learning approach takes inspiration from question-answering to identify entity spans in a new and unseen domain. In comparison with the current state-of-the-art, the proposed method performs significantly better, especially when using a low number of support examples.

研究动机与目标

  • 解决在无需微调的情况下,于低资源、域外设置中识别新型未见命名实体的挑战。
  • 使非专家用户能够仅用极少数据且无需模型重训练,快速将NER模型适配至自定义业务实体。
  • 开发一种领域无关、实体无关的NER系统,通过少量样本支持实现对多样化和未见领域的泛化。
  • 克服现有少样本NER方法依赖层次结构、领域特定分布或大规模支持集的局限性。
  • 系统性地评估从相似和不相似领域迁移知识的效果,特别是在极端低样本条件下的表现。

提出的方法

  • 将无需训练的少样本NER建模为实体无关的跨度抽取任务,将问题视为基于支持样本识别相关跨度。
  • 采用新颖的句子级注意力机制,为每个查询输入动态选择最相关的支持样本。
  • 使用基于自注意力的标记级相似度策略,计算查询标记与支持样本标记之间的相关性。
  • 在大规模开放领域NER数据集(如OntoNotes 5.0)上进行训练,以学习可泛化的表示,而无需记忆特定实体类型。
  • 应用零样本推理机制,模型仅使用少量标注样本作为上下文,直接预测新领域中的跨度。
  • 利用注意力机制建模支持样本与查询序列之间的相关性,实现少样本泛化。

实验结果

研究问题

  • RQ1当每类仅提供10个支持样本时,无需训练、基于样本的NER模型是否能优于现有少样本方法?
  • RQ2该模型在训练期间未见过的域外实体上泛化能力如何,特别是在目标领域与源分布相距较远时?
  • RQ3在仅使用少量支持样本的情况下,能否从相似领域(如SNIPS领域)成功将知识迁移至保留的目标领域?
  • RQ4与邻居标记等简单基线方法相比,所提出的基于注意力的样本选择机制在F1分数和低样本设置下的鲁棒性如何?
  • RQ5不同的训练和评分策略对无需训练少样本NER性能有何影响?

主要发现

  • 在ATIS数据集上,该方法使用每类10个支持样本即达到31.3%的F1分数,相比基线邻居标记方法实现30%以上的绝对提升。
  • 在MIT Movie数据集上,模型在每类10个支持样本下达到29.6%的F1分数,而基线仅为4.8%,表明在不同领域中均表现出一致的性能提升。
  • 在从相似领域(SNIPS)迁移知识时,该方法在GetWeather领域达到78%的F1分数(每类10个样本),而基线仅为30%。
  • 在混合领域评估中,模型使用每类500个支持样本时仍保持27.3%的F1分数,显著优于基线方法。
  • 消融实验确认,句子级注意力机制和基于自注意力的相似度评分对性能至关重要,尤其在低样本场景下。
  • 该模型展现出强大的领域无关泛化能力,在无需微调的情况下,于多样化和域外数据集上均保持高性能。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。