QUICK REVIEW
[论文解读] Example-Based Named Entity Recognition
Morteza Ziyadi, Yuting Sun|arXiv (Cornell University)|Aug 24, 2020
Topic Modeling参考文献 25被引用 29
一句话总结
本文提出了一种无需训练、基于样本的命名实体识别(NER)方法,受问答启发,仅需少量支持样本即可实现对新实体类型的零样本适应。在仅使用每类10个支持样本的情况下,该方法在ATIS和MIT Movie等域外数据集上实现了超过30%的F1分数绝对提升,优于先前的最先进方法,在低样本设置下表现更优。
ABSTRACT
We present a novel approach to named entity recognition (NER) in the presence of scarce data that we call example-based NER. Our train-free few-shot learning approach takes inspiration from question-answering to identify entity spans in a new and unseen domain. In comparison with the current state-of-the-art, the proposed method performs significantly better, especially when using a low number of support examples.
研究动机与目标
- 解决在无需微调的情况下,于低资源、域外设置中识别新型未见命名实体的挑战。
- 使非专家用户能够仅用极少数据且无需模型重训练,快速将NER模型适配至自定义业务实体。
- 开发一种领域无关、实体无关的NER系统,通过少量样本支持实现对多样化和未见领域的泛化。
- 克服现有少样本NER方法依赖层次结构、领域特定分布或大规模支持集的局限性。
- 系统性地评估从相似和不相似领域迁移知识的效果,特别是在极端低样本条件下的表现。
提出的方法
- 将无需训练的少样本NER建模为实体无关的跨度抽取任务,将问题视为基于支持样本识别相关跨度。
- 采用新颖的句子级注意力机制,为每个查询输入动态选择最相关的支持样本。
- 使用基于自注意力的标记级相似度策略,计算查询标记与支持样本标记之间的相关性。
- 在大规模开放领域NER数据集(如OntoNotes 5.0)上进行训练,以学习可泛化的表示,而无需记忆特定实体类型。
- 应用零样本推理机制,模型仅使用少量标注样本作为上下文,直接预测新领域中的跨度。
- 利用注意力机制建模支持样本与查询序列之间的相关性,实现少样本泛化。
实验结果
研究问题
- RQ1当每类仅提供10个支持样本时,无需训练、基于样本的NER模型是否能优于现有少样本方法?
- RQ2该模型在训练期间未见过的域外实体上泛化能力如何,特别是在目标领域与源分布相距较远时?
- RQ3在仅使用少量支持样本的情况下,能否从相似领域(如SNIPS领域)成功将知识迁移至保留的目标领域?
- RQ4与邻居标记等简单基线方法相比,所提出的基于注意力的样本选择机制在F1分数和低样本设置下的鲁棒性如何?
- RQ5不同的训练和评分策略对无需训练少样本NER性能有何影响?
主要发现
- 在ATIS数据集上,该方法使用每类10个支持样本即达到31.3%的F1分数,相比基线邻居标记方法实现30%以上的绝对提升。
- 在MIT Movie数据集上,模型在每类10个支持样本下达到29.6%的F1分数,而基线仅为4.8%,表明在不同领域中均表现出一致的性能提升。
- 在从相似领域(SNIPS)迁移知识时,该方法在GetWeather领域达到78%的F1分数(每类10个样本),而基线仅为30%。
- 在混合领域评估中,模型使用每类500个支持样本时仍保持27.3%的F1分数,显著优于基线方法。
- 消融实验确认,句子级注意力机制和基于自注意力的相似度评分对性能至关重要,尤其在低样本场景下。
- 该模型展现出强大的领域无关泛化能力,在无需微调的情况下,于多样化和域外数据集上均保持高性能。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。