[论文解读] Event Extraction by Answering (Almost) Natural Questions
本文提出了一种新颖的问答(QA)框架,用于端到端事件抽取,通过将触发词检测和论元抽取建模为使用BERT的问答任务,绕过了对预先实体识别的需求。该方法在ACE 2005数据集上取得了最先进性能,并在未见过的论元角色上展现出强大的零样本泛化能力。
The problem of event extraction requires detecting the event trigger and extracting its corresponding arguments. Existing work in event argument extraction typically relies heavily on entity recognition as a preprocessing/concurrent step, causing the well-known problem of error propagation. To avoid this issue, we introduce a new paradigm for event extraction by formulating it as a question answering (QA) task that extracts the event arguments in an end-to-end manner. Empirical results demonstrate that our framework outperforms prior methods substantially; in addition, it is capable of extracting event arguments for roles not seen at training time (zero-shot learning setting).
研究动机与目标
- 解决传统事件抽取流水线中依赖独立实体识别所导致的误差传播问题。
- 克服神经网络模型在语义相似论元角色之间知识迁移的局限性,特别是在低资源或零样本设置下。
- 开发一个统一的端到端框架,通过自然语言问题直接抽取事件触发词和论元。
- 通过问题模板中的语义相似性,实现对训练期间未见论元角色的零样本事件论元抽取。
提出的方法
- 使用BERT将事件触发词检测建模为问答任务,其中问题旨在识别事件触发词及其类型。
- 对于论元抽取,使用多种问题模板——类型+角色、基于注释指南的、基于规则的——以生成自然且上下文感知的问题。
- 训练两个基于BERT的问答模型:一个用于触发词检测,另一个用于论元跨度抽取,两者均采用输入文本上的跨度预测。
- 在推理阶段应用动态阈值机制,以过滤低置信度的论元预测,从而提高精确率。
- 利用BERT生成的上下文表示,捕捉问题、触发词与候选论元跨度之间的语义关系。
- 通过语言学规则和注释指南描述设计问题模板,以提升自然性和性能,避免依赖合成或不自然的查询。
实验结果
研究问题
- RQ1事件抽取能否被有效重构为问答任务,从而消除对预训练实体识别的依赖?
- RQ2不同问题生成策略——尤其是结合注释指南的问题——如何影响事件抽取模型的性能?
- RQ3基于问答的框架能否泛化到训练期间未见的论元角色,从而实现零样本事件论元抽取?
- RQ4与现有神经网络和联合模型相比,问答范式在触发词检测和论元跨度抽取任务上的性能提升程度如何?
- RQ5使用自然、类人问题在事件抽取任务中对模型泛化能力和鲁棒性有何影响?
主要发现
- 所提出的基于问答的框架在ACE 2005事件抽取基准上,对触发词检测和论元抽取均优于以往最先进方法。
- 该框架展现出强大的零样本泛化能力,无需在这些角色上进行微调,即可成功抽取之前未见过的论元角色。
- 结合注释指南描述的问题模板性能优于更简单或更合成化的问题模板。
- 端到端的问答方法消除了来自实体识别的误差传播,从而实现更鲁棒、更准确的论元抽取。
- 通过精心设计的自然问题使用BERT,即使在训练样本有限的情况下,也能在语义相似的论元角色之间有效迁移知识。
- 推理阶段的动态阈值机制通过过滤低置信度预测,提升了精确率,增强了整体模型的可靠性。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。