Skip to main content
QUICK REVIEW

[论文解读] Deep Joint Entity Disambiguation with Local Neural Attention

Octavian-Eugen Ganea, Thomas Hofmann|arXiv (Cornell University)|Apr 17, 2017
Topic Modeling参考文献 28被引用 27
一句话总结

本文提出了一种用于联合文档级实体消歧的深度学习模型,结合了学习得到的实体嵌入、基于上下文窗口的局部神经注意力机制,以及通过展开的环状信念传播实现的可微消息传递。该方法在AIDA-B数据集上实现了最先进(SOTA)的准确率,并在多个基准测试中表现出色,优于先前的方法,且无需依赖人工设计的特征或大量共现统计。

ABSTRACT

We propose a novel deep learning model for joint document-level entity disambiguation, which leverages learned neural representations. Key components are entity embeddings, a neural attention mechanism over local context windows, and a differentiable joint inference stage for disambiguation. Our approach thereby combines benefits of deep learning with more traditional approaches such as graphical models and probabilistic mention-entity maps. Extensive experiments show that we are able to obtain competitive or state-of-the-art accuracy at moderate computational costs.

研究动机与目标

  • 开发一种用于文档级实体消歧的深度学习框架,以消除对手动工程特征的依赖。
  • 通过可微推理联合建模局部上下文与全局文档一致性,提升消歧准确率。
  • 从规范实体页面和超链接上下文学习鲁棒的实体与词嵌入,避免使用稀疏共现统计。
  • 实现高效、端到端的神经架构训练,集成局部注意力与全局集体推理。
  • 证明神经网络可在无需专家输入(除预训练嵌入外)的情况下,自动学习实体消歧的最优特征。

提出的方法

  • 使用最大间隔目标函数,在正样本(实体-上下文对)和负样本(随机)词样本上,联合学习实体与词嵌入,嵌入空间共享。
  • 采用局部神经注意力机制,为每个提及选择相关信息的上下文词,结合提及-实体先验概率计算局部得分。
  • 使用可微的展开版环状信念传播(LBP)实现文档中各提及间的全局推理,支持通过消息传递进行反向传播。
  • 将局部注意力得分与全局LBP推断的势函数整合进条件随机场(CRF)框架,通过反向传播优化参数化势函数。
  • 除预训练的词嵌入与实体嵌入外,端到端训练整个模型,微调阶段固定预训练嵌入。
  • 采用硬性注意力机制,限定仅使用前K个最相关的上下文词(R < K),以减少无关词带来的噪声。

实验结果

研究问题

  • RQ1深度神经网络是否能在不依赖人工设计特征的前提下,学习到有效的局部与全局表示用于实体消歧?
  • RQ2与传统概率模型或基于特征的局部模型相比,学习得到的局部上下文窗口注意力机制在消歧准确率上表现如何?
  • RQ3通过环状信念传播实现的可微消息传递,是否能相比标准推理方法提升文档级实体消歧的全局一致性?
  • RQ4在不依赖实体共现统计的前提下,能否有效从规范实体页面与超链接上下文学习到实体嵌入?
  • RQ5通过可微架构联合建模局部与全局证据,是否能优于解耦或不可微的方法?

主要发现

  • 所提模型在AIDA-B数据集上达到最先进准确率,该数据集是大规模且具有挑战性的手动标注实体消歧基准。
  • 在AIDA-B上,对于具有超过50个超链接的提及,模型准确率达到94.2%;对于真实实体先验概率>0.3的提及,准确率达96.53%。
  • 在困难样本中表现稳健,对于真实实体先验概率≤0.01的提及,准确率达89.19%。
  • 局部注意力机制优于Ganea等人(2016)的基于概率的局部模型和Globerson等人(2016)的特征工程模型,且内存占用更低、推理速度更快。
  • 仅使用5次截断LBP迭代即可获得近似最优性能,显著加快训练与推理速度,相比收敛性LBP有明显优势。
  • 消融实验表明,硬性注意力(R < K)可有效减少无信息上下文词带来的噪声,提升模型鲁棒性与准确率。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。