Skip to main content
QUICK REVIEW

[论文解读] Query-Based Abstractive Summarization Using Neural Networks

Johan Hasselqvist, Niklas Helmertz|arXiv (Cornell University)|Dec 17, 2017
Topic Modeling参考文献 25被引用 24
一句话总结

本文提出一种用于基于查询的抽象式摘要生成的神经网络模型,采用指针-生成器架构,生成简洁、重述性的摘要,以匹配给定查询。尽管其ROUGE得分低于通用抽象式模型,但该模型成功地将查询信息融入摘要生成过程,生成的摘要比抽取式基线模型更具针对性,证明了使用序列到序列学习实现查询引导的抽象式摘要的可行性。

ABSTRACT

In this paper, we present a model for generating summaries of text documents with respect to a query. This is known as query-based summarization. We adapt an existing dataset of news article summaries for the task and train a pointer-generator model using this dataset. The generated summaries are evaluated by measuring similarity to reference summaries. Our results show that a neural network summarization model, similar to existing neural network models for abstractive summarization, can be constructed to make use of queries to produce targeted summaries.

研究动机与目标

  • 设计一种神经网络模型,专门生成针对用户查询的抽象式摘要,以提升相对于抽取式方法的相关性。
  • 通过将参考答案重新用作摘要,将现有的问答数据集(来自Hermann等人)改编为基于查询的摘要数据集。
  • 评估模型生成语法正确、与查询相关且对内容进行重述而非逐字提取句子的摘要的能力。
  • 分析模型在注意力聚焦、重复行为和实体处理方面的表现,尤其关注其与查询相关性及摘要长度的关系。

提出的方法

  • 将原本用于问答任务的CNN/Daily Mail数据集改编为基于查询的摘要数据集,将答案视为参考摘要,查询作为输入提示。
  • 采用带有注意力机制的指针-生成网络生成摘要,支持从源文本中复制内容以及生成未登录词(OOV词)。
  • 通过受动态记忆网络启发的查询感知注意力机制,将查询信息整合到解码器中,以实现基于查询的摘要生成条件控制。
  • 采用编码器-解码器架构的序列到序列学习方法,其中编码器处理文档和查询,解码器逐个生成摘要标记。
  • 使用带有长度归一化的束搜索(beam search)以缓解生成过于简短摘要的倾向。
  • 实现覆盖机制以减少重复生成标记的行为,借鉴See等人(2017)的方法。

实验结果

研究问题

  • RQ1神经抽象式摘要模型能否有效利用查询生成目标明确、简洁的摘要,实现对内容的重述而非逐句提取?
  • RQ2与抽取式基线和无信息抽象式基线相比,查询感知抽象式模型在ROUGE得分和人工相关性方面的表现如何?
  • RQ3该模型在多大程度上根据查询关注文档的相关部分?是否存在对文档前半部分的偏向?
  • RQ4模型的失败模式(如重复、事实错误或无法重述)与训练数据和模型架构有何关联?

主要发现

  • 尽管在ROUGE得分上未超越抽取式基线,该模型生成的摘要仍比基线更具查询相关性,聚焦性更强。
  • 平均摘要长度为11.27个词,显著短于数据集平均的14.44个词,表明束搜索存在偏向简洁的倾向。
  • 模型频繁重复参考摘要中的短语或整句话,尤其在参考摘要本身较短或在多篇文档中重复出现时更为明显。
  • 注意力机制常聚焦于文档开头部分,可能由于早期出现的实体和文档结构所致,但这种聚焦并不总与查询一致。
  • 模型有时生成事实性错误的摘要,例如声称‘Netflix的首席执行官是奥巴马’,而原文实际讨论的是政策监管。
  • 尽管已采取措施减少重复,模型在解码初期仍表现出重复行为,表明需要更强的覆盖机制。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。