Skip to main content
QUICK REVIEW

[论文解读] On Extractive and Abstractive Neural Document Summarization with Transformer Language Models

Sandeep Subramanian, Raymond Li|arXiv (Cornell University)|Sep 7, 2019
Topic Modeling参考文献 36被引用 25
一句话总结

本文提出了一种基于Transformer语言模型的两阶段方法,用于长文档的生成式摘要,其中抽取式句子选择作为生成式摘要的条件。通过同时基于文档和提取的关键句子进行条件控制,该方法在ROUGE得分上优于以往依赖复制机制的方法,生成了更具生成性的摘要,减少了过度复制现象,同时提升了摘要质量。

ABSTRACT

We present a method to produce abstractive summaries of long documents that exceed several thousand words via neural abstractive summarization. We perform a simple extractive step before generating a summary, which is then used to condition the transformer language model on relevant information before being tasked with generating a summary. We show that this extractive step significantly improves summarization results. We also show that this approach produces more abstractive summaries compared to prior work that employs a copy mechanism while still achieving higher rouge scores. Note: The abstract above was not written by the authors, it was generated by one of the models presented in this paper.

研究动机与目标

  • 提升长文档(如科研论文、专利)的生成式摘要质量,超越序列到序列模型的性能。
  • 减少对导致抽取式摘要的复制机制的依赖,从而提高真正的生成式摘要能力。
  • 证明在完整文档和提取的显著句子双重条件下,单一Transformer语言模型能够提升摘要质量。
  • 表明该方法在ROUGE得分上优于先前方法,同时生成的摘要更具改写性、复制更少。

提出的方法

  • 抽取式步骤使用指针网络或句子分类器,从长文档中识别出重要句子。
  • 将提取的句子与文档的引言部分以及其余内容按固定顺序组合:引言、提取的句子、摘要和剩余文本。
  • 对单一GPT类Transformer语言模型进行微调,以处理这种结构化输入-输出格式,生成摘要。
  • 推理时,模型仅基于引言和提取的句子生成最终的生成式摘要。
  • 模型被训练为自回归地预测参考摘要,利用文档的完整上下文及其关键内容。
  • 该方法避免使用显式的编码器-解码器架构,而是采用统一的自回归语言建模范式。

实验结果

研究问题

  • RQ1单一自回归Transformer语言模型是否能在无专用编码器-解码器结构的情况下,生成高质量的长文档生成式摘要?
  • RQ2与直接基于输入条件控制相比,基于提取的关键句子进行生成式摘要的条件控制是否能提升摘要质量与生成性?
  • RQ3与使用复制机制的模型相比,该方法在多大程度上减少了对源文本的复制依赖?
  • RQ4在ROUGE得分和摘要生成性质量方面,该方法与先前的抽取式和生成式模型相比表现如何?
  • RQ5该两阶段抽取-生成框架是否能在科学论文、医学摘要和专利等多样化领域中有效应用?

主要发现

  • 在arXiv、PubMed和bigPatent数据集上,该方法的ROUGE得分高于以往的抽取式和生成式模型。
  • 基于提取句子的模型显著减少了复制行为:生成摘要中仅有10%的20-gram在源文章中出现,而使用复制机制的模型则超过10%。
  • 对于5-gram,约三分之二的复制n-gram来自提取的句子,表明抽取式步骤为生成式摘要提供了强大而聚焦的上下文。
  • 与以往依赖复制机制的工作相比,该模型生成了更具生成性的摘要,表现为与源文本的n-gram重叠更低,且改写能力更强。
  • 抽取式步骤显著提升了摘要质量,其积极影响在ROUGE得分和人工评估指标中均有明确量化。
  • 该方法在不同领域中均表现出鲁棒性,在科研论文、生物医学文本和专利中均表现出色。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。