Skip to main content
QUICK REVIEW

[论文解读] Abstract Meaning Representation for Multi-Document Summarization

Kexin Liao, Logan Lebanoff|arXiv (Cornell University)|Jun 14, 2018
Topic Modeling参考文献 54被引用 78
一句话总结

该论文研究将 Abstract Meaning Representation (AMR) 作为语义内容表示,用以生成抽象的多文档摘要,提出一个基于 AMR 的完整流程,包括源句选择、内容规划和表面实现。

ABSTRACT

Generating an abstract from a collection of documents is a desirable capability for many real-world applications. However, abstractive approaches to multi-document summarization have not been thoroughly investigated. This paper studies the feasibility of using Abstract Meaning Representation (AMR), a semantic representation of natural language grounded in linguistic theory, as a form of content representation. Our approach condenses source documents to a set of summary graphs following the AMR formalism. The summary graphs are then transformed to a set of summary sentences in a surface realization step. The framework is fully data-driven and flexible. Each component can be optimized independently using small-scale, in-domain training data. We perform experiments on benchmark summarization datasets and report promising results. We also describe opportunities and challenges for advancing this line of research.

研究动机与目标

  • 评估将 AMR 作为多文档摘要内容表示的可行性。
  • 开发一个数据驱动的流水线,将多个来源压缩为摘要 AMR 图并将其实现为文本。
  • 在标准数据集上将基于 AMR 的摘要与现有最先进基线进行比较评估。
  • 分析 AMR 解析器和源句选择策略对摘要性能的影响。

提出的方法

  • 三组件流水线:源句选择、内容规划、表面实现。
  • 使用 JAMR 或 CAMR 解析器将所选句子转换为 AMR 图。
  • 通过共指消解将图合并成一个连通的源图。
  • 通过一个可训练的结构化预测框架,使用 ILP 解码和结构化 Ramp 损失提取摘要图。
  • 将摘要 AMR 图转换为 PENMAN 格式,并使用 JAMR 的 AMR-to-text 生成器生成文本。

实验结果

研究问题

  • RQ1AMR 能否成为抽象多文档摘要的有效内容表示?
  • RQ2AMR 解析器和源句选择策略如何影响摘要质量?
  • RQ3结构化预测方法在从一组源 AMR 图中生成显著摘要图方面的效果有多大?
  • RQ4在标准基准上,基于 AMR 的摘要与神经编码器-解码器基线相比如何?

主要发现

  • 基于 AMR 的摘要在基准数据集上与最先进的抽象摘要基线具有竞争力。
  • 使用基于概念的源句选择(Concept Cov)在摘要图中实现更强的节点保留。
  • 基于向量空间模型的边预测最能保留摘要关系; oracle 解码进一步提升性能。
  • AMR 解析器质量影响摘要,在此设置中 JAMR 略微优于 CAMR。
  • 由基于 AMR 的方法生成的摘要比许多抽取式基线更具抽象性,并且与源文档的 n-gram 重叠度低于指针生成器变体。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。