QUICK REVIEW

[论文解读] Abstract Meaning Representation for Multi-Document Summarization

Kexin Liao, Logan Lebanoff|arXiv (Cornell University)|Jun 14, 2018

Topic Modeling参考文献 54被引用 78

一句话总结

该论文研究将 Abstract Meaning Representation (AMR) 作为语义内容表示，用以生成抽象的多文档摘要，提出一个基于 AMR 的完整流程，包括源句选择、内容规划和表面实现。

ABSTRACT

Generating an abstract from a collection of documents is a desirable capability for many real-world applications. However, abstractive approaches to multi-document summarization have not been thoroughly investigated. This paper studies the feasibility of using Abstract Meaning Representation (AMR), a semantic representation of natural language grounded in linguistic theory, as a form of content representation. Our approach condenses source documents to a set of summary graphs following the AMR formalism. The summary graphs are then transformed to a set of summary sentences in a surface realization step. The framework is fully data-driven and flexible. Each component can be optimized independently using small-scale, in-domain training data. We perform experiments on benchmark summarization datasets and report promising results. We also describe opportunities and challenges for advancing this line of research.

研究动机与目标

评估将 AMR 作为多文档摘要内容表示的可行性。
开发一个数据驱动的流水线，将多个来源压缩为摘要 AMR 图并将其实现为文本。
在标准数据集上将基于 AMR 的摘要与现有最先进基线进行比较评估。
分析 AMR 解析器和源句选择策略对摘要性能的影响。

提出的方法

三组件流水线：源句选择、内容规划、表面实现。
使用 JAMR 或 CAMR 解析器将所选句子转换为 AMR 图。
通过共指消解将图合并成一个连通的源图。
通过一个可训练的结构化预测框架，使用 ILP 解码和结构化 Ramp 损失提取摘要图。
将摘要 AMR 图转换为 PENMAN 格式，并使用 JAMR 的 AMR-to-text 生成器生成文本。

实验结果

研究问题

RQ1AMR 能否成为抽象多文档摘要的有效内容表示？
RQ2AMR 解析器和源句选择策略如何影响摘要质量？
RQ3结构化预测方法在从一组源 AMR 图中生成显著摘要图方面的效果有多大？
RQ4在标准基准上，基于 AMR 的摘要与神经编码器-解码器基线相比如何？

主要发现

基于 AMR 的摘要在基准数据集上与最先进的抽象摘要基线具有竞争力。
使用基于概念的源句选择（Concept Cov）在摘要图中实现更强的节点保留。
基于向量空间模型的边预测最能保留摘要关系； oracle 解码进一步提升性能。
AMR 解析器质量影响摘要，在此设置中 JAMR 略微优于 CAMR。
由基于 AMR 的方法生成的摘要比许多抽取式基线更具抽象性，并且与源文档的 n-gram 重叠度低于指针生成器变体。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。