QUICK REVIEW

[论文解读] Toward Abstractive Summarization Using Semantic Representations

Fei Liu, Jeffrey Flanigan|arXiv (Cornell University)|May 25, 2018

Topic Modeling参考文献 41被引用 56

一句话总结

本文提出了一种新颖的生成式摘要框架，通过将多个输入句子的抽象意义表示（AMR）图转换为单个浓缩的摘要AMR图，利用概念合并、句子连接和可选的图扩展，生成摘要。该方法在使用JAMR解析的测试数据上达到了57.8%的ROUGE-1 F1分数，证明了基于图的生成式摘要在语义表示下的可行性。

ABSTRACT

We present a novel abstractive summarization framework that draws on the recent development of a treebank for the Abstract Meaning Representation (AMR). In this framework, the source text is parsed to a set of AMR graphs, the graphs are transformed into a summary graph, and then text is generated from the summary graph. We focus on the graph-to-graph transformation that reduces the source semantic graph into a summary graph, making use of an existing AMR parser and assuming the eventual availability of an AMR-to-text generator. The framework is data-driven, trainable, and not specifically designed for a particular domain. Experiments on gold-standard AMR annotations and system parses show promising results. Code is available at: https://github.com/summarization

研究动机与目标

开发一种生成式摘要框架，利用AMR等语义表示生成新的、非抽取式的摘要。
解决在长篇或复杂文本中，抽取式方法表现不足时生成高质量生成式摘要的挑战。
探索将AMR表示的图到图转换作为摘要核心机制的可行性。
独立隔离并评估图摘要组件（步骤2）在AMR解析和文本生成之外的表现。
评估AMR解析错误和图扩展对摘要性能的影响。

提出的方法

使用JAMR解析器将输入句子解析为AMR图，训练和评估时使用标准AMR标注。
通过合并句子间的指代一致节点，并将所有句子根节点连接到一个虚拟的“ROOT”节点，构建统一的源图。
可选地执行图扩展，以在句子级别创建完全密集的图，增强语义连接性。
训练结构化预测模型，从源图中选择显著的节点和边以形成摘要图，使用合页损失、感知器损失或陡坡损失函数。
使用JAMR对齐的词跨度从摘要图生成摘要文本，基于词袋方式评估ROUGE-1。
使用基于参考摘要的黄金标准AMR解析的最优摘要，建立性能上限。

实验结果

研究问题

RQ1AMR表示的图到图转换能否有效将多个句子的语义浓缩为单个摘要图？
RQ2在使用黄金标准AMR解析与系统生成的JAMR解析时，图摘要器的性能有何差异？
RQ3图扩展对子图预测质量和最终摘要生成质量有何影响？
RQ4不同的损失函数（合页、感知器、陡坡）如何影响结构化预测模型的性能？
RQ5JAMR解析错误在多大程度上限制了整体摘要性能？

主要发现

当使用JAMR解析时，该框架在测试集上达到了57.8%的ROUGE-1 F1分数，表明基于语义图的生成式摘要具有强大潜力。
基于黄金标准AMR解析的最优摘要达到65.8%的ROUGE-1 F1分数，表明通过改进AMR解析仍有提升空间。
图扩展在最优摘要中略微提升性能（陡坡损失下达到71.2% F1），但轻微降低了系统性能，表明模型复杂性存在权衡。
陡坡损失的使用始终优于合页损失和感知器损失，尤其在边预测方面表现更优，显示出其在该任务结构化预测中的有效性。
AMR解析错误是性能下降的主要原因，尤其在边预测方面，尽管对概念预测的影响较小。
尽管存在解析错误，系统在概念预测上仍达到51.2%的ROUGE-1 F1分数，在边预测上达到19.0%（使用图扩展），表明模型对噪声具有鲁棒性。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。