Skip to main content
QUICK REVIEW

[论文解读] Toward Abstractive Summarization Using Semantic Representations

Fei Liu, Jeffrey Flanigan|arXiv (Cornell University)|May 25, 2018
Topic Modeling参考文献 41被引用 56
一句话总结

本文提出了一种新颖的生成式摘要框架,通过将多个输入句子的抽象意义表示(AMR)图转换为单个浓缩的摘要AMR图,利用概念合并、句子连接和可选的图扩展,生成摘要。该方法在使用JAMR解析的测试数据上达到了57.8%的ROUGE-1 F1分数,证明了基于图的生成式摘要在语义表示下的可行性。

ABSTRACT

We present a novel abstractive summarization framework that draws on the recent development of a treebank for the Abstract Meaning Representation (AMR). In this framework, the source text is parsed to a set of AMR graphs, the graphs are transformed into a summary graph, and then text is generated from the summary graph. We focus on the graph-to-graph transformation that reduces the source semantic graph into a summary graph, making use of an existing AMR parser and assuming the eventual availability of an AMR-to-text generator. The framework is data-driven, trainable, and not specifically designed for a particular domain. Experiments on gold-standard AMR annotations and system parses show promising results. Code is available at: https://github.com/summarization

研究动机与目标

  • 开发一种生成式摘要框架,利用AMR等语义表示生成新的、非抽取式的摘要。
  • 解决在长篇或复杂文本中,抽取式方法表现不足时生成高质量生成式摘要的挑战。
  • 探索将AMR表示的图到图转换作为摘要核心机制的可行性。
  • 独立隔离并评估图摘要组件(步骤2)在AMR解析和文本生成之外的表现。
  • 评估AMR解析错误和图扩展对摘要性能的影响。

提出的方法

  • 使用JAMR解析器将输入句子解析为AMR图,训练和评估时使用标准AMR标注。
  • 通过合并句子间的指代一致节点,并将所有句子根节点连接到一个虚拟的“ROOT”节点,构建统一的源图。
  • 可选地执行图扩展,以在句子级别创建完全密集的图,增强语义连接性。
  • 训练结构化预测模型,从源图中选择显著的节点和边以形成摘要图,使用合页损失、感知器损失或陡坡损失函数。
  • 使用JAMR对齐的词跨度从摘要图生成摘要文本,基于词袋方式评估ROUGE-1。
  • 使用基于参考摘要的黄金标准AMR解析的最优摘要,建立性能上限。

实验结果

研究问题

  • RQ1AMR表示的图到图转换能否有效将多个句子的语义浓缩为单个摘要图?
  • RQ2在使用黄金标准AMR解析与系统生成的JAMR解析时,图摘要器的性能有何差异?
  • RQ3图扩展对子图预测质量和最终摘要生成质量有何影响?
  • RQ4不同的损失函数(合页、感知器、陡坡)如何影响结构化预测模型的性能?
  • RQ5JAMR解析错误在多大程度上限制了整体摘要性能?

主要发现

  • 当使用JAMR解析时,该框架在测试集上达到了57.8%的ROUGE-1 F1分数,表明基于语义图的生成式摘要具有强大潜力。
  • 基于黄金标准AMR解析的最优摘要达到65.8%的ROUGE-1 F1分数,表明通过改进AMR解析仍有提升空间。
  • 图扩展在最优摘要中略微提升性能(陡坡损失下达到71.2% F1),但轻微降低了系统性能,表明模型复杂性存在权衡。
  • 陡坡损失的使用始终优于合页损失和感知器损失,尤其在边预测方面表现更优,显示出其在该任务结构化预测中的有效性。
  • AMR解析错误是性能下降的主要原因,尤其在边预测方面,尽管对概念预测的影响较小。
  • 尽管存在解析错误,系统在概念预测上仍达到51.2%的ROUGE-1 F1分数,在边预测上达到19.0%(使用图扩展),表明模型对噪声具有鲁棒性。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。