Skip to main content
QUICK REVIEW

[论文解读] Neural Extractive Text Summarization with Syntactic Compression

Jiacheng Xu, Greg Durrett|arXiv (Cornell University)|Feb 3, 2019
Topic Modeling参考文献 44被引用 27
一句话总结

本文提出一种神经抽取式文本摘要模型,通过句法成分解析联合学习句子选择与句法压缩,生成简洁、语法正确的摘要。通过在人工构造的抽取-压缩摘要上进行训练,该模型在CNN/Daily Mail数据集上相比抽取式基线模型ROUGE-F1提升2.4分,达到当前最先进水平,表明摘要的流畅性与可控压缩能力得到显著提升。

ABSTRACT

Recent neural network approaches to summarization are largely either selection-based extraction or generation-based abstraction. In this work, we present a neural model for single-document summarization based on joint extraction and syntactic compression. Our model chooses sentences from the document, identifies possible compressions based on constituency parses, and scores those compressions with a neural model to produce the final summary. For learning, we construct oracle extractive-compressive summaries, then learn both of our components jointly with this supervision. Experimental results on the CNN/Daily Mail and New York Times datasets show that our model achieves strong performance (comparable to state-of-the-art systems) as evaluated by ROUGE. Moreover, our approach outperforms an off-the-shelf compression module, and human and manual evaluation shows that our model's output generally remains grammatical.

研究动机与目标

  • 开发一种结合抽取式摘要与基于句法的句子压缩的神经模型,以提升摘要质量与可解释性。
  • 通过使用束搜索与启发式优化构建高质量人工抽取-压缩摘要,解决联合抽取-压缩模型的训练挑战。
  • 通过可调阈值实现可控压缩,灵活调节摘要长度而不损失ROUGE性能。
  • 通过基于句法成分解析的离散压缩选项,提升压缩摘要的语法正确性与流畅性。
  • 证明联合学习抽取与压缩优于仅抽取式基线模型及现成的压缩模块。

提出的方法

  • 模型使用BiLSTM编码文档句子与文档级表示,随后通过注意力机制的LSTM解码器进行句子选择,类似于指针网络架构。
  • 对每个选中的句子,基于句法成分解析生成一组离散的压缩选项,应用规则去除同位语、关系从句、状语短语与括号成分,同时保持语法正确性。
  • 神经评分机制根据上下文、句子表示与解码器状态,评估每个压缩选项并选择最优压缩版本。
  • 训练目标联合优化抽取与压缩,使用通过束搜索与启发式优化生成的人工摘要,以识别高质量的句子选择与压缩目标。
  • 对压缩结果应用去重机制,以减少冗余,尤其针对时间与地点状语,提升效率并降低噪声。
  • 模型通过端到端的联合目标进行训练,结合抽取与压缩监督,使系统学会何时以及如何进行压缩。

实验结果

研究问题

  • RQ1与仅抽取式模型相比,联合训练抽取与压缩模块是否能提升摘要性能?
  • RQ2基于句法的离散压缩选项是否能生成比端到端神经压缩更语法正确、更流畅的摘要?
  • RQ3该模型在不同压缩阈值下性能是否稳健?能否实现摘要长度的可控生成?
  • RQ4与现成压缩模块相比,基于成分解析的压缩规则在多大程度上提升了摘要质量?
  • RQ5人工评估中,该模型压缩输出的语法正确性与流畅性如何?

主要发现

  • 该模型在CNN/Daily Mail与New York Times数据集上达到最先进性能,相比抽取式基线模型ROUGE-F1提升2.4分。
  • 模型在广泛压缩阈值范围(0.3至0.55)内保持强劲性能,表明其在摘要长度控制方面具有鲁棒性与可控性。
  • 人工评估确认模型输出整体语法正确,多数错误源于解析器限制,而非模型的压缩决策。
  • 模型优于现成压缩模块,证明与抽取监督联合训练具有显著优势。
  • 压缩最常应用于介词短语(PP,26%)与形容词短语(JJ,34%),准确率分别为72%(JJ)与80%(PRN),表明基于规则的压缩选择有效。
  • 去重机制去除了30%的选中压缩(尤其PP),减少冗余并提升效率,且未降低ROUGE分数。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。