[论文解读] Neural Extractive Summarization with Side Information
本文提出 SideNet,一种使用侧信息(标题和图片字幕)的神经提取式摘要模型,通过层次编码器和对侧信息的提注意力提取器,在CNN数据上的单文档摘要中实现改进。
Most extractive summarization methods focus on the main body of the document from which sentences need to be extracted. However, the gist of the document may lie in side information, such as the title and image captions which are often available for newswire articles. We propose to explore side information in the context of single-document extractive summarization. We develop a framework for single-document summarization composed of a hierarchical document encoder and an attention-based extractor with attention over side information. We evaluate our model on a large scale news dataset. We show that extractive summarization with side information consistently outperforms its counterpart that does not use any side information, in terms of both informativeness and fluency.
研究动机与目标
- 通过利用新闻文章中常见的侧信息来提升抽取式摘要的效果。
- 开发一个将侧信息整合到句子提取中的神经架构。
- 在基于 CNN 的大型数据集上评估所提出的模型,并与基线方法进行比较。
- 通过自动评估和人工评估证明侧信息能够提升信息性和流畅性。
- 研究不同侧信息类型(标题、字幕、第一句)各自的相对贡献。
提出的方法
- 提出一个层次化编码器,包含一个基于 CNN 的句子编码器和一个 RNN 文档编码器。
- 引入一个句子提取器,使用对侧信息的注意力的 LSTM。
- 将侧信息表示为字幕/标题嵌入的序列,在给句子打标签时对其进行关注。
- 使用监督目标进行训练,以最大化句子相关标签的似然性。
- 使用基于 ROUGE 的评估和人工判断来评估信息性与流畅性。
实验结果
研究问题
- RQ1将侧信息(标题和图片字幕)纳入是否能在抽取式摘要质量上优于不使用侧信息的模型?
- RQ2哪些类型的侧信息对性能贡献最大(标题、字幕、第一句、还是组合)?
- RQ3在基于 CNN 的单文档摘要上,SideNet 与强基线(Lead Baseline、PointerNet)相比如何?
- RQ4自动 ROUGE 提升是否与人工评估的信息性和流畅性一致?
主要发现
- 侧信息的使用在 ROUGE 分数上持续优于没有侧信息的模型。
- 最佳消融结果同时使用标题和图片字幕,优于单一来源的侧信息。
- 在测试数据上,SideNet 在全长度摘要的 ROUGE-1、ROUGE-2、ROUGE-L 分数均高于 Lead 和 PointerNet。
- 对于固定长度摘要,在非常短的字节限制下,SideNet 可能被 Lead/PointerNet 超越,但在较长输出上表现出色。
- 人工评估表明,SideNet 在信息性和流畅性方面通常最接近人类,优于不使用侧信息的基线。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。