Skip to main content
QUICK REVIEW

[论文解读] ScisummNet: A Large Annotated Corpus and Content-Impact Models for Scientific Paper Summarization with Citation Networks

Michihiro Yasunaga, Jungo Kasai|arXiv (Cornell University)|Sep 4, 2019
Topic Modeling被引用 42
一句话总结

引入一个大型手工注释语料库(1,000 篇 ACL 论文)用于科学论文摘要,并提出将作者摘要与通过引用跨度和图卷积网络(GCN)获取的学术界观点相结合的混合内容-影响模型。

ABSTRACT

Scientific article summarization is challenging: large, annotated corpora are not available, and the summary should ideally include the article's impacts on research community. This paper provides novel solutions to these two challenges. We 1) develop and release the first large-scale manually-annotated corpus for scientific papers (on computational linguistics) by enabling faster annotation, and 2) propose summarization methods that integrate the authors' original highlights (abstract) and the article's actual impacts on the community (citations), to create comprehensive, hybrid summaries. We conduct experiments to demonstrate the efficacy of our corpus in training data-driven models for scientific paper summarization and the advantage of our hybrid summaries over abstracts and traditional citation-based summaries. Our large annotated corpus and hybrid methods provide a new framework for scientific paper summarization research.

研究动机与目标

  • 通过创建一个由 1,000 篇 ACL Anthology 论文组成的大型手工注释语料库来解决科学论文摘要中的数据稀缺,带有摘要;
  • 开发将作者摘要与学术社区影响(引用)整合到更全面摘要中的混合摘要模型。
  • 利用引用网络和基于图的神经架构来提升摘要质量,使之优于仅使用摘要和仅引用的方法。

提出的方法

  • 从 ACL Anthology 中创建一个包含 1,000 篇参考论文(RP)的大型手工注释语料库,附带传入引用句子和专家撰写的黄金摘要。
  • 将输入 I 构建为 RP 摘要与来自传入引用的被引用文本跨度的并集,以纳入社区观点。
  • 使用 tf-idf 余弦相似度构建句子关系图,并应用图卷积网络(GCN)对输入句子进行编码并推导显著性分数。
  • 通过贪心式提取摘要,结合显著性分数对摘要和被引用跨度进行混合(混合 1)或用显著的被引用跨度来增强摘要(混合 2),以实现摘要的提取式增强。
  • 为每个被引用跨度引入一个权威性特征(基于引用数量),以反映来源影响力。
  • 端到端训练神经模型(用于句子编码的 LSTM、两层 GCN、softmax 显示显著性)并以目标 ROUGE 派生的显著性为对比的交叉熵损失。

实验结果

研究问题

  • RQ1大型、手工注释语料库能否使数据驱动的神经模型在科学论文摘要任务上超越先前较小的数据集?
  • RQ2将作者摘要与研究社区观点融合的混合摘要方法是否比仅使用摘要或仅使用引用文本的摘要得到更全面的摘要?
  • RQ3引入引用权威信息是否能提高科学论文摘要的质量?
  • RQ4在 CL-SciSumm 基准上的标准 ROUGE 指标下,混合模型与基线相比有何表现?

主要发现

  • 一个 1,000 示例的语料库使神经模型在 CL-SciSumm 基准上达到优于所有先前参与者的性能(在该数据上训练时)。
  • 将摘要与被引用文本跨度相结合的混合模型产生比仅使用摘要或仅使用被引用文本跨度的方法更全面的摘要。
  • 混合 2(用显著的被引用文本跨度增强摘要)在 ROUGE-2、ROUGE-3 以及 SU4-F 指标上始终优于混合 1 和基线。
  • 使用权威性特征进一步提升了性能,表明来自高影响力论文的引用有助于生成更高质量的摘要。
  • 定性示例显示混合摘要同时捕捉了作者的动机和社区影响的技术细节,提升对 RP 的覆盖范围。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。