QUICK REVIEW
[论文解读] Extractive Text Summarization using Neural Networks
Aakash Sinha, Abhishek Yadav|arXiv (Cornell University)|Feb 27, 2018
Advanced Text Analysis Techniques参考文献 9被引用 51
一句话总结
本文提出一种完全数据驱动的前馈神经网络,用于单文档抽取式摘要,并通过对固定大小的部分进行递归处理,在 DUC 2002 数据集上展示了具有竞争力的结果。
ABSTRACT
Text Summarization has been an extensively studied problem. Traditional approaches to text summarization rely heavily on feature engineering. In contrast to this, we propose a fully data-driven approach using feedforward neural networks for single document summarization. We train and evaluate the model on standard DUC 2002 dataset which shows results comparable to the state of the art models. The proposed model is scalable and is able to produce the summary of arbitrarily sized documents by breaking the original document into fixed sized parts and then feeding it recursively to the network.
研究动机与目标
- 推动在摘要任务中采用数据驱动方法代替特征工程的必要性。
- 开发一个完全基于神经网络的单文档抽取式摘要模型。
- 展示通过分块和递归处理,模型能够处理任意长度的文档。
- 在 DUC 2002 数据集上评估该模型,以便与最先进方法进行比较。
提出的方法
- 将前馈神经网络作为抽取式摘要的核心模型。
- 在 DUC 2002 数据集上对模型进行训练和测试。
- 将长文档分割成固定大小的部分,并递归处理以生成完整摘要。
- 采用数据驱动的方法以避免传统方法中常见的重特征工程。
实验结果
研究问题
- RQ1一个完全数据驱动的前馈神经网络是否能够执行单文档抽取式摘要?
- RQ2提出的方法是否能够通过固定大小分块和递归处理扩展到任意长度的文档?
- RQ3该模型在如 DUC 2002 等标准摘要基准上是否具备竞争力?
主要发现
- 该模型在 DUC 2002 上的结果与最先进模型相当。
- 该方法通过分块和递归处理可扩展到任意大小的文档。
- 该方法在不需要大量特征工程的情况下也能证明有效。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。