Skip to main content
QUICK REVIEW

[논문 리뷰] Extractive Text Summarization using Neural Networks

Aakash Sinha, Abhishek Yadav|arXiv (Cornell University)|2018. 02. 27.
Advanced Text Analysis Techniques참고 문헌 9인용 수 51
한 줄 요약

이 논문은 단일 문서 추출적 요약을 위한 완전 데이터 기반의 피드포워드 신경망을 제안하고, 고정 크기 파트를 재귀적으로 처리하여 DUC 2002 데이터셋에서 경쟁력 있는 결과를 입증한다.

ABSTRACT

Text Summarization has been an extensively studied problem. Traditional approaches to text summarization rely heavily on feature engineering. In contrast to this, we propose a fully data-driven approach using feedforward neural networks for single document summarization. We train and evaluate the model on standard DUC 2002 dataset which shows results comparable to the state of the art models. The proposed model is scalable and is able to produce the summary of arbitrarily sized documents by breaking the original document into fixed sized parts and then feeding it recursively to the network.

연구 동기 및 목표

  • 요약에서 특징 공학 대신 데이터 기반 접근의 필요성에 대한 동기 부여.
  • 단일 문서 추출적 요약을 위한 완전한 신경망 기반 모델 개발.
  • 분할 및 재귀 처리를 통해 임의 길이의 문서를 처리할 수 있음을 보인다.
  • DUC 2002 데이터셋에서 모델을 평가하여 최첨단 방법과 비교한다.

제안 방법

  • 추출적 요약의 핵심 모델로 피드포워드 신경망을 사용한다.
  • DUC 2002 데이터셋에서 모델을 학습하고 테스트한다.
  • 긴 문서를 고정 크기 부분으로 분할하고 재귀적으로 처리하여 전체 요약을 생성한다.
  • 전통적 방법에서 흔히 보이는 강한 특징 엔지니어링을 피하기 위해 데이터 기반 접근을 채택한다.

실험 결과

연구 질문

  • RQ1완전한 데이터 기반의 피드포워드 신경망이 단일 문서 추출적 요약을 수행할 수 있는가?
  • RQ2고정 크기 분할 및 재귀 처리를 통해 임의 길이의 문서까지 확장 가능한가?
  • RQ3모델이 DUC 2002와 같은 표준 요약 벤치마크에서 경쟁력 있는 성능을 달성하는가?

주요 결과

  • 모델은 DUC 2002에서 최첨단 모델과 비교 가능한 결과를 얻는다.
  • 분할 및 재귀 처리를 통해 임의의 크기의 문서에 대해 확장 가능하다.
  • 강한 특징 엔지니어링 없이도 효율성을 보여준다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.