Skip to main content
QUICK REVIEW

[논문 리뷰] Get To The Point: Summarization with Pointer-Generator Networks

Abigail See, Peter J. Liu|arXiv (Cornell University)|2017. 04. 14.
Topic Modeling참고 문헌 28인용 수 111
한 줄 요약

이 논문은 소스에서 복사 가능하고 반복을 줄이는 커버리지 메커니즘을 갖춘 하이브리드 포인터-제너레이터 네트워크를 제시하여, CNN/Daily Mail에서 기존의 추상적 모델들보다 우수한 성능을 보이는 신경계 추상화 요약을 가능하게 한다.

ABSTRACT

Neural sequence-to-sequence models have provided a viable new approach for abstractive text summarization (meaning they are not restricted to simply selecting and rearranging passages from the original text). However, these models have two shortcomings: they are liable to reproduce factual details inaccurately, and they tend to repeat themselves. In this work we propose a novel architecture that augments the standard sequence-to-sequence attentional model in two orthogonal ways. First, we use a hybrid pointer-generator network that can copy words from the source text via pointing, which aids accurate reproduction of information, while retaining the ability to produce novel words through the generator. Second, we use coverage to keep track of what has been summarized, which discourages repetition. We apply our model to the CNN / Daily Mail summarization task, outperforming the current abstractive state-of-the-art by at least 2 ROUGE points.

연구 동기 및 목표

  • 소스에서의 복사와 새로운 단어의 생성을 결합하여 추상적 요약을 향상시키는 것을 목표로 한다.
  • 신경 요약에서 사실적 불일치 및 반복을 완화한다.
  • 장문 요약에서 OOV 단어를 효과적으로 처리한다.
  • CNN/Daily Mail 데이터셋에서 평가하고 추상적 baselines 및 추출적 방법과 비교한다.

제안 방법

  • 인코더-디코더로서 주의(attention)를 가진 스타일의 기본 seq2seq를 사용한다.
  • 어휘에서의 생성과 주의를 통한 소스에서의 복사를 혼합하는 포인터-제너레이터 메커니즘을 도입한다(확장된 어휘).
  • 커버리지 벡터를 도입하여 주의 이력을 추적하고 커버리지 손실을 통해 반복을 페널티한다.
  • ROUGE 기반 목표와 커버리지 손실을 함께 사용하여 학습하고 추론 시 Adagrad 및 빔 탐색을 사용한다.

실험 결과

연구 질문

  • RQ1하이브리드 포인터-제너레이터 모델이 추상적 요약에서 사실적 정확성 및 OOV 단어 처리를 개선할 수 있는가?
  • RQ2커버리지 메커니즘이 추상성을 해치지 않으면서 반복을 줄일 수 있는가?
  • RQ3CNN/Daily Mail에서 포인터-제너레이터와 커버리지가 추상적 및 추출적 baselines에 비해 어떤 성능을 보이는가?

주요 결과

  • 포인터-제너레이터는 CNN/Daily Mail 데이터셋에서 이전의 추상적 상태-오브-더-아트보다 최소 약 2 ROUGE 포인트 높은 성능을 달성한다.
  • 커버리지 없이 포인터-제너레이터에 비해 커버리지가 반복을 크게 줄인다.
  • 포인터-제너레이터는 소스에서 복사하여 사실적 세부정보를 보존하고 OOV 단어를 효과적으로 처리한다.
  • 최고 모델(포인터-제너레이터 + 커버리지)은 여전히 절대 ROUGE에서 lead-3 및 일부 추출적 모델보다 뒤처지며, ROUGE의 편향과 데이터셋 특성을 강조한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.