Skip to main content
QUICK REVIEW

[論文レビュー] Length-controllable Abstractive Summarization by Guiding with Summary Prototype

Itsumi Saito, Kyosuke Nishida|arXiv (Cornell University)|Jan 21, 2020
Topic Modeling参考文献 18被引用数 24
ひとこと要約

本稿では、内容選択と長さ制御をガイドする単語レベルの抽出的プロトタイプを用いた長さ制御可能な抽象的要約モデルを提案する。まず、重要語の長さ制約付きプロトタイプを抽出し、それを共同エンコーダ・デコーダモデルの入力として用いることで、より情報量が多く、正確なサイズの要約を生成する。この手法は、CNN/Daily MailおよびNEWSROOMデータセットにおいて、先行手法を上回る性能を発揮する。

ABSTRACT

We propose a new length-controllable abstractive summarization model. Recent state-of-the-art abstractive summarization models based on encoder-decoder models generate only one summary per source text. However, controllable summarization, especially of the length, is an important aspect for practical applications. Previous studies on length-controllable abstractive summarization incorporate length embeddings in the decoder module for controlling the summary length. Although the length embeddings can control where to stop decoding, they do not decide which information should be included in the summary within the length constraint. Unlike the previous models, our length-controllable abstractive summarization model incorporates a word-level extractive module in the encoder-decoder model instead of length embeddings. Our model generates a summary in two steps. First, our word-level extractor extracts a sequence of important words (we call it the "prototype text") from the source text according to the word-level importance scores and the length constraint. Second, the prototype text is used as additional input to the encoder-decoder model, which generates a summary by jointly encoding and copying words from both the prototype text and source text. Since the prototype text is a guide to both the content and length of the summary, our model can generate an informative and length-controlled summary. Experiments with the CNN/Daily Mail dataset and the NEWSROOM dataset show that our model outperformed previous models in length-controlled settings.

研究の動機と目的

  • 抽象的要約における制御性の欠如、特に要約長の制御が実用的展開において重要であることを解決すること。
  • 長さ埋め込みの限界を克服すること。長さ埋め込みはデコードの長さを制御するが、制約下でのコンテンツ選択には寄与しない。
  • 学習可能なプロトタイプテキスト(単語レベルの重要度スコアから導出)を用いたコンテンツ認識のガイダンスにより、要約品質を向上させること。
  • ドメイン固有の要約長に適応することで、多様なテキストスタイルに柔軟に長さ制御を可能にすること。
  • 強化学習を用いない状況でも、プロトタイプベースのガイダンスが長さ制御要約設定において、長さ埋め込みベースのベースラインを上回ることを実証すること。

提案手法

  • 単語レベルの抽出モジュールが、BERTベースの符号化を用いて、元のテキストの各単語の重要度スコアを計算する。
  • 上位-K 個の重要な単語が抽出され、プロトタイプテキストとして生成され、K は望ましい要約長に応じて決定される。
  • プロトタイプテキストがエンコーダ・デコーダモデルの追加入力として使用され、元のテキストとプロトタイプの両方を共同で符号化可能になる。
  • 抽象的デコーダは、元のテキストとプロトタイプの両方に注目し、キーワードのコピーと、流暢で簡潔な要約の生成を可能にする。
  • ポインタジェネレータアーキテクチャと強化された注目メカニズムを用いることで、コピーと生成のバランスをとる。
  • プロトタイプ抽出器は、コンテンツ選択と要約生成の整合性を保つために、抽象的モデルとエンド・ツー・エンドで訓練される。

実験結果

リサーチクエスチョン

  • RQ1プロトタイプベースのアプローチは、長さ埋め込みベースの手法を長さ制御可能な抽象的要約において上回ることができるか?
  • RQ2単語レベルの抽出モジュールを用いることで、長さ制約下でもコンテンツの関連性と要約品質が向上するか?
  • RQ3異なるニュースドメイン(要約長が異なる)に一般化可能か?
  • RQ4ドメイン固有の長さ好みを組み込むことで、要約性能にどのような影響があるか?
  • RQ5強化学習を用いずに、プロトタイプガイドド生成がROUGEスコアを向上させられるか?

主な発見

  • 提案モデルは、CNN/Daily MailおよびNEWSROOMデータセットの両方で、公式ベースラインおよびLPAS w/o Prototypeベースラインを著しく上回るROUGEスコアを達成した。
  • 標準的および長さ制御設定の両方で、長さ埋め込みベースのモデルを上回り、優れたコンテンツ制御と文の流れの良さを示した。
  • ドメインレベルの平均長さを制約として組み込むことでROUGEスコアが向上し、ニューステキストのスタイル差に適切に適応していることが示された。
  • プロトタイプ抽出器が、キーメッセージの含みと望ましい長さの維持を抽象的モデルに効果的にガイドしたことが、高いROUGE-F1スコアから裏付けられた。
  • 強化学習を用いずに優れた性能を達成したため、プロトタイプガイダンスそのものがコンテンツ選択の有効な監視信号を提供していることが示唆された。
  • アブレーションスタディにより、プロトタイプモジュールが性能向上に不可欠であることが確認され、その除去により結果が著しく劣化した。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。