Skip to main content
QUICK REVIEW

[論文レビュー] Get To The Point: Summarization with Pointer-Generator Networks

Abigail See, Peter J. Liu|arXiv (Cornell University)|Apr 14, 2017
Topic Modeling参考文献 28被引用数 111
ひとこと要約

論文は、ソースからのコピーと新規語の生成を組み合わせるハイブリッド・ポインタ生成ネットワークとカバレッジ機構を導入し、ニューラル要約における反復を減らすとともに、CNN/Daily Mailで従来の要約モデルを上回る性能を示します。

ABSTRACT

Neural sequence-to-sequence models have provided a viable new approach for abstractive text summarization (meaning they are not restricted to simply selecting and rearranging passages from the original text). However, these models have two shortcomings: they are liable to reproduce factual details inaccurately, and they tend to repeat themselves. In this work we propose a novel architecture that augments the standard sequence-to-sequence attentional model in two orthogonal ways. First, we use a hybrid pointer-generator network that can copy words from the source text via pointing, which aids accurate reproduction of information, while retaining the ability to produce novel words through the generator. Second, we use coverage to keep track of what has been summarized, which discourages repetition. We apply our model to the CNN / Daily Mail summarization task, outperforming the current abstractive state-of-the-art by at least 2 ROUGE points.

研究の動機と目的

  • 要約を進化させ、ソースからのコピーと新規語の生成を組み合わせる。
  • ニューラル要約における事実誤認と反復を緩和する。
  • 長文要約における未知語(OOV)を効果的に処理する。
  • CNN/Daily Mailデータセットで評価し、 abstractiveのベースラインや抽出型手法と比較する。

提案手法

  • 注意機構を持つベースの seq2seq をエンコーダ-デコーダとして用いる。
  • 語彙からの生成とソースからのコピーを注意機構を介して混合するポインタ・ジェネレータ機構を導入する(拡張語彙)。
  • 注意履歴を追跡するカバレッジベクトルを組み込み、カバレッジ損失で反復を抑制する。
  • ROUGEベースの目的関数とカバレッジ損失で訓練する。推論時には Adagrad とビームサーチを用いる。

実験結果

リサーチクエスチョン

  • RQ1ハイブリッド・ポインタ・ジェネレーターモデルは、要約の事実的正確性と OOV語の扱いを改善できるか。
  • RQ2カバレッジ機構は、要約の抽象性を損なうことなく反復を減らせるか。
  • RQ3CNN/Daily Mail におけるポインタ・ジェネレータ+カバレッジは、抽象型および抽出型ベースラインと比べてどうか。

主な発見

  • ポインタ・ジェネレータは、CNN/Daily Mail データセットで従来の抽象型最先端を少なくとも約2 ROUGEポイント上回る。
  • カバレッジは、カバレッジなしのポインタ・ジェネレータと比べて反復を大幅に抑制する。
  • ポインタ・ジェネレータは OOV語を効果的に処理し、ソースからのコピーによって事実的な詳細を保持する。
  • 最良モデル(ポインタ・ジェネレータ+カバレッジ)は、絶対的な ROUGE では Lead-3 や一部の抽出型モデルに及ばない点があり、ROUGE の偏りとデータセットの特性を示している。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。