QUICK REVIEW

[論文レビュー] Learning-Based Single-Document Summarization with Compression and Anaphoricity Constraints

Greg Durrett, Taylor Berg-Kirkpatrick|arXiv (Cornell University)|Mar 29, 2016

Topic Modeling参考文献 47被引用数 32

ひとこと要約

本稿では、単一文書の要約生成のための判別的でエンド・ツー・エンドの学習モデルを提示する。このモデルは、代名詞解決と構文論的・話法的レベルの圧縮制約を統合し、文の流れと一貫性を向上させる。NYTアノテートドコーパス上でILPに基づく推論を用いてROUGEスコアと言語的品質を同時に最適化することで、自動評価および人的評価の両面で強力なベースラインを上回り、コンテンツカバレッジ面で最先端の結果を達成している。

ABSTRACT

We present a discriminative model for single-document summarization that integrally combines compression and anaphoricity constraints. Our model selects textual units to include in the summary based on a rich set of sparse features whose weights are learned on a large corpus. We allow for the deletion of content within a sentence when that deletion is licensed by compression rules; in our framework, these are implemented as dependencies between subsentential units of text. Anaphoricity constraints then improve cross-sentence coherence by guaranteeing that, for each pronoun included in the summary, the pronoun's antecedent is included as well or the pronoun is rewritten as a full mention. When trained end-to-end, our final system outperforms prior work on both ROUGE as well as on human judgments of linguistic quality.

研究の動機と目的

単一文書要約の課題に対処すること。これは文書間の冗長性がなく、複数文書要約よりもモデル化が難しい。
構文的および修辞的構造の制約を用いて文法的整合性を確保することで、要約のなめらかさと一貫性を向上させること。
代名詞が共参照されるか、または完全な名詞句に置き換えられることを保証することで、参照の明確さを高めること。
コンテンツ選択、圧縮、代名詞解決を同時に最適化できる高容量のエンド・ツー・エンドで学習可能なモデルを開発すること。
自動評価（ROUGE）と人的評価による言語的品質の両方で、ヒューリスティック的手法や先行の学習ベースのベースラインを上回ることを示す。

提案手法

モデルは、学習されたスパース特徴に基づいて、完全な文から部分文節に至るまでのテクスト単位を選択するための整数線形プログラミング（ILP）フレームワークを用いる。
圧縮は、構文解析と修辞構造理論（RST）解析を用いたテクスト単位間の依存関係によって強制され、詳細説明や修飾語句などの非必須節を削除可能となる。
代名詞性制約は、代名詞を保持するか完全な名詞句に置き換えるかを制御する2値変数でモデル化され、先行詞が含まれていることを保証する。
エンド・ツー・エンドの特徴学習をNYTアノテートドコーパスで行い、ROUGEと言語的品質の両方を同時に最適化することで推論を実行する。
文法的整合性と一貫性を確保するため、構文解析、RST解析、コアリファレンス解決からの制約をモデルに組み込む。
ILPを用いた効率的な推論により、コンテンツカバレッジ、圧縮、参照明確性のバランスを取ることが可能となる。

実験結果

リサーチクエスチョン

RQ1圧縮と代名詞解決を統合した単一の統合モデルは、単一文書要約においてROUGEスコアと言語的品質の両方を向上させることができるか？
RQ2大規模コーパス上でエンド・ツー・エンドで学習する手法は、ヒューリスティック的またはルールベースの手法と比較して、コンテンツ選択となめらかさの面でどのように異なるか？
RQ3構文的および話法的レベルの圧縮制約は、コンテンツカバレッジを損なわずに文法的整合性をどの程度向上させるか？
RQ4先行詞の包含または置換によって代名詞解決を強制することで、自由な代名詞使用と比較して一貫性の高い要約が得られるか？
RQ5モデルの性能は、大規模および小規模なデータセットの両方の評価設定でどのように変化するか？

主な発見

完全なシステムは、RST話法ツリー銀行において、文の接頭語ベースライン（ROUGE-1: 26.3 対 23.5、ROUGE-2: 8.0 対 8.3）を上回る性能を示した。
代名詞制約を除去するとROUGEはわずかに上昇するが、特に代名詞の明確さに著しい悪影響が生じ、一貫性の制約がなめらかさに不可欠であることを示している。
構文的および話法的圧縮を含む完全なシステムは、これらのコンponentsを欠落させたアブレーションと比較して顕著に高いROUGEスコアを達成しており、圧縮の柔軟性がコンテンツカバレッジを向上させることを示している。
NYT50コーパスでは、完全なシステムはツリー・ナップサック法を上回り、すべてのベースラインを上回るコンテンツ選択性能を示した。また、文抽出ベースラインに匹敵する言語的品質にも近づいた。
人的評価では、制約なしのモデルと比較して、不明瞭な代名詞の数を顕著に減少させ、参照明確性の面で文抽出ベースラインに近い性能を達成した。
本システムは http://nlp.cs.berkeley.edu で公開されており、再現性とさらなる研究を可能としている。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。