Skip to main content
QUICK REVIEW

[論文レビュー] Abstract Meaning Representation for Multi-Document Summarization

Kexin Liao, Logan Lebanoff|arXiv (Cornell University)|Jun 14, 2018
Topic Modeling参考文献 54被引用数 78
ひとこと要約

本論文は、意味表現として Abstract Meaning Representation (AMR) を用いて抽象的なマルチドキュメント要約を生成することを検討し、ソース文選択、内容計画、表現の表層化を含む AMR ベースの全体パイプラインを提示する。

ABSTRACT

Generating an abstract from a collection of documents is a desirable capability for many real-world applications. However, abstractive approaches to multi-document summarization have not been thoroughly investigated. This paper studies the feasibility of using Abstract Meaning Representation (AMR), a semantic representation of natural language grounded in linguistic theory, as a form of content representation. Our approach condenses source documents to a set of summary graphs following the AMR formalism. The summary graphs are then transformed to a set of summary sentences in a surface realization step. The framework is fully data-driven and flexible. Each component can be optimized independently using small-scale, in-domain training data. We perform experiments on benchmark summarization datasets and report promising results. We also describe opportunities and challenges for advancing this line of research.

研究の動機と目的

  • マルチドキュメント要約におけるコンテンツ表現としての AMR の実現可能性を評価する。
  • 複数ソースを要約 AMR グラフに凝縮し、それをテキストとして表現するデータ駆動型パイプラインを開発する。
  • 標準データセットで最先端ベースラインと比較して AMR ベース要約を評価する。
  • 要約性能に対する AMR パーサとソース文選択戦略の影響を分析する。

提案手法

  • 三要素パイプライン: ソース文選択、内容計画、表現の表層化。
  • 選択された文を JAMR または CAMR パーサで AMR グラフへ変換する。
  • コアファレンス解決を用いてグラフを結合し、連結されたソースグラフを作成する。
  • ILP デコードと構造化ランプ損失を用いた学習可能な構造予測フレームワークで要約グラフを抽出する。
  • 要約 AMR グラフを PENMAN 形式へ変換し、JAMR の AMR-to-text ジェネレータでテキストを生成する。

実験結果

リサーチクエスチョン

  • RQ1AMR は抽象的なマルチドキュメント要約の効果的なコンテンツ表現となり得るか?
  • RQ2AMR パーサとソース文選択戦略は要約の品質にどのような影響を与えるか?
  • RQ3構造化予測アプローチは、ソース AMR グラフのクラスターから顕著な要約グラフをどの程度生成できるか?
  • RQ4標準ベンチマークで、AMR ベース要約はニューラルエンコーダ-デコーダのベースラインとどのように比較されるか?

主な発見

  • AMR ベースの要約は、ベンチマークデータセットで最先端の抽象的ベースラインと競合する。
  • 概念ベースのソース文選択(Concept Cov)を用いると、要約グラフでのノード保持力が強くなる。
  • VSM ベースのエッジ予測が要約関係の保持を最も良く行い、オラクルデコードでさらに性能が向上する。
  • AMR パーサの品質は要約に影響を与え、この設定では JAMR が CAMR をわずかな差で上回る。
  • AMR ベースの手法で生成された要約は多くの抽出ベースより抽象的で、ソース文との n-gram 重複もポインター-ジェネレータの variante と比較して低い。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。