Skip to main content
QUICK REVIEW

[論文レビュー] Exploring Explainable Selection to Control Abstractive Generation

Haonan Wang, Yang Gao|arXiv (Cornell University)|Apr 24, 2020
Topic Modeling被引用数 6
ひとこと要約

本稿では、文のペア間相互作用と中心性をモデル化することで説明可能性を向上させるペアワイズ抽出器を用いた選択・生成フレームワークを提案する。ポ인터ジェネレータと注目メカニズムに基づく文配置と学習可能なマスク行列を統合することで、コンテンツ選択と生成を制御し、CNN/DailyMailおよびNYTデータセットにおいて最先端のROUGEスコアと優れた人間評価結果を達成した。

ABSTRACT

It is a big challenge to model long-range input for document summarization. In this paper, we target using a select and generate paradigm to enhance the capability of selecting explainable contents (i.e., interpret the selection given its semantics, novelty, relevance) and then guiding to control the abstract generation. Specifically, a newly designed pair-wise extractor is proposed to capture the sentence pair interactions and their centrality. Furthermore, the generator is hybrid with the selected content and is jointly integrated with a pointer distribution that is derived from a sentence deployment's attention. The abstract generation can be controlled by an explainable mask matrix that determines to what extent the content can be included in the summary. Encoders are adaptable with both Transformer-based and BERT-based configurations. Overall, both results based on ROUGE metrics and human evaluation gain outperformance over several state-of-the-art models on two benchmark CNN/DailyMail and NYT datasets.

研究の動機と目的

  • 構造的な選択・生成パラダイムを用いて、ドキュメント要約における長距離依存関係をモデル化する課題に対処すること。
  • 意味的・新規性・関連性に基づいて内容選択を根拠づけることで、その説明可能性を向上させること。
  • 内容の含める程度を制御する説明可能なマスク行列を用いて、制御可能な抽象的生成を可能とすること。
  • 柔軟で強固な表現学習を可能とするために、TransformerベースおよびBERTベースのエンコーダーを統合すること。
  • 標準ベンチマークデータセットにおいて、最先端のモデルを上回る優れた性能を達成すること。

提案手法

  • ペアワイズ抽出器を設計し、文のペア間の相互作用をモデル化し、コンテンツ選択のための中心性を計算することで、選択の質を向上させる。
  • 生成器を選択されたコンテンツと統合し、文配置注目メカニズムから導出されたポインタネットを組み込むことで、生成の正確性を向上させる。
  • 説明可能なマスク行列を導入し、選択されたコンテンツが最終要約にどの程度含まれるかを制御する。
  • エンコーダー部を共有しながら、抽出器と生成器を同時に学習することで、TransformerおよびBERTベースのアーキテクチャを両方サポートする。
  • 文配置注目メカニズムを用いてポインタ機構を誘導し、生成されたコンテンツが選択された顕著な文と整合するように保証する。
  • 選択と生成の目的関数を統合的に最適化するエンドツーエンドの学習が可能となる。

実験結果

リサーチクエスチョン

  • RQ1ペアワイズ文相互作用モデルは、抽象的要約における内容選択の説明可能性と品質を向上させることができるか?
  • RQ2選択されたコンテンツに誘導された注目から導出されたポインタジェネレータは、スムーズで関連性の高い要約を生成するのにどの程度有効か?
  • RQ3学習可能なマスク行列は、コンテンツの含め方をどの程度制御でき、要約品質を向上させられるか?
  • RQ4説明可能な選択と抽象的生成を統合することで、標準ベンチマークで性能向上が達成できるか?
  • RQ5この統合的選択・生成フレームワークにおいて、BERTベースとTransformerベースのエンコーダーは、どのように比較されるか?

主な発見

  • 提案モデルは、ROUGE指標に基づき、CNN/DailyMailおよびNYTベンチマークデータセットで最先端の性能を達成した。
  • 人間評価により、本モデルが生成する要約は、競合モデルのものよりもよりスムーズで関連性が高く、意味的に整合性があることが確認された。
  • 説明可能なマスク行列はコンテンツの含め方を効果的に制御でき、意味的および関連性信号に基づく微細な生成制御を可能にした。
  • ペアワイズ抽出器は文レベルの相互作用と中心性を効果的に捉え、顕著なコンテンツの選択を向上させた。
  • 注目誘導ポインタ機構を備えたハイブリッド生成器は、抽象的要約における事実の整合性とカバレッジを向上させた。
  • BERTベースおよびTransformerベースのエンコーダーの両方が、このフレームワーク内で有効に機能し、設定間で同等の性能を示した。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。