Skip to main content
QUICK REVIEW

[論文レビュー] Extractive Text Summarization using Neural Networks

Aakash Sinha, Abhishek Yadav|arXiv (Cornell University)|Feb 27, 2018
Advanced Text Analysis Techniques参考文献 9被引用数 51
ひとこと要約

この論文は、単一文書抽出型要約のための完全データ駆動型のフィードフォワードニューラルネットワークを提案し、固定サイズのパーツを再帰的に処理することでDUC 2002データセットで競争力のある結果を示す。

ABSTRACT

Text Summarization has been an extensively studied problem. Traditional approaches to text summarization rely heavily on feature engineering. In contrast to this, we propose a fully data-driven approach using feedforward neural networks for single document summarization. We train and evaluate the model on standard DUC 2002 dataset which shows results comparable to the state of the art models. The proposed model is scalable and is able to produce the summary of arbitrarily sized documents by breaking the original document into fixed sized parts and then feeding it recursively to the network.

研究の動機と目的

  • 要約における特徴量設計よりデータ駆動型アプローチの必要性を動機づける。
  • 単一文書の抽出型要約のための完全にニューラルネットワークベースのモデルを開発する。
  • パーティショニングと再帰的処理によって任意に長い文書を扱えることを示す。
  • 最先端手法と比較するためにDUC 2002データセットでモデルを評価する。

提案手法

  • 抽出型要約のコアモデルとしてフィードフォワードニューラルネットワークを用いる。
  • DUC 2002データセットでモデルを訓練・評価する。
  • 長文を固定サイズのパートに分割し、それらを再帰的に処理して完全な要約を生成する。
  • 従来手法に特有の重い特徴量設計を避けるためデータ駆動型アプローチを採用する。

実験結果

リサーチクエスチョン

  • RQ1完全にデータ駆動型のフィードフォワードニューラルネットワークは単一文書の抽出型要約を実行できるか?
  • RQ2提案手法は固定サイズのパーティショニングと再帰によって任意に長い文書に対してスケーラブルか?
  • RQ3モデルはDUC 2002のような標準的な要約ベンチマークで競争力のある性能を達成するか?

主な発見

  • 本モデルはDUC 2002において最先端モデルと同等の結果を達成する。
  • パーティショニングと再帰処理によって任意のサイズの文書に対するスケーラビリティを持つ。
  • 重い特徴量設計を必要とせず有効性を示す。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。