Skip to main content
QUICK REVIEW

[論文レビュー] Focused Meeting Summarization via Unsupervised Relation Extraction

Lu Wang, Claire Cardie|arXiv (Cornell University)|Jun 24, 2016
Topic Modeling参考文献 31被引用数 28
ひとこと要約

本稿では、意思決定要約を関係抽出タスクとして扱い、タスク固有の制約と特徴量を用いて会話から顕著な意思決定内容フレーズを同定する、非教師付きフレームワークを提案する。このフレームワークは、非教師付き抽出要約ベースラインおよび一般化された関係抽出手法を上回り、教師あり手法と同等のROUGEスコアを達成しており、会議における要約生成における非教師付き関係抽出の可能性を示している。

ABSTRACT

We present a novel unsupervised framework for focused meeting summarization that views the problem as an instance of relation extraction. We adapt an existing in-domain relation learner (Chen et al., 2011) by exploiting a set of task-specific constraints and features. We evaluate the approach on a decision summarization task and show that it outperforms unsupervised utterance-level extractive summarization baselines as well as an existing generic relation-extraction-based summarization method. Moreover, our approach produces summaries competitive with those generated by supervised methods in terms of the standard ROUGE score.

研究の動機と目的

  • 会議の特定の側面(意思決定、行動、アイデアなど)に焦点を当てた、要約的かつ要約の簡潔さを確保する要約生成の課題に対処すること。
  • ノイズが多く、不順序な会話トランスクリプトによる冗長または不連携な要約を生じる抽出要約手法の改善。
  • 人為的アノテーションを用いた学習データが不要な状態で、非教師付き関係抽出が要約生成のための顕著なフレーズを効果的に同定できるかどうかの検討。
  • 標準的なROUGEメトリクスを用いて、抽出要約および教師ありベースラインと比較して、意思決定に焦点を当てた要約生成の評価。

提案手法

  • フレームワークは、焦点的会議要約を非教師付き関係抽出の一種として扱い、意思決定関連のフレーズを示すインジケータと、それに対応する引数のペアを同定する。
  • 意思決定コンテンツおよび意思決定キュー検出に特化したタスク固有の制約と特徴量を組み込むことで、既存のドメイン内関係学習手法(Chen et al., 2011)を適応させる。
  • システムは、意思決定キュー(例:'maybe that could be')と意思決定コンテンツ(例:'a little apple')を区別し、要約生成に使用するのは主に後者である。
  • 関係インスタンスは(インジケータ, 引数)ペアとして表現され、引数が要約に含める核心的な意思決定コンテンツである。
  • 文法的および意味的制約を用いて関係検出の正確性を向上させ、ゴールスタンダードの意思決定要約と整合するフレーズに焦点を当てる。
  • 要約は抽出された関係引数を統合することで生成され、意思決定の内容を要約的に表現するフレーズベースのコンパクトな表現が得られる。

実験結果

リサーチクエスチョン

  • RQ1非教師付き関係抽出は、特に意思決定コンテンツの同定に関して、焦点的会議要約に効果的に適応可能か?
  • RQ2この関係ベースのアプローチは、非教師付き発話レベル抽出要約ベースラインと比較して、どの程度の性能を示すか?
  • RQ3非教師付き手法は、焦点的要約において、教師あり手法と同等のROUGEスコアをどの程度達成できるか?
  • RQ4このフレームワークは、不順序で口語的な会話において、意思決定キューと実際の意思決定コンテンツを区別できるか?

主な発見

  • 提案手法は、すべてのROUGEメトリクスにおいて非教師付き発話レベル抽出ベースライン(Longest DA, Prototype DA, GRE)を上回り、ROUGE-1、ROUGE-2、ROUGE-SU4のF1スコアがいずれも高い。
  • すべての手法の中で最高のROUGE-1リ콜(19.14)を達成しており、基準要約の内容をより包括的にカバーしていることを示している。
  • 提案手法のROUGEスコアは、教師あり手法(SVM, CRF)と同等であり、特にリコールにおいて顕著で、人為的アノテーションを必要としないにもかかわらず、強力な内容カバーを実現している。
  • システムクラスタリングの結果、異なるクラスタリング設定においても一貫した性能を維持しており、ROUGE-1 F1スコアは17.4以上を記録している。
  • サンプル出力では、抽出手法がしばしば冗長または関係のない発話断片を含めるのに対し、本手法はより一貫性があり包括的なフレーズベースの要約を生成している。
  • 本手法は、'rechargeable batteries' や 'through the docking station' といった意思決定コンテンツフレーズを効果的に同定している一方で、'maybe that could be' といった意思決定キューをフィルタリングしており、より簡潔で関連性の高い要約が得られている。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。