Skip to main content
QUICK REVIEW

[論文レビュー] Text-to-Text Pre-Training for Data-to-Text Tasks

Mihir Kale, Rastogi, Abhinav|arXiv (Cornell University)|May 21, 2020
Topic Modeling被引用数 31
ひとこと要約

この論文は、T5を用いたテキスト対テキスト事前学習により、エンドツーエンドのモデルがパイプライン型のデータ-to-テキストシステムや他のLMを上回り、ドメイン外一般化が強いことを示す。

ABSTRACT

We study the pre-train + fine-tune strategy for data-to-text tasks. Our experiments indicate that text-to-text pre-training in the form of T5, enables simple, end-to-end transformer based models to outperform pipelined neural architectures tailored for data-to-text generation, as well as alternative language model based pre-training techniques such as BERT and GPT-2. Importantly, T5 pre-training leads to better generalization, as evidenced by large improvements on out-of-domain test sets. We hope our work serves as a useful baseline for future research, as transfer learning becomes ever more prevalent for data-to-text tasks.

研究の動機と目的

  • データ-to-テキストタスクにおけるテキスト対テキストの事前学習の有効性を調査する。
  • T5事前学習を用いたエンドツーエンドのTransformerモデルがパイプライン型手法を上回るかを評価する。
  • 複数のデータセットにわたるドメイン外データに対する事前学習済みモデルのロバスト性を評価する。
  • データ-to-テキストタスクにおけるT5と代替の事前学習戦略(BERT、GPT-2)を比較する。

提案手法

  • データ-to-テキストをテキスト対テキスト問題として扱い、構造化データを平坦な文字列として入力に線形化する。
  • 固定学習率とトークン予算でデータ-to-テキストデータセット上でT5のバリアント(Small, Base, Large, 3B)をファインチューニングする。
  • データセット特有の指標(BLEU、METEOR、PARENT)と貪欲探索によるデコードを用いて評価する。
  • 32kのSentencePiece語彙と、データセットサイズに応じて5K–10Kのファインチューニングステップを使用する。
  • WebNLGでT5-LargeとDualEncを精度と自然さで比較する人間評価を実施する。

実験結果

リサーチクエスチョン

  • RQ1T5スタイルの事前学習は、事前学習なしまたは異なる事前学習を行ったモデルよりデータ-to-テキスト生成を改善するか?
  • RQ2モデル容量(T5のバリアント)は性能とドメイン外データへの一般化にどう影響するか?
  • RQ3エンドツーエンドの事前学習生成は、WebNLG、ToTTo、MultiWoz においてパイプライン型やグラフベースのアプローチに対してより堅牢で競争力があるか?

主な発見

  • T5による事前学習はデータ-to-テキストのベンチマークで最新の結果をもたらし、ドメイン外入力へのロバスト性を向上させる。
  • エンドツーエンドのT5モデルは、洗練されたパイプライン型システムやグラフベースのエンコーダをデータ-to-テキストタスクで上回ることができる。
  • T5は一般にデータ-to-テキスト生成で、データセットを横断してBERTやGPT-2のベースラインを上回る。
  • WebNLGでは、T5-Largeが最良のBLEU/METEORスコアを達成し、未见ドメインへの強い一般化を示す(未見ドメインで大きな利得)。
  • ToTToでは、T5-3BがBERTベースラインを5.5BLEU、5.8PARENT上回り、非重複(ドメイン外)データでさらに大きな利得。
  • MultiWozでは、すべてのT5バリアントがin-domain前処理なしのSC-GPT2を上回り、Seenでの人間評価の精度と自然さが向上し、Unseenでも高い性能を示す。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。