Skip to main content
QUICK REVIEW

[論文レビュー] Neural Text Generation: Past, Present and Beyond

Sidi Lu, Yaoming Zhu|arXiv (Cornell University)|Mar 15, 2018
Topic Modeling参考文献 31被引用数 54
ひとこと要約

本論文はニューラルテキスト生成モデルを調査し、訓練パラダイム(MLE、RL、敵対的訓練)を比較し、画像キャプション生成と長文タスクのいくつかのモデルをベンチマークして、強みと限界を明らかにする。

ABSTRACT

This paper presents a systematic survey on recent development of neural text generation models. Specifically, we start from recurrent neural network language models with the traditional maximum likelihood estimation training scheme and point out its shortcoming for text generation. We thus introduce the recently proposed methods for text generation based on reinforcement learning, re-parametrization tricks and generative adversarial nets (GAN) techniques. We compare different properties of these models and the corresponding techniques to handle their common problems such as gradient vanishing and generation diversity. Finally, we conduct a benchmarking experiment with different types of neural text generation models on two well-known datasets and discuss the empirical results along with the aforementioned model properties.

研究の動機と目的

  • RNNLMからRLおよびGANベースの手法へのニューラルテキスト生成の進化を概観する。
  • 訓練パラダイム(MLE、強化学習、敵対的訓練)とそのトレードオフを分析する。
  • 標準データセットで代表的なNTGモデルをベンチマークし、実証的な知見を議論する。
  • 共通の問題点(exposure bias、勾配消失、モード崩壊)と提案された解決策を特定する。

提案手法

  • MLE、RL、敵対的訓練フレームワークを含むNTG手法の系統的文献調査。
  • 露出バイアスと生成多様性に対処する技術の比較。
  • Texygenプラットフォームを用いたImage COCOおよびEMNLP2017 WMTデータセットでのベンチマーク。
  • 安定性の問題と提案された改善(報酬のリスケーリング、ランク付けベースの識別器、階層モデル)についての議論。

実験結果

リサーチクエスチョン

  • RQ1MLEベースのNTGモデルは品質と多様性の点でRLおよびGANベースのアプローチとどのように比較されるか?
  • RQ2NTGモデルにおいて露出バイアス、勾配消失、モード崩壊を緩和する技術は何か?
  • RQ3異なるNTGアーキテクチャ(SeqGAN、RankGAN、MaliGAN、LeakGAN、MaskGAN、TextGAN)は、短文生成と長文生成タスクでどのように性能を示すか?
  • RQ4Image COCOやWMTなどのデータセットでベンチマークを行った際にどんな挙動パターンが現れるか?

主な発見

  • LeakGANは長文生成データセットで強いBLEU性能を示す。
  • SeqGANは短文生成で優れているが、多様性と勾配消失の問題に苦戦する。
  • MaliGANは勾配安定性を向上させ、いくつかの設定で多様性を維持する。
  • MaskGANとTextGANは報告された実験でBLEUのパフォーマンスが一般的に低く、TextGANは長文生成で特に深刻なモード崩壊を示す。
  • MLEは依然として強力なベースラインで、短いテキストではしばしば他の GAN/RL系とほぼ同等か超える。
  • Self-BLEU分析は複数のモデルでモード崩壊が高いことを示し、TextGANは長文で特に深刻な崩壊を示す。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。