Skip to main content
QUICK REVIEW

[论文解读] Style Transfer from Non-Parallel Text by Cross-Alignment

Tianxiao Shen, Tao Leí|arXiv (Cornell University)|May 26, 2017
Topic Modeling参考文献 25被引用 353
一句话总结

本文提出一种跨对齐框架,利用非并行文本通过学习共享的内容潜在空间并在风格之间对齐分布来进行风格迁移,在情感修改、单词替换密码的解密以及词序恢复任务上进行评估。

ABSTRACT

This paper focuses on style transfer on the basis of non-parallel text. This is an instance of a broad family of problems including machine translation, decipherment, and sentiment modification. The key challenge is to separate the content from other aspects such as style. We assume a shared latent content distribution across different text corpora, and propose a method that leverages refined alignment of latent representations to perform style transfer. The transferred sentences from one style should match example sentences from the other style as a population. We demonstrate the effectiveness of this cross-alignment method on three tasks: sentiment modification, decipherment of word substitution ciphers, and recovery of word order.

研究动机与目标

  • 在仅有非并行、单一风格数据可用的情境下为风格迁移提供动机。
  • 提出一种经过改进的跨对齐方法,在不大幅扰动内容表征的前提下将内容与风格解耦。
  • 在多项任务上展示效果——情感修改、单词替换解密和词序恢复——使用非并行数据。
  • 探讨在理论与实践层面可使内容分布在不同风格间对齐以实现可迁移映射的条件。

提出的方法

  • 引入一个编码器 E,将句子及其风格映射到一个与风格无关的内容表示 z。
  • 引入一个风格相关的生成器 G,使其在给定风格 y 和内容 z 的条件下解码 x,从而实现跨风格迁移。
  • 使用两种训练变体:对齐自编码器(带对抗判别器以在风格之间对齐 z 分布)和跨对齐自编码器(使用双判别器将转移样本与来自另一风格的真实样本对齐)。
  • 避免强制简单的 p(z) 先验;相反,鼓励丰富的内容表示和跨分布对齐,以支持非并行风格迁移。
  • 应用连续松弛和 Professor-Forcing 来在离散语言输出下训练,缓解梯度估计问题。
  • 使用两个判别器和两个训练信号进行评估,以确保潜在空间对齐和健壮的跨领域迁移。

实验结果

研究问题

  • RQ1是否可以利用具有相同内容分布的非并行语料库,通过对齐跨风格的潜在内容来学习风格迁移映射?
  • RQ2潜在表示的跨对齐是否在情感修改、解密和词序任务中提高内容保留和风格迁移质量?
  • RQ3在没有显式 p(z) 先验的情况下,处理离散语言生成和对齐分布的实际训练策略有哪些?

主要发现

  • 跨对齐自编码器在情感迁移质量上超过非跨对齐基线,转移句子的情感迁移准确率达到 78.4%。
  • 对齐自编码器和跨对齐自编码器在非并行解密任务中显示出显著改进,在替换和词序挑战方面的 BLEU 分数高于对齐或 VAE 基线。
  • 在情感评估中,跨对齐自编码器总体迁移分数为 41.5%,人评流畅度分数为 2.8,在某些设定下,基线 control-gen 模型为 41.0%。
  • 在情感分类方面,预训练分类器报告 Hu et al.(2017)方法的准确率为 83.5%,而作者设置中的跨对齐自编码器实现了 78.4% 的准确率。
  • 在解密实验中,跨对齐自编码器在多种替换率(如 20%–100%)下持续优于非跨对齐基线,BLEU 分数在 100% 替换时达到 57.4,词序恢复时达到 26.1,相较于非迁移基线。
  • 结果表明,跨对齐强化了潜在 z 的对齐并提升了在多样化非并行风格迁移任务中的迁移质量。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。