Skip to main content
QUICK REVIEW

[论文解读] Demystifying Neural Style Transfer

Yanghao Li, Naiyan Wang|arXiv (Cornell University)|Jan 4, 2017
Generative Adversarial Networks and Image Synthesis参考文献 24被引用 88
一句话总结

论文将神经风格迁移重构为一个领域自适应问题,表明匹配 Gram 矩阵等同于最小化一个特定的 MMD,并探索替代的分布对齐方法。

ABSTRACT

Neural Style Transfer has recently demonstrated very exciting results which catches eyes in both academia and industry. Despite the amazing results, the principle of neural style transfer, especially why the Gram matrices could represent style remains unclear. In this paper, we propose a novel interpretation of neural style transfer by treating it as a domain adaptation problem. Specifically, we theoretically show that matching the Gram matrices of feature maps is equivalent to minimize the Maximum Mean Discrepancy (MMD) with the second order polynomial kernel. Thus, we argue that the essence of neural style transfer is to match the feature distributions between the style images and the generated images. To further support our standpoint, we experiment with several other distribution alignment methods, and achieve appealing results. We believe this novel interpretation connects these two important research fields, and could enlighten future researches.

研究动机与目标

  • 理解为什么 Gram 矩阵能够捕捉神经风格迁移中的风格。
  • 提出神经风格迁移与 Maximum Mean Discrepancy (MMD) 之间的理论联系。
  • 探索超越 Gram 矩阵匹配的其他风格迁移分布对齐方法。
  • 证明基于其他 MMD 和 BN 基于风格迁移方法的经验可行性。

提出的方法

  • 证明 Gram 矩阵匹配对应于带有二阶多项式核的 MMD。
  • 将风格损失重构为表达特征分布之间的基于 MMD 的差异。
  • 通过在 MMD 中应用不同的核(线性、多项式、高斯)以及 BN 统计量匹配来扩展风格迁移。
  • 将特征图中的每个位置视为一个样本,从而在特征图之间实现分布对齐。
  • 给出使用 VGG-19、标准内容/风格损失、迭代优化的实现细节。
  • 展示将不同的神经风格迁移方法融合以混合风格的能力。

实验结果

研究问题

  • RQ1神经风格迁移中的 Gram 矩阵匹配是否等价于某种形式的 MMD?
  • RQ2如何将神经风格迁移解读为内容图像和风格图像之间的分布对齐问题?
  • RQ3不同的分布对齐方法(不同核、BN 统计量)是否能产生合理的风格迁移结果?
  • RQ4在使用不同的 MMD 核进行风格迁移时,复杂性和风格化之间有哪些权衡?
  • RQ5是否可以将多种风格迁移方法融合以生成混合的风格化效果?

主要发现

  • 在 NST 中匹配 Gram 矩阵可以被重新表述为最小化带有二阶多项式核的 MMD。
  • 风格信息由 CNN 层中的特征分布表示,NST 是一个分布对齐过程。
  • 不同的分布对齐方法(线性、多项式、高斯 MMD;BN 统计量)均能产生视觉上合理的风格迁移。
  • 线性核 MMD 在计算复杂度较低的情况下达到可比的结果。
  • BN 统计量匹配提供了一种简单的替代风格损失,可按通道对齐统计量。
  • 将不同的 NST 方法融合可通过在方法之间插值来混合风格。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。