Skip to main content
QUICK REVIEW

[论文解读] Alternating Back-Propagation for Generator Network

Tian Han, Yang Lu|arXiv (Cornell University)|Jun 28, 2016
Neural Networks and Applications被引用 50
一句话总结

本文提出一种用于训练生成器网络的交替反向传播算法,该算法是非线性因子分析的推广,其中从潜在因子到观测值的映射由卷积神经网络建模。该方法在推断反向传播(通过朗之万动力学或梯度下降推断潜在因子)和学习反向传播(通过梯度下降更新网络权重)之间交替进行,能够在完整、不完整或间接数据上实现有效训练,并在自然图像、视频和音频任务上取得最先进性能。

ABSTRACT

This paper proposes an alternating back-propagation algorithm for learning the generator network model. The model is a non-linear generalization of factor analysis. In this model, the mapping from the continuous latent factors to the observed signal is parametrized by a convolutional neural network. The alternating back-propagation algorithm iterates the following two steps: (1) Inferential back-propagation, which infers the latent factors by Langevin dynamics or gradient descent. (2) Learning back-propagation, which updates the parameters given the inferred latent factors by gradient descent. The gradient computations in both steps are powered by back-propagation, and they share most of their code in common. We show that the alternating back-propagation algorithm can learn realistic generator models of natural images, video sequences, and sounds. Moreover, it can also be used to learn from incomplete or indirect training data.

研究动机与目标

  • 开发一种可扩展且高效的生成器网络训练算法,将线性因子分析推广至非线性、深度生成模型。
  • 解决在观测数据不完整或间接时,具有潜在变量模型的学习挑战。
  • 通过在两个步骤中均使用反向传播,将推断与学习统一为一个可微分的框架。
  • 通过结构化、迭代的优化过程,实现解耦且可解释的表征。
  • 在包括图像、视频和音频在内的多种数据模态上,展示该方法的鲁棒性与泛化能力。

提出的方法

  • 在两个步骤之间交替进行:推断反向传播(通过梯度下降或朗之万动力学推断潜在因子)和学习反向传播(通过梯度下降更新网络权重)。
  • 在推断和学习两个步骤中均利用反向传播进行梯度计算,共享大部分底层代码和计算图。
  • 使用卷积神经网络(ConvNet)对从潜在因子到观测信号的非线性映射进行参数化。
  • 应用“解释排除”推断机制,即潜在因子竞争解释每个观测值,从而在不确定性下实现鲁棒推断。
  • 将学习步骤视为给定推断因子的监督学习,将推断步骤视为通过优化求解的逆问题。
  • 采用密度偏移解释:模型在潜在空间中迭代调整数据先验以匹配真实先验,从而实现有效的生成建模。

实验结果

研究问题

  • RQ1交替反向传播算法能否有效训练基于深度ConvNet的非线性生成器网络,实现从潜在因子到观测值的映射?
  • RQ2当训练数据不完整或间接时,该方法在推断与学习方面表现如何?
  • RQ3该模型能否学习到解耦且可解释的表征,从而支持潜在空间中的线性插值以实现有意义的数据生成?
  • RQ4该交替优化框架是否能收敛到一个有意义的生成器模型,从而捕捉图像、视频和音频中复杂的数据分布?
  • RQ5与标准自编码器或变分自编码器相比,该方法在训练稳定性与重建质量方面的泛化能力在多大程度上更优?

主要发现

  • 交替反向传播算法成功学习到自然图像、视频序列和音频信号的逼真生成器模型。
  • 由于潜在因子推断中采用了解释排除机制,即使在训练数据不完整或存在遮挡的情况下,该方法仍能实现有效的推断与学习。
  • 该算法在多种数据类型上表现出稳健性能,表明该方法的通用性超越了标准自编码框架。
  • 模型在潜在空间中学习到的数据先验与真实先验高度接近,推断后验分布与真实先验分布的一致性可作为证据。
  • 该框架能够实现高质量的数据重建与生成,重建误差可作为模型性能的有效评估指标。
  • 推断与学习步骤之间共享反向传播计算,实现了高效的实现并减少了代码重复。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。