Skip to main content
QUICK REVIEW

[论文解读] Unifying Adversarial Training Algorithms with Flexible Deep Data Gradient Regularization

Alexander G. Ororbia, C. Lee Giles|arXiv (Cornell University)|Jan 26, 2016
Adversarial Robustness in Machine Learning参考文献 11被引用 17
一句话总结

本文提出了DataGrad,一种统一的对抗训练框架,通过灵活的L1/L2惩罚正则化深度神经网络梯度。通过优化一个通用的正则化目标函数,DataGrad涵盖了先前的对抗训练方法,并实现了最先进的鲁棒性,在干净数据和对抗性数据上均优于经典的L1/L2和多任务正则化方法,尤其在结合多任务学习时表现更优。

ABSTRACT

Many previous proposals for adversarial training of deep neural nets have included di- rectly modifying the gradient, training on a mix of original and adversarial examples, using contractive penalties, and approximately optimizing constrained adversarial ob- jective functions. In this paper, we show these proposals are actually all instances of optimizing a general, regularized objective we call DataGrad. Our proposed DataGrad framework, which can be viewed as a deep extension of the layerwise contractive au- toencoder penalty, cleanly simplifies prior work and easily allows extensions such as adversarial training with multi-task cues. In our experiments, we find that the deep gra- dient regularization of DataGrad (which also has L1 and L2 flavors of regularization) outperforms alternative forms of regularization, including classical L1, L2, and multi- task, both on the original dataset as well as on adversarial sets. Furthermore, we find that combining multi-task optimization with DataGrad adversarial training results in the most robust performance.

研究动机与目标

  • 将多种对抗训练算法统一到一个原理性框架下。
  • 解决训练鲁棒深度神经网络以应对对抗扰动的挑战。
  • 提供一种高效、兼容反向传播的深度梯度正则化优化方法。
  • 证明深度梯度正则化可超越标准L1/L2和多任务方法,提升泛化能力和鲁棒性。

提出的方法

  • 提出一个通用的正则化目标函数DataGrad,定义为损失主项与应用于深度梯度的正则项的加权和。
  • 使用反向传播计算正则化目标函数相对于网络权重的梯度,实现端到端训练。
  • 采用L1和L2范数作为对损失相对于输入数据的深度梯度的正则项,实现灵活且鲁棒的优化。
  • 通过在主任务和辅助任务的梯度上应用正则项,将框架扩展至多任务学习。
  • 推导出一种确定性、可微的算法用于训练深度梯度惩罚,避免了先前工作中使用的近似方法。
  • 将该框架应用于通过基于梯度的扰动生成对抗样本,并训练模型以在这些扰动下保持鲁棒性。

实验结果

研究问题

  • RQ1能否开发一个统一框架,涵盖基于梯度正则化的多种对抗训练方法?
  • RQ2在干净数据和对抗性数据上,深度梯度正则化与经典L1/L2及多任务正则化相比,其鲁棒性如何?
  • RQ3在对抗训练中,将多任务学习与深度梯度正则化结合会产生何种影响?
  • RQ4所提出的DataGrad框架能否在不使用近似的情况下,通过标准反向传播高效优化?
  • RQ5灵活的梯度正则化是否能提升深度神经网络的泛化能力和鲁棒性?

主要发现

  • 使用L2正则化的DataGrad(DGL2)在强对抗噪声下于MNIST干净数据上达到98.83%的测试准确率,优于经典L2和L1正则化。
  • 多任务DataGrad-L1变体(MT-DGL1)在λ=0.1且φ=0.1时,干净数据准确率达到99.03%,对抗数据达到98.12%,显著优于标准多任务学习。
  • 将多任务学习与DataGrad正则化结合可获得最鲁棒的性能,MT-DGL1在φ=0.1噪声下对对抗样本的准确率达到98.90%。
  • DataGrad-L2在λ=0.01且φ=0.1时,在φ=0.05噪声下对抗数据准确率达到97.66%,优于所有其他方法,表现出最强鲁棒性。
  • 所提框架泛化了先前方法(如Miyato等人和Huang等人提出的方法),表明它们是统一的DataGrad目标的特例。
  • 消融研究证实,深度梯度正则化比标准L1/L2和多任务正则化更有效,尤其在高强度对抗攻击下表现更优。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。