QUICK REVIEW

[论文解读] Unifying Adversarial Training Algorithms with Flexible Deep Data Gradient Regularization

Alexander G. Ororbia, C. Lee Giles|arXiv (Cornell University)|Jan 26, 2016

Adversarial Robustness in Machine Learning参考文献 11被引用 17

一句话总结

本文提出了DataGrad，一种统一的对抗训练框架，通过灵活的L1/L2惩罚正则化深度神经网络梯度。通过优化一个通用的正则化目标函数，DataGrad涵盖了先前的对抗训练方法，并实现了最先进的鲁棒性，在干净数据和对抗性数据上均优于经典的L1/L2和多任务正则化方法，尤其在结合多任务学习时表现更优。

ABSTRACT

Many previous proposals for adversarial training of deep neural nets have included di- rectly modifying the gradient, training on a mix of original and adversarial examples, using contractive penalties, and approximately optimizing constrained adversarial ob- jective functions. In this paper, we show these proposals are actually all instances of optimizing a general, regularized objective we call DataGrad. Our proposed DataGrad framework, which can be viewed as a deep extension of the layerwise contractive au- toencoder penalty, cleanly simplifies prior work and easily allows extensions such as adversarial training with multi-task cues. In our experiments, we find that the deep gra- dient regularization of DataGrad (which also has L1 and L2 flavors of regularization) outperforms alternative forms of regularization, including classical L1, L2, and multi- task, both on the original dataset as well as on adversarial sets. Furthermore, we find that combining multi-task optimization with DataGrad adversarial training results in the most robust performance.

研究动机与目标

将多种对抗训练算法统一到一个原理性框架下。
解决训练鲁棒深度神经网络以应对对抗扰动的挑战。
提供一种高效、兼容反向传播的深度梯度正则化优化方法。
证明深度梯度正则化可超越标准L1/L2和多任务方法，提升泛化能力和鲁棒性。

提出的方法

提出一个通用的正则化目标函数DataGrad，定义为损失主项与应用于深度梯度的正则项的加权和。
使用反向传播计算正则化目标函数相对于网络权重的梯度，实现端到端训练。
采用L1和L2范数作为对损失相对于输入数据的深度梯度的正则项，实现灵活且鲁棒的优化。
通过在主任务和辅助任务的梯度上应用正则项，将框架扩展至多任务学习。
推导出一种确定性、可微的算法用于训练深度梯度惩罚，避免了先前工作中使用的近似方法。
将该框架应用于通过基于梯度的扰动生成对抗样本，并训练模型以在这些扰动下保持鲁棒性。

实验结果

研究问题

RQ1能否开发一个统一框架，涵盖基于梯度正则化的多种对抗训练方法？
RQ2在干净数据和对抗性数据上，深度梯度正则化与经典L1/L2及多任务正则化相比，其鲁棒性如何？
RQ3在对抗训练中，将多任务学习与深度梯度正则化结合会产生何种影响？
RQ4所提出的DataGrad框架能否在不使用近似的情况下，通过标准反向传播高效优化？
RQ5灵活的梯度正则化是否能提升深度神经网络的泛化能力和鲁棒性？

主要发现

使用L2正则化的DataGrad（DGL2）在强对抗噪声下于MNIST干净数据上达到98.83%的测试准确率，优于经典L2和L1正则化。
多任务DataGrad-L1变体（MT-DGL1）在λ=0.1且φ=0.1时，干净数据准确率达到99.03%，对抗数据达到98.12%，显著优于标准多任务学习。
将多任务学习与DataGrad正则化结合可获得最鲁棒的性能，MT-DGL1在φ=0.1噪声下对对抗样本的准确率达到98.90%。
DataGrad-L2在λ=0.01且φ=0.1时，在φ=0.05噪声下对抗数据准确率达到97.66%，优于所有其他方法，表现出最强鲁棒性。
所提框架泛化了先前方法（如Miyato等人和Huang等人提出的方法），表明它们是统一的DataGrad目标的特例。
消融研究证实，深度梯度正则化比标准L1/L2和多任务正则化更有效，尤其在高强度对抗攻击下表现更优。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。