Skip to main content
QUICK REVIEW

[论文解读] On the Effectiveness of Interval Bound Propagation for Training Verifiably Robust Models

Sven Gowal, Krishnamurthy Dvijotham|arXiv (Cornell University)|Oct 30, 2018
Adversarial Robustness in Machine Learning参考文献 35被引用 300
一句话总结

本文表明区间边界传播(IBP)可用于高效训练大规模可验证鲁棒的神经网络,在 MNIST、CIFAR-10、SVHN 上达到最先进的已验证精度,并在缩放后的 ImageNet 上实现非空的验证。

ABSTRACT

Recent work has shown that it is possible to train deep neural networks that are provably robust to norm-bounded adversarial perturbations. Most of these methods are based on minimizing an upper bound on the worst-case loss over all possible adversarial perturbations. While these techniques show promise, they often result in difficult optimization procedures that remain hard to scale to larger networks. Through a comprehensive analysis, we show how a simple bounding technique, interval bound propagation (IBP), can be exploited to train large provably robust neural networks that beat the state-of-the-art in verified accuracy. While the upper bound computed by IBP can be quite weak for general networks, we demonstrate that an appropriate loss and clever hyper-parameter schedule allow the network to adapt such that the IBP bound is tight. This results in a fast and stable learning algorithm that outperforms more sophisticated methods and achieves state-of-the-art results on MNIST, CIFAR-10 and SVHN. It also allows us to train the largest model to be verified beyond vacuous bounds on a downscaled version of ImageNet.

研究动机与目标

  • 证明一个简单的区间界限传播界可以用于在大规模上训练可验证鲁rob的分类器。
  • 表明 IBP 在已验证精度方面能够超越更复杂的基于验证的方法,同时保持计算效率。
  • 提供基于课程的训练策略,稳定优化并提升可验证鲁棒模型的泛化性。
  • 在 MNIST、CIFAR-10、SVHN 以及缩放后的 ImageNet 上对比前沿方法评估基于 IBP 的训练,以确立新的基线。

提出的方法

  • 通过网络层传播轴对齐的区间界限,以对抗对数 logits 相对于 l_infty 扰动界限进行界定。
  • 建立一个训练损失,将名义预测损失与来自最坏情况对数界的规格损失结合起来(L = kappa * L_fit + (1 - kappa) * L_spec)。
  • 省略最后的线性层以获得更紧的最坏情况对数界(改进对最坏情况对数的估计)。
  • 通过网络进行两次前向传递以计算 IBP 边界,从而实现快速、可扩展的边界传播。
  • 课程安排:在训练过程中逐步增加 epsilon,并调整 kappa 以平衡拟合和验证目标。
  • 在可行时使用精确的 MIP/LP 瀑布进行鲁棒性验证,并将 IBP 边界与这些验证进行比较。

实验结果

研究问题

  • RQ1区间界限传播是否能提供一个可扩展且有效的框架,用于训练可验证鲁棒的模型?
  • RQ2在经验和已验证的精度方面,IBP 训练的鲁棒性与最先进的方法(如 Madry 等、Wong 等)在不同数据集和 epsilon 值上的比较?
  • RQ3IBP 边界是否足够紧,以作为全量验证的可靠代理,其紧密度在训练过程中如何演变?
  • RQ4在保持非空验证的前提下,IBP 是否能扩展到更大规模的网络和更高分辨率的数据(如缩放后的 ImageNet)?

主要发现

  • IBP 在 MNIST、CIFAR-10、和 SVHN 上在若干扰动半径下实现了最先进的已验证精度(例如 Mnist:在 ε=0.1 时已验证错误率 2.23%,在 ε=0.3 时 8.05%;CIFAR-10:在 ε=8/255 时已验证错误率 67.96%)。
  • IBP 可扩展到更大规模的体系结构,甚至扩展到缩放后的 ImageNet(64×64),在 WideResNet-10-10 上 ε=1/255 时的非空验证错误为 93.87%。
  • IBP 边界与完整的 MIP/LP 基于验证边界具有竞争力,且通常接近,表明该边界是可验证鲁棒性的一个良好代理。
  • IBP 训练显著比某些替代方法更快(例如,在 Titan Xp 上小模型训练时间约 3.5 秒/轮,而某些基线需要数分钟)。
  • 精心设计的课程计划(epsilon 和 kappa)使模型能够适应 IBP 边界,并提升名义与已验证性能。
  • 在 ImageNet 缩放数据上,IBP 提供了可验证的鲁棒性,在此前的工作未能在 ε=1/255 时给出非空的边界。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。