QUICK REVIEW

[论文解读] MACER: Attack-free and Scalable Robust Training via Maximizing Certified Radius

Runtian Zhai, Dan Chen|arXiv (Cornell University)|Jan 8, 2020

Adversarial Robustness in Machine Learning参考文献 35被引用 66

一句话总结

MACER 通过直接最大化从随机化平滑得到的认证半径，在没有对抗攻击的情况下训练鲁棒深度网络，达到可证明的 l2 鲁棒性，训练更快，并在 CIFAR-10、ImageNet、MNIST 和 SVHN 上取得强劲的经验结果。

ABSTRACT

Adversarial training is one of the most popular ways to learn robust models but is usually attack-dependent and time costly. In this paper, we propose the MACER algorithm, which learns robust models without using adversarial training but performs better than all existing provable l2-defenses. Recent work shows that randomized smoothing can be used to provide a certified l2 radius to smoothed classifiers, and our algorithm trains provably robust smoothed classifiers via MAximizing the CErtified Radius (MACER). The attack-free characteristic makes MACER faster to train and easier to optimize. In our experiments, we show that our method can be applied to modern deep neural networks on a wide range of datasets, including Cifar-10, ImageNet, MNIST, and SVHN. For all tasks, MACER spends less training time than state-of-the-art adversarial training algorithms, and the learned models achieve larger average certified radius.

研究动机与目标

在不依赖攻击的训练的前提下，推动提供可证明保证的鲁棒分类。
实现对深度网络在 L2 扰动下具有认证鲁棒性的可扩展训练。
直接优化认证鲁棒半径，以提升准确性和鲁棒性。
在多数据集上与对抗训练和基于认证的基线进行比较。

提出的方法

利用通过高斯平滑 f_theta 定义的平滑分类器 g_theta。
使用高斯平滑界计算认证半径 CR(g_theta; x, y)。
将联合目标函数形式化为 l(g_theta; x, y) = l_C(g_theta; x, y) + l_R(g_theta; x, y)。
采用替代损失：l_C 作为交叉熵；l_R 作为对认证半径的铰链损失。
引入 Soft-RS 以获得可微分的认证半径：CR(tilde g_theta; x, y) 在高斯噪声的期望下。
通过对 z_theta 和平滑概率的蒙特卡罗估计来优化经验替代损失。
给出一个端到端算法（MACER），在没有内部对抗循环的情况下交替小批量更新。

实验结果

研究问题

RQ1通过最大化认证半径，是否能在不使用基于攻击的训练的情况下实现可证明的鲁棒性？
RQ2随机平滑是否能扩展到现代深度网络和大规模数据集，并提供可靠的鲁棒性保证？
RQ3MACER 在准确性和平均认证半径（ACR）方面与现有的平滑分类器和对抗训练相比表现如何？
RQ4哪些实用的替代损失和可微分表达有助于稳定优化认证鲁棒性？
RQ5超参数（噪声水平 sigma、采样次数 k、lambda、gamma、beta）如何影响跨数据集的鲁棒性-准确性权衡？

主要发现

MACER 在 CIFAR-10、ImageNet、MNIST 和 SVHN 的测试中始终比仅 CE 基训练得到更高的近似认证测试准确度。
在 CIFAR-10 上，MACER 相较于基线在可比设置下获得更大的平均认证半径（ACR），在某些 sigma 配置下提升约 3% 。
在 ImageNet 上，MACER 的 ACR 与基线相当或更好，同时缩短训练时间；例如 sigma=0.25 时，MACER 的 ACR 为 0.544，而 Cohen 为 0.470、Salman 为 0.528。
由于避免内部攻击循环，MACER 的训练比对抗训练快，在 CIFAR-10 与 ImageNet 的比较中表现为更低的每 epoch 秒数和总训练小时数。
Soft-RS 形式化提供了可微分的认证半径，使优化更稳定；基于铰链的鲁棒性损失有助于减缓梯度爆炸。
在大规模数据集和体系结构（如 CIFAR-10 和 ImageNet 的 ResNet 变体）上的训练时间效率和鲁棒性提升得到证实。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。