Skip to main content
QUICK REVIEW

[论文解读] Torchattacks: A PyTorch Repository for Adversarial Attacks

Hoki Kim|arXiv (Cornell University)|Sep 24, 2020
Adversarial Robustness in Machine Learning参考文献 16被引用 102
一句话总结

Torchattacks 是一个 PyTorch 库,实现多种对抗性攻击算法,用于生成对抗样本并评估模型鲁棒性,同时提供使用指南和实现细节。

ABSTRACT

Torchattacks is a PyTorch library that contains adversarial attacks to generate adversarial examples and to verify the robustness of deep learning models. The code can be found at https://github.com/Harry24k/adversarial-attacks-pytorch.

研究动机与目标

  • 推动并实现对深度学习模型在对抗样本下的鲁棒评估。
  • 提供已实现对抗攻击的全面清单及其算法细节。
  • 就如何在 PyTorch 模型和数据管道中应用攻击提供实用指导。

提出的方法

  • 将攻击公式描述为在 L0、L2 或 L_infinity 范数下,对扰动在 epsilon-ball 内的优化。
  • 实现包括 FGSM、BIM、CW、R+FGSM、PGD、EOT+PGD、TPGD、FFGSM、MI-FGSM 以及 MultiAttack 的核心攻击。
  • 给出每种攻击的逐步算法方程及其在 PyTorch 实现中的参数(model、eps、steps 等)。
  • 引入统一的 Attack 类及用于模式控制、输出类型、保存对抗样本,以及通过 MultiAttack 组合攻击的使用工具。

实验结果

研究问题

  • RQ1Torchattacks 实现了哪些对抗攻击,它们在数学上是如何被公式化的?
  • RQ2用户如何在 PyTorch 工作流中应用这些攻击以生成对抗样本?
  • RQ3Torchattacks 提供了哪些工具来管理攻击模式、输出以及攻击的组合?

主要发现

  • 一个在 PyTorch 中实现的多种知名对抗性攻击的库,包含显式公式和实现示例。
  • 对攻击模型的注意事项以及输入/输出形状要求有清晰的文档化。
  • 包括 Attack 类方法和用于组合攻击的 MultiAttack 的实用使用指南。
  • 示例演示如何以典型参数设置实例化攻击(例如 FGSM、BIM、CW)。
  • 支持多样化的攻击变体,如 RFGSM、PGDL2、EOTPGD、TPGD、FFGSM 和 MIFGSM。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。