QUICK REVIEW

[论文解读] Torchattacks: A PyTorch Repository for Adversarial Attacks

Hoki Kim|arXiv (Cornell University)|Sep 24, 2020

Adversarial Robustness in Machine Learning参考文献 16被引用 102

一句话总结

Torchattacks 是一个 PyTorch 库，实现多种对抗性攻击算法，用于生成对抗样本并评估模型鲁棒性，同时提供使用指南和实现细节。

ABSTRACT

Torchattacks is a PyTorch library that contains adversarial attacks to generate adversarial examples and to verify the robustness of deep learning models. The code can be found at https://github.com/Harry24k/adversarial-attacks-pytorch.

研究动机与目标

推动并实现对深度学习模型在对抗样本下的鲁棒评估。
提供已实现对抗攻击的全面清单及其算法细节。
就如何在 PyTorch 模型和数据管道中应用攻击提供实用指导。

提出的方法

将攻击公式描述为在 L0、L2 或 L_infinity 范数下，对扰动在 epsilon-ball 内的优化。
实现包括 FGSM、BIM、CW、R+FGSM、PGD、EOT+PGD、TPGD、FFGSM、MI-FGSM 以及 MultiAttack 的核心攻击。
给出每种攻击的逐步算法方程及其在 PyTorch 实现中的参数（model、eps、steps 等）。
引入统一的 Attack 类及用于模式控制、输出类型、保存对抗样本，以及通过 MultiAttack 组合攻击的使用工具。

实验结果

研究问题

RQ1Torchattacks 实现了哪些对抗攻击，它们在数学上是如何被公式化的？
RQ2用户如何在 PyTorch 工作流中应用这些攻击以生成对抗样本？
RQ3Torchattacks 提供了哪些工具来管理攻击模式、输出以及攻击的组合？

主要发现

一个在 PyTorch 中实现的多种知名对抗性攻击的库，包含显式公式和实现示例。
对攻击模型的注意事项以及输入/输出形状要求有清晰的文档化。
包括 Attack 类方法和用于组合攻击的 MultiAttack 的实用使用指南。
示例演示如何以典型参数设置实例化攻击（例如 FGSM、BIM、CW）。
支持多样化的攻击变体，如 RFGSM、PGDL2、EOTPGD、TPGD、FFGSM 和 MIFGSM。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。