QUICK REVIEW

[논문 리뷰] Torchattacks: A PyTorch Repository for Adversarial Attacks

Hoki Kim|arXiv (Cornell University)|2020. 09. 24.

Adversarial Robustness in Machine Learning참고 문헌 16인용 수 102

한 줄 요약

Torchattacks는 다양한 적대적 공격 알고리즘을 구현하여 적대적 예제를 생성하고 모델 강건성을 평가하는 PyTorch 라이브러리로, 사용 가이드와 구현 세부 정보를 제공합니다.

ABSTRACT

Torchattacks is a PyTorch library that contains adversarial attacks to generate adversarial examples and to verify the robustness of deep learning models. The code can be found at https://github.com/Harry24k/adversarial-attacks-pytorch.

연구 동기 및 목표

적대적 예제에 대한 깊은 학습 모델의 강건한 평가를 촉진하고 가능하게 한다.
구현된 적대적 공격 목록과 그 알고리즘적 세부 정보를 포괄적으로 제공한다.
PyTorch 모델과 데이터 파이프라인 내에서 공격을 적용하기 위한 실용적인 지침을 제시한다.

제안 방법

L0, L2 또는 L_infinity 노름 하에서 ε-볼 내 교란을 최적화하는 형식으로 공격 수식을 설명한다.
FGSM, BIM, CW, R+FGSM, PGD, EOT+PGD, TPGD, FFGSM, MI-FGSM, 및 MultiAttack를 포함한 핵심 공격을 구현한다.
각 공격에 대한 단계별 알고리즘 방정식과 PyTorch 구현 매개변수(model, eps, steps 등)를 제시한다.
모드 제어, 출력 유형, 적대적 예시 저장, MultiAttack를 통한 공격 결합 등을 위한 통합 Attack 클래스와 사용 유틸리티를 도입한다.

실험 결과

연구 질문

RQ1Torchattacks에 어떤 적대적 공격이 구현되어 있고 수학적으로 어떻게 수식화되어 있는가?
RQ2사용자들은 PyTorch 워크플로우 내에서 이 공격들을 어떻게 적용해 적대적 예제를 생성할 수 있는가?
RQ3Torchattacks가 공격 모드, 출력 및 공격의 조합을 관리하기 위해 어떤 유틸리티를 제공하는가?

주요 결과

명시적 수식과 구현 예제가 포함된 PyTorch로 구현된 다수의 잘 알려진 적대적 공격 라이브러리.
모델 공격 시 명확하게 문서화된 주의사항 및 입력/출력 형상 요구사항.
Attack 클래스 메서드 및 공격 결합을 위한 MultiAttack를 포함한 실용적인 사용 지침.
예제는 일반적인 매개변수 설정으로 FGSM, BIM, CW 등의 공격을 인스턴스화하는 방법을 보여준다.
RFGSM, PGDL2, EOTPGD, TPGD, FFGSM, 및 MIFGSM과 같은 다양한 공격 변형을 지원한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.