Skip to main content
QUICK REVIEW

[논문 리뷰] A Unified Approach to Interpreting and Boosting Adversarial Transferability

Xin Wang, Jie Ren|arXiv (Cornell University)|2020. 10. 08.
Adversarial Robustness in Machine Learning인용 수 34
한 줄 요약

이 논문은 샤플리 상호작용 지수를 사용하여 적대적 transferability를 해석하고, transferability와 상호작용 사이에 음의 상관관계를 문서화하며, 상호작용 손실을 도입하여 transferability를 향상시킨다.

ABSTRACT

In this paper, we use the interaction inside adversarial perturbations to explain and boost the adversarial transferability. We discover and prove the negative correlation between the adversarial transferability and the interaction inside adversarial perturbations. The negative correlation is further verified through different DNNs with various inputs. Moreover, this negative correlation can be regarded as a unified perspective to understand current transferability-boosting methods. To this end, we prove that some classic methods of enhancing the transferability essentially decease interactions inside adversarial perturbations. Based on this, we propose to directly penalize interactions during the attacking process, which significantly improves the adversarial transferability.

연구 동기 및 목표

  • 적대적Transferability와 섭동 내부의 상호작용 사이의 관계를 밝힌다.
  • 섭동 상호작용의 관점에서 기존의 transferability-향상 방법들에 대한 통일된 관점을 제공한다.
  • DNN 간에 직접적으로 transferability를 향상시키기 위한 상호작용 기반 손실을 제안하고 검증한다.

제안 방법

  • 섬 perturbation 단위 기여도와 상호작용을 측정하기 위해 샤플리 값과 샤플리 상호작용 지수를 정의한다.
  • 다단계 공격이 단일단계 공격보다 더 큰 섭동 상호작용을 초래함을 보여주어 전이 가능성 감소를 설명한다.
  • 이론적으로 기존의 transferability-향상 방법들을 상호작용을 감소시키는 기법으로 연결하고 통합한다.
  • 공격 과정에서 상호작용을 벌점하기 위해 상호작용 손실(IR Attack)을 제안하고 transferability를 향상시킨다.
  • 계산 비용을 관리하기 위해 상호작용 손실의 격자 기반 근사를 구현한다.

실험 결과

연구 질문

  • RQ1적대적 transferability와 섭동 단위 간의 상호작용 사이에 음의 상관관계가 있는가?
  • RQ2공격 중에 상호작용에 페널티를 부과하는 것이 다양한 DNN 아키텍처 간의 교차 모델 transferability를 향상시킬 수 있는가?
  • RQ3전통적인 transferability-향상 방법들이 암묵적으로 상호작용을 감소시키는가, 그들의 효과에 대한 통일된 설명을 제공하는가?
  • RQ4상호작용 중심 손실(IR Attack)이 다른 방법들과 결합되었든 아니든, 보안이 설정되지 않은 모델과 강화된 모델 모두에서 transferability를 향상시키는가?
  • RQ5대규모 이미지에서 격자 단위로 상호작용 손실을 계산하고 적용하는 것이 얼마나 실용적인가?

주요 결과

  • 전이 가능성과 perturbations 내부의 상호작용 사이에 음의 상관관계가 이론적으로와 경험적으로 입증된다.
  • 고전적 transferability-향상 방법들은 대체로 섭동 간의 상호작용을 감소시키며, 그 효과에 대한 통일된 설명을 제공한다.
  • 상호작용 손실은 여러 소스/타깃 모델 쌍에 걸쳐 적대적 transferability를 크게 향상시킬 수 있다.
  • IR Attack를 통한 상호작용 페널티는 다른 transferability 향상 전술과 함께 사용해도 효과가 유지된다.
  • 격자 수준의 상호작용 페널티는 성능과 계산 비용 사이의 실용적인 균형을 제공한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.