Skip to main content
QUICK REVIEW

[논문 리뷰] MACER: Attack-free and Scalable Robust Training via Maximizing Certified Radius

Runtian Zhai, Dan Chen|arXiv (Cornell University)|2020. 01. 08.
Adversarial Robustness in Machine Learning참고 문헌 35인용 수 66
한 줄 요약

MACER는 무작위 스무딩으로 인증 반경을 직접 최대화하여 공격 없이도 강인한 심층 네트워크를 학습시키고, CIFAR-10, ImageNet, MNIST, SVHN 전반에 걸쳐 더 빠른 학습과 강력한 실증 결과로 provable l2-robustness를 달성한다.

ABSTRACT

Adversarial training is one of the most popular ways to learn robust models but is usually attack-dependent and time costly. In this paper, we propose the MACER algorithm, which learns robust models without using adversarial training but performs better than all existing provable l2-defenses. Recent work shows that randomized smoothing can be used to provide a certified l2 radius to smoothed classifiers, and our algorithm trains provably robust smoothed classifiers via MAximizing the CErtified Radius (MACER). The attack-free characteristic makes MACER faster to train and easier to optimize. In our experiments, we show that our method can be applied to modern deep neural networks on a wide range of datasets, including Cifar-10, ImageNet, MNIST, and SVHN. For all tasks, MACER spends less training time than state-of-the-art adversarial training algorithms, and the learned models achieve larger average certified radius.

연구 동기 및 목표

  • 공격 의존적 학습 없이 provable한 보장을 제공하는 강인 분류를 고안한다.
  • l2 섭동 하에서 인증된 강인성을 갖춘 심층 네트워크의 확장 가능한 학습을 가능하게 한다.
  • 인증된 강인성을 개선하기 위해 직접 인증 강인성 반경을 최적화한다.
  • 여러 데이터셋에 걸쳐 기존의 적대적 학습 및 인증 기반 기준선과 비교한다.

제안 방법

  • 가우시안 스무딩으로 정의된 f_theta의 스무딩된 분류기 g_theta를 이용한다.
  • 가우시안 스무딩 한계를 사용하여 인증 반경 CR(g_theta; x, y)을 계산한다.
  • 공동 목적 함수 l(g_theta; x, y) = l_C(g_theta; x, y) + l_R(g_theta; x, y)로 형식화한다.
  • 교차 엔트로피로서의 l_C와 인증 반경에 대한 힌지 로스로 surrogate 손실을 채택한다.
  • Differentiable한 인증 반경을 얻기 위해 Soft-RS를 도입한다: 기대값을 가지는 CR(tilde g_theta; x, y)에서 가우시안 노이즈를 이용한다.
  • z_theta의 몬테카를로 추정과 스무딩된 확률을 통해 경험적 surrogate 손실을 최적화한다.
  • 내부 적대적 루프 없이 미니배치 업데이트를 교대로 수행하는 엔드-투-엔드 알고리즘(MACER)을 제공한다.

실험 결과

연구 질문

  • RQ1증명 가능한 강인성을 얻기 위해 공격 기반 학습 없이 인증 반경을 최대화할 수 있는가?
  • RQ2무작위 스무딩이 현대의 심층 네트워크와 대규모 데이터셋에 대해 확장 가능하며 신뢰할 수 있는 강인성 보장을 제공하는가?
  • RQ3MACER가 기존의 스무딩 분류기 및 적대적 학습에 비해 정확도와 평균 인증 반경(ACR) 측면에서 어떤 차이가 있는가?
  • RQ4인증 강인성을 안정적으로 최적화할 수 있는 실용적 surrogate 손실과 미분 가능 형식은 무엇인가?
  • RQ5초모수(노이즈 수준 sigma, 샘플 수 k, lambda, gamma, beta)가 데이터셋 간 강인성-정확도 트레이드오프에 어떤 영향을 미치는가?

주요 결과

  • MACER는 CIFAR-10, ImageNet, MNIST, SVHN 전반에서 CE 기반 학습만으로 얻은 것보다 더 높은 근사 인증 테스트 정확도를 일관되게 보여준다.
  • CIFAR-10에서 MACER는 대략 같은 설정에서 baselines보다 더 큰 평균 인증 반경(ACR)을 달성하며, 일부 sigma 구성에서 약 3% 정도 개선된다.
  • ImageNet에서 MACER는 학습 시간을 줄이면서 baselines와 유사하거나 더 나은 ACR을 달성한다. 예를 들어 sigma=0.25일 때 MACER의 ACR은 0.544로 Cohen의 0.470, Salman의 0.528보다 높다.
  • 적대적 학습보다 내부 공격 루프를 피하기 때문에 CIFAR-10 및 ImageNet 비교에서 sec/epoch 및 총 학습 시간이 크게 낮아 학습 속도가 더 빠르다.
  • Soft-RS 구성은 미분 가능한 인증 반경을 제공하여 안정적인 최적화를 가능하게 하며, 힌지 기반 강인성 손실은 폭발적 그래디언트 문제를 완화한다.
  • 대규모 데이터셋과 아키텍처(예: CIFAR-10 및 ImageNet의 ResNet 변형)에서 학습 시간 효율성과 강인성 이득이 입증된다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.