QUICK REVIEW

[논문 리뷰] Manifold Regularization for Adversarial Robustness

Charles Jin, Martin Rinard|arXiv (Cornell University)|2020. 03. 09.

Adversarial Robustness in Machine Learning참고 문헌 11인용 수 7

한 줄 요약

이 논문은 적대적 예제 생성을 필요로 하지 않고 데이터 다양체의 국소 안정성을 강제함으로써 딥 네ural 네트워크의 적대적 로버스트성을 향상시키는 다양체 정규화 접근법을 제안한다. $ε = 8/255$ $ε_\infty$ 편향 하에서 CIFAR-10에서 70%의 최신 기술 수준의 로버스트 정확도를 달성하며, 표준 적대적 훈련에 비해 훈련 속도가 수개의 주기 빠르다.

ABSTRACT

Manifold regularization is a technique that penalizes the complexity of learned functions over the intrinsic geometry of input data. We develop a connection to learning functions which are locally stable, and propose new regularization terms for training deep neural networks that are stable against a class of local perturbations. These regularizers enable us to train a network to state-of-the-art robust accuracy of 70% on CIFAR-10 against a PGD adversary using $\ell_\infty$ perturbations of size $\epsilon = 8/255$. Furthermore, our techniques do not rely on the construction of any adversarial examples, thus running orders of magnitude faster than standard algorithms for adversarial training.

연구 동기 및 목표

적대적 예제 생성에 의존하지 않고 딥 네ural 네트워크의 적대적 로버스트성을 향상시키기 위해.
학습된 함수의 국소 안정성과 다양체 정규화 간의 관계를 수학적으로 형식화하기 위해.
국소 편향에 대한 저항력을 향상시키는 효율적인 정규화 기법을 개발하기 위해.
최소한의 계산 오버헤드로 $ε_\infty$ 편향 하에서 CIFAR-10에서 최신 기술 수준의 로버스트 정확도를 달성하기 위해.

제안 방법

입력 데이터의 내재 기하학에 걸쳐 함수 복잡도를 억제하는 새로운 정규화 항을 도입한다.
데이터의 다양체 구조를 활용하여 학습된 함수의 국소 안정성을 강제한다.
명시적인 적대적 훈련 없이도 국소 편향을 암시적으로 고려하는 정규화 구성 요소를 설계한다.
표준 백프로파게이션 동안 정규화 항을 적용하여 비용이 많이 드는 적대적 예제 생성을 피한다.
데이터 다양체를 기반으로 작은 국소 편향에 잘 일반화되는 부드러움 우선순위를 정의한다.
로버스트성을 향상시키기 위해 기하학적 인덕티브 바이어스를 활용하면서도 높은 자연 정확도를 유지한다.

실험 결과

연구 질문

RQ1적대적 예제 생성 없이 다양체 정규화를 효과적으로 활용하여 적대적 로버스트성을 향상시킬 수 있는가?
RQ2데이터 다양체 상에서 국소 안정성을 강제하면 $ε_\infty$ 편향에 대한 저항력이 어떻게 향상되는가?
RQ3로버스트 정확도와 훈련 속도 측면에서 표준 적대적 훈련에 비해 다양체 정규화의 성능은 어떠한가?
RQ4제안된 정규화 항은 다양한 데이터 분포와 네트워크 아키텍처 간에 일반화 가능한가?
RQ5로버스트성을 향상시키는 동안 높은 자연 정확도를 유지할 수 있는가?

주요 결과

제안된 방법은 $ε = 8/255$ $ε_\infty$ 편향 하에서 CIFAR-10에서 70%의 로버스트 정확도를 달성하여 최신 기술 수준의 성능을 보였다.
적대적 예제 생성을 피하기 때문에 제안된 정규화를 사용한 훈련은 표준 적대적 훈련보다 훨씬 빠르다.
데이터 다양체에서 유도된 기하학적 우선순위를 통해 국소 안정성을 강제함으로써 로버스트성이 향상된다.
이 방법은 자연 정확도를 높게 유지하므로 로버스트성과 표준 정확도 사이의 유리한 트레이드오프를 보였다.
어떤 명시적 적대적 데이터도 필요로 하지 않아 계산 오버헤드가 감소하며, 정규화 항이 효과적이다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.