QUICK REVIEW

[논문 리뷰] Globally-Robust Neural Networks

K. Rustan M. Leino, Zifan Wang|arXiv (Cornell University)|2021. 02. 16.

Adversarial Robustness in Machine Learning참고 문헌 47인용 수 23

한 줄 요약

이 논문은 전역 리프시츠 상한을 사용하여 신경망을 훈련시켜 최소한의 훈련 및 추론 오버헤드로 최신 기준의 검증된 강건성 정확도를 달성하는 글로벌-강건 신경망(GloRo Nets)을 소개한다. 전방 전파 과정에 학습 가능한 전역 리프시츠 제약 조건을 통합하고 새로운 손실 함수를 사용함으로써, 추론 시에 효율적이고 결정적인 강건성 검증이 가능해지며, MNIST, CIFAR-10 및 Tiny-ImageNet에서 이전 방법들보다 뛰어난 속도, 메모리 효율성 및 검증된 정확도를 확보한다.

ABSTRACT

The threat of adversarial examples has motivated work on training certifiably robust neural networks to facilitate efficient verification of local robustness at inference time. We formalize a notion of global robustness, which captures the operational properties of on-line local robustness certification while yielding a natural learning objective for robust training. We show that widely-used architectures can be easily adapted to this objective by incorporating efficient global Lipschitz bounds into the network, yielding certifiably-robust models by construction that achieve state-of-the-art verifiable accuracy. Notably, this approach requires significantly less time and memory than recent certifiable training methods, and leads to negligible costs when certifying points on-line; for example, our evaluation shows that it is possible to train a large robust Tiny-Imagenet model in a matter of hours. Our models effectively leverage inexpensive global Lipschitz bounds for real-time certification, despite prior suggestions that tighter local bounds are needed for good performance; we posit this is possible because our models are specifically trained to achieve tighter global bounds. Namely, we prove that the maximum achievable verifiable accuracy for a given dataset is not improved by using a local bound.

연구 동기 및 목표

신경망을 위한 기존의 검증 가능한 강건성 훈련 방법이 요구하는 높은 계산 비용과 메모리 요구량을 해결한다.
전역 리프시츠 상한이 효과적인 강건성 검증을 위해 너무 느슨하다고 여겨지는 한계를 극복한다.
전역 리프시츠 상한을 보조 수단이 아닌, 강건성을 구조적으로 달성하기 위한 주요 메커니즘으로 활용하는 훈련 프레임워크를 개발한다.
추론 시 실시간으로 저비용의 강건성 검증을 가능하게 하여 표준 전방 전파와 동일한 효율성을 확보한다.
적절히 훈련된 전역 강건성은 로컬 경계보다 더 낫거나 비슷한 성능을 낼 수 있음을 입증한다.

제안 방법

모든 클래스 영역 간의 특징 공간이 적어도 ε 이상 떨어져 있도록 하는 전역 강건성의 개념을 정식화하며, 이는 불확실한 입력에 대해 예측을 회피하도록 요구한다.
전방 전파 과정에 전역 리프시츠 상한을 통합하여 새로운 '강건성 위반' 클래스로 GloRo Nets를 구성한다.
전역 리프시츠 상한이 ε를 초과할 경우 예측에 대해 벌점을 주는 새로운 손실 함수를 사용하여 최적화 과정에서 더 날카운 경계를 유도한다.
전역 리프시츠 상한은 효율적으로 계산 가능하며, 경량이고 미분 가능한 구성 요소로서 네트워크에 통합될 수 있음을 활용한다.
표준 백프로파게이션을 사용해 훈련하며, 모든 비 정답 로짓에 √2εK_G를 추가하는 손실 함수를 적용하여, 먼 경계는 벌점 없이 강건성을 증진시킨다.
전역 상한 계산이 네트워크 아키텍처에 효율적으로 통합되어 있어, 단일 전방 전파만으로 온라인 검증이 가능해진다.

실험 결과

연구 질문

RQ1이전의 가정과는 달리, 더 날카운 국소 경계가 필요하다고 여겨졌지만, 전역 리프시츠 상한을 검증 가능한 강건한 신경망 훈련의 주요 메커니즘으로 효과적으로 사용할 수 있는가?
RQ2전역 리프시츠 제약 조건에 맞춰 훈련하는 것이, 국소 경계나 이중 네트워크에 의존하는 방법보다 더 높은 검증된 강건성 정확도를 달성할 수 있는가?
RQ3최소한의 훈련 및 추론 오버헤드로 전역 강건성을 달성할 수 있으며, 실시간 검증이 실제로 가능할 수 있는가?
RQ4전역 경계와 국소 경계 간의 성능 격차는 본질적인 한계일까, 아니면 적절한 훈련 목표를 통해 극복할 수 있을까?
RQ5랜덤 스무딩과 비교했을 때, 제안된 방법은 검증 속도, 결정성 및 검증된 정확도 측면에서 어떤가?

주요 결과

제안된 GloRo Net 방법은 ε=1.58인 MNIST에서 63%의 검증된 강건성 정확도를 달성하여, 이전 모든 방법보다 수个百分点 높은 성능을 보였다.
이 방법은 더 큰 데이터셋으로도 효과적으로 확장되며, CIFAR-10에서 최신 기준의 검증된 강건성 정확도를 확보했고, 몇 시간 내에 대규모 강건한 Tiny-ImageNet 모델을 훈련시킬 수 있었다.
GloRo Nets 하에서의 검증은 단일 전방 전파만으로 이루어져, 최대 100,000회의 전방 전파가 필요한 랜덤 스무딩보다 훨씬 빠르다.
전역 상한을 사용하고도, 국소 경계를 사용하는 방법과 비슷하거나 더 뛰어난 성능을 달성함으로써, 적절히 훈련된 전역 상한이 본질적으로 제한적이지 않음을 입증했다.
훈련 과정에서 메모리 및 시간 오버헤드가 거의 없으며, 검증 비용이 표준 추론과 거의 동일하여 실시간 배포가 가능하다.
이론적 분석을 통해, 국소 경계를 통해 달성 가능한 모든 강건한 분류는, 전역 리프시츠 상한을 최소화하도록 훈련시킬 경우 전역 상한을 통해도 달성 가능하다는 것을 증명했다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.