Skip to main content
QUICK REVIEW

[논문 리뷰] Understanding and Mitigating the Tradeoff Between Robustness and Accuracy

Aditi Raghunathan, Sang Michael Xie|arXiv (Cornell University)|2020. 02. 25.
Adversarial Robustness in Machine Learning인용 수 67
한 줄 요약

이 논문은 적대적 학습이 표준 오차를 높일 수 있는 이유를 분석하고, 선형 회귀에서 이 트레이드오프를 특징짓고, 표준 오차를 해치지 않으면서 강건한 오차를 개선하기 위한 강건 자기학습(RST)을 제안하며, CIFAR-10에서 실증적 이득을 보인다.

ABSTRACT

Adversarial training augments the training set with perturbations to improve the robust error (over worst-case perturbations), but it often leads to an increase in the standard error (on unperturbed test inputs). Previous explanations for this tradeoff rely on the assumption that no predictor in the hypothesis class has low standard and robust error. In this work, we precisely characterize the effect of augmentation on the standard error in linear regression when the optimal linear predictor has zero standard and robust error. In particular, we show that the standard error could increase even when the augmented perturbations have noiseless observations from the optimal linear predictor. We then prove that the recently proposed robust self-training (RST) estimator improves robust error without sacrificing standard error for noiseless linear regression. Empirically, for neural networks, we find that RST with different adversarial training methods improves both standard and robust error for random and adversarial rotations and adversarial $\\ell_\\infty$ perturbations in CIFAR-10.

연구 동기 및 목표

  • 적대적 학습에서 강건성-정확도 트레이드오프의 연구를 촉진한다.
  • 일관된 섭동으로의 증강이 선형 회귀에서 표준 오차에 미치는 영향을 특징짓는다.
  • 트레이드오프를 완화하기 위해 강건 자기학습(RST)을 도입한다.
  • RST가 선형 모델에서 트레이드오프를 제거하는 시기적 결과를 이론적으로 보인다.
  • LSTM이 아닌 CIFAR-10에서 라벨 없는 데이터와 섭동 유형에 따라 RST를 실험적으로 평가한다.

제안 방법

  • 선형 회귀에서 제곱 오차를 사용해 표준 오차와 강건 오차를 모델링한다.
  • 표준 및 증강 데이터를 가진 최소 노름 삽입자(최소 노름 보간자)로 확장 추정기를 정의한다.
  • 표준 오차 차이를 L_std(theta_std)−L_std(theta_aug)=v^T Sigma v + 2 w^T Sigma v로 주는 정리 1을 도출한다.
  • 증강이 표준 오차를 증가시키지 않는 충분 조건(예: Sigma = I, 또는 증강 데이터가 공간을 포괄하는 경우)을 제시하는 케로리 1을 보인다.
  • 강건 자기학습(RST)을 도입하고 선형 회귀에 특화하여 L_std(hat{theta_rst}) ≤ L_std(theta_int-std) 및 L_rob(hat{theta_rst}) = L_std(hat{theta_rst})를 증명한다.
  • 실용적 알고리즘적 접근과 RST를 Sigma 유도 정규화와 연결한다.

실험 결과

연구 질문

  • RQ1일관된 섭동으로 학습 데이터를 증강하는 것이 표준 오차를 증가시키거나 감소시키는 조건은 무엇인가?
  • RQ2강건한 학습이 선형 모델에서 표준 오차를 증가시키지 않으면서 강건한 오차를 개선할 수 있는가?
  • RQ3강건 자기학습(RST)이 표준 및 강건 오차 사이의 트레이드오프를 제거하는가, 그리고 신경망에서 이를 실험적으로 어떻게 수행하는가?
  • RQ4라벨 없는 데이터와 섭동 유형이 실제로 강건성과 정확도에 어떤 영향을 미치는가?

주요 결과

MethodRobust Test Acc.Standard Test Acc.
표준 학습0.8%95.2%
PG-AT (Madry et al., 2018)45.8%87.3%
TRADES (Zhang et al., 2019)55.4%84.0%
표준 자기 학습0.3%96.4%
강건 일관성 학습 (Carmon et al., 2019)56.5%83.2%
RST + PG-AT (본 논문)58.5%91.8%
RST + TRADES (본 논문)63.1%89.7%
  • 증강된 최소 노름 추정기는 데이터 기하학성과 과매개변화로 인해 표준 추정기보다 표준 오차가 더 클 수 있다.
  • 표준 오차의 차이는 L_std(hat{theta_std})−L_std(hat{theta_aug}) = v^T Sigma v + 2 w^T Sigma v로 포착되며, v와 w는 투영 연산자와 진짜 파라미터 theta*에 의존한다.
  • 케로리 1은 Sigma = I이거나 증강 데이터가 공간을 포괄하는 등의 안전한 증강 조건을 제공하여 표준 오차가 증가하지 않음을 보인다.
  • RST는 증강 추정기를 표준 추정기로 방향으로 규제하여 선형 회귀에서 트레이드오프를 제거하고 표준 오차를 증가시키지 않으면서 강건 오차를 낮춘다.
  • CIFAR-10에서 RST는 섭동(무작위/적대적 회전 및 L-infinity) 전반에서 강건 오차와 표준 오차를 모두 개선하며, 소량의 라벨 데이터에서 특히 큰 이득이 나타난다.
  • vanilla 적대적 학습과 비교하여, RST가 PG-AT 또는 TRADES와 결합될 때 반지도학습 반정의에서 더 높은 강건 시험 정확도와 표준 시험 정확도를 달성한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.