QUICK REVIEW

[논문 리뷰] Beyond Perturbations: Learning Guarantees with Arbitrary Adversarial Test Examples

Shafi Goldwasser, Adam Tauman Kalai|arXiv (Cornell University)|2020. 07. 10.

Machine Learning and Algorithms인용 수 4

한 줄 요약

이 논문은 임의의 공격자에 의해 선택된 테스트 예제에 대해 선택적 분류기의 일반화 보장을 보장하는 전환 학습 알고리즘을 제안한다. 유계 VC 차원을 가진 클래스 C에 대해 경험적 리스크 최소화기(ERM)를 활용함으로써, 테스트 데이터가 무한한 백박스 공격자에 의해 선택되더라도 낮은 테스트 오차와 낮은 기각률을 보장한다. 이는 편차 기반 가정을 초월하여 이러한 설정에 대해 처음으로 비어 있지 않은 보장을 제공한다.

ABSTRACT

We present a transductive learning algorithm that takes as input training examples from a distribution P and arbitrary (unlabeled) test examples, possibly chosen by an adversary. This is unlike prior work that assumes that test examples are small perturbations of P. Our algorithm outputs a selective classifier, which abstains from predicting on some examples. By considering selective transductive learning, we give the first nontrivial guarantees for learning classes of bounded VC dimension with arbitrary train and test distributions—no prior guarantees were known even for simple classes of functions such as intervals on the line. In particular, for any function in a class C of bounded VC dimension, we guarantee a low test error rate and a low rejection rate with respect to P. Our algorithm is efficient given an Empirical Risk Minimizer (ERM) for C. Our guarantees hold even for test examples chosen by an unbounded white-box adversary. We also give guarantees for generalization, agnostic, and unsupervised settings.

연구 동기 및 목표

학습 데이터에 대한 작은 변형이 아닌 테스트 예제에 대해 머신 러닝에서 일반화 보장이 부족한 문제를 해결한다.
표준 편차 가정을 초월하여, 임의의 가능성이 있는 공격적 테스트 분포에 대해 학습의 이론적 보장을 제공한다.
불확실한 예제에서 예측을 기각하는 선택적 분류기를 출력하는 효율적인 알고리즘을 개발한다. 이를 통해 낮은 오차율과 기각률을 확보한다.
공격자에 의해 선택된 테스트 데이터 하에서 아그노스틱, 비지도, 일반화 설정으로 보장을 확장한다.
직선 상의 간격과 같은 단순한 함수 클래스에 대해 임의의 테스트 분포 하에서 처음으로 비어 있지 않은 오차율과 기각률의 경계를 제시함으로써 문헌의 핵심 격차를 메운다.

제안 방법

학습 데이터가 분포 P를 따르는 전환 학습 프레임워크를 정의하며, 테스트 예제는 임의의, 가능하면 공격적으로 선택될 수 있다.
불확실한 것으로 간주되는 예제에서는 예측을 기각하는 선택적 분류기를 설계함으로써, 공격적 입력 하에서의 위험을 줄인다.
분류기를 효율적으로 훈련하기 위해 클래스 C에 대한 경험적 리스크 최소화기(ERM)를 핵심 서브루틴으로 사용한다.
클래스 C의 유계 VC 차원을 활용하여, 테스트 예제가 공격적일 경우에도 유효한 일반화 경계를 도출한다.
전환 추론을 적용하여, 학습 분포 P에 대해 동시에 테스트 오차와 기각률을 경계한다.
테스트 입력이 백박스 공격자에 의해 제어되더라도 보장을 증명함으로써 강건성을 확보하며, 편차의 크기를 제한하지 않는다.

실험 결과

연구 질문

RQ1표준적인 작은 편차 가정을 초월하여, 임의의 공격적으로 선택된 테스트 예제에 대해 일반화 보장을 제공할 수 있는가?
RQ2선택적 학습 설정에서 낮은 오차율과 낮은 기각률을 보장할 수 있는 최소한의 테스트 데이터 가정은 무엇인가?
RQ3테스트 데이터가 공격적일 경우 아그노스틱 및 비지도 학습 시나리오로 일반화 경계를 확장할 수 있는가?
RQ4임의의 테스트 분포 하에서 직선 상의 간격과 같은 단순한 함수 클래스에 대해 비어 있지 않은 오차율과 기각률 보장을 달성할 수 있는가?
RQ5무한한 공격자가 테스트 예제를 선택하더라도 강력한 이론적 보장을 유지하는 효율적인 알고리즘을 어떻게 설계할 수 있는가?

주요 결과

제안된 알고리즘은 테스트 예제가 임의이거나 무한한 백박스 공격자에 의해 선택되더라도, 유계 VC 차원을 가진 클래스에 대해 처음으로 비어 있지 않은 일반화 보장을 제공한다.
유계 VC 차원을 가진 클래스 C에 속하는 임의의 함수에 대해, 알고리즘은 학습 분포 P에 대해 낮은 테스트 오차율과 낮은 기각률을 보장한다.
클래스 C에 대한 경험적 리스크 최소화기(ERM)가 확보되어 있다면, 알고리즘이 효율적이다.
보장은 아그노스틱, 비지도, 표준 일반화 설정 모두에 적용되며, 공격적 테스트 데이터 하에서 이론적 학습의 범위를 확장한다.
테스트 예제가 학습 데이터의 편차가 아닐 경우에도 증명 가능한 성능 경계를 달성함으로써, 이전 연구의 핵심 한계를 해결한다.
특히 선택적 분류를 위한 강건한 학습 기반을 마련함으로써, 공격적 테스트 시간 조건 하에서의 학습에 있어 기초적인 단계를 확립한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.