QUICK REVIEW

[논문 리뷰] Rethinking deep active learning: Using unlabeled data at model training

Oriane Siméoni, Mateusz Budnik|arXiv (Cornell University)|2019. 11. 19.

Machine Learning and Algorithms참고 문헌 37인용 수 19

한 줄 요약

이 논문은 매번 활성 학습 루프에서 비지도 사전 훈련과 준지도 학습을 조합하여 라벨이 지정된 데이터와 라벨이 지정되지 않은 데이터를 모두 활용하는 새로운 딥 활성 학습 프레임워크를 제안한다. 이 방법은 표준 기준 대비 최대 15%의 정확도 향상을 이끌어내며, 이는 전통적인 샘플링 전략의 성능 차이를 뛰어넘고, 클래스당 하나의 라벨만으로도 거의 지도 학습 성능에 도달할 수 있도록 한다.

ABSTRACT

Active learning typically focuses on training a model on few labeled examples alone, while unlabeled ones are only used for acquisition. In this work we depart from this setting by using both labeled and unlabeled data during model training across active learning cycles. We do so by using unsupervised feature learning at the beginning of the active learning pipeline and semi-supervised learning at every active learning cycle, on all available data. The former has not been investigated before in active learning, while the study of latter in the context of deep learning is scarce and recent findings are not conclusive with respect to its benefit. Our idea is orthogonal to acquisition strategies by using more data, much like ensemble methods use more models. By systematically evaluating on a number of popular acquisition strategies and datasets, we find that the use of unlabeled data during model training brings a surprising accuracy improvement in image classification, compared to the differences between acquisition strategies. We thus explore smaller label budgets, even one label per class.

연구 동기 및 목표

라벨이 지정되지 않은 데이터를 샘플링 이외의 목적, 즉 훈련 중에 활용함으로써 딥 활성 학습에서의 정확도에 미치는 영향을 조사한다.
낮은 라벨 예산에서 비지도 사전 훈련과 준지도 학습이 모델 정확도를 크게 향상시킬 수 있는지 평가한다.
라벨이 지정되지 않은 데이터를 활용함으로써 얻는 성능 향상이 기존의 전통적 샘플링 전략 간의 성능 차이를 초월하는지 확인한다.
이미지 분류에서 극단적인 라벨 예산, 예를 들어 클래스당 하나의 라벨이 가능한지 탐색한다.

제안 방법

모델 가중치 초기화를 위해 파ip라인 시작 시 전체 데이터에 대해 비지도 특징 학습(자기지도 사전 훈련)을 한 번 수행한다.
모든 활성 학습 루프에서 준지도 학습을 사용하여, 라벨이 지정된 데이터와 라벨이 지정되지 않은 데이터를 모두 활용해 훈련한다. 이는 레이블 전파 기반 방법을 사용한다.
사전 훈련과 준지도 학습을 통합한 단일 훈련 파이프라인을 구축하여, 라벨이 지정된 데이터만을 대상으로 하는 표준 지도 학습을 대체한다.
불확실성 샘플링, 코어셋 선택, 그리고 새로운 다양체 기반 방법(jLP)을 포함한 여러 샘플링 전략을 사용하여 유연성과 타당성을 평가한다.
비교 가능성과 사전 훈련 및 준지도 학습의 영향을 분리하기 위해 단순하고 모듈러한 파이프라인을 구현한다.
SVHN, CIFAR-10, CIFAR-100, MNIST 등 여러 데이터셋과 라벨 예산(클래스당 하나의 라벨 포함)에서 성능을 평가한다.

실험 결과

연구 질문

RQ1표준 방법과 비교해 훈련 중에 라벨이 지정되지 않은 데이터를 활용함으로써 딥 활성 학습에서 분류 정확도가 크게 향상되는가?
RQ2비지도 사전 훈련과 준지도 학습이 함께 작용할 경우, 샘플링 전략 간의 성능 차이를 뛰어넘는 성능 향상을 이끌 수 있는가?
RQ3라벨이 지정되지 않은 데이터를 훈련에 활용할 경우, 무작위 샘플링 전략과 활성 학습 전략 간의 성능 비교는 어떻게 되는가?
RQ4사전 훈련과 준지도 학습을 결합할 때 클래스당 하나의 라벨만을 사용하는 경우의 영향은 무엇인가?
RQ5성능 향상의 원인이 다양체의 구조 모델링 때문인지, 단지 라벨이 지정되지 않은 데이터를 훈련에 활용하기 때문인가?

주요 결과

준지도 학습을 통해 라벨이 지정된 데이터와 라벨이 지정되지 않은 데이터를 모두 활용함으로써, CIFAR-10에서 라벨 100개씩의 예산으로 표준 기준 대비 최대 15%의 정확도 향상을 달성한다.
CIFAR-10에서 라벨 100개씩의 예산으로, PRE + SEMI 방법은 표준 기준이 네 번의 루프를 거쳐 달성하는 성능을 한 번의 루프로 달성하여 라벨링 비용을 극적으로 감소시킨다.
MNIST에서 클래스당 하나의 라벨만을 사용할 경우, 무작위 샘플링 전략과 함께 PRE + SEMI를 사용하면 두 번의 루프 후 90.89%의 정확도를 달성하며, SEMI를 적용하지 않은 모든 전략보다 40% 높은 성능을 보인다.
준지도 학습의 성능 향상은 매우 크기 때문에, 모든 평가된 샘플링 전략 간의 성능 차이를 뛰어넘는다.
비지도 사전 훈련은 초기 훈련 루프에서 가장 큰 이점을 제공하며, 모델 정확도가 향상될수록 수익 감소 효과가 나타난다.
이 연구는 훈련 중에 라벨이 지정되지 않은 데이터를 활용하는 것이 샘플링 전략의 선택보다 더 큰 영향을 미치며, 특히 저데이터 환경에서 그러하다는 것을 보여준다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.