[논문 리뷰] Reduction of Class Activation Uncertainty with Background Information
이 논문은 일반화 향상과 클래스 활성화 불확실성 감소를 위해 배경 클래스를 도입하여 다수의 데이터셋에서 다중 작업 학습보다 더 낮은 계산으로 경쟁력 있거나 최첨단(SOTA) 성과를 달성한다.
Multitask learning is a popular approach to training high-performing neural networks with improved generalization. In this paper, we propose a background class to achieve improved generalization at a lower computation compared to multitask learning to help researchers and organizations with limited computation power. We also present a methodology for selecting background images and discuss potential future improvements. We apply our approach to several datasets and achieve improved generalization with much lower computation. Through the class activation mappings (CAMs) of the trained models, we observed the tendency towards looking at a bigger picture with the proposed model training methodology. Applying the vision transformer with the proposed background class, we receive state-of-the-art (SOTA) performance on CIFAR-10C, Caltech-101, and CINIC-10 datasets. Example scripts are available in the `CAM' folder of the following GitHub Repository: github.com/dipuk0506/UQ
연구 동기 및 목표
- 최종 클래스 점수에서 배경 노이즈에 대한 의존도를 줄이는 일반화 개선을 동기부여한다.
- 헤드 계층 일반화를 개선하기 위한 가벼운 다중 작업 학습 대안으로 배경 클래스를 제안한다.
- 배경 클래스 학습이 다중 작업 학습보다 더 낮은 계산 비용으로 모델 성능을 향상시킨다는 것을 보인다.
- 전이 학습과 트랜스포머와의 통합을 위한 배경 클래스 구성 가이드라인을 제공한다.
제안 방법
- 최종 분류 헤드에 배경 클래스를 추가하여 출력 공간을 하나 확장한다.
- 초기 계층을 일반화 상태로 유지하고 추가 배경 클래스로 헤드를 업데이트하는 전이 학습으로 학습한다.
- 대상 클래스 콘텐츠가 없는 공개 가능한 데이터 세트에서 배경 클래스를 생성하고 다양한 질감과 단색 옵션을 보장한다.
- CAM 기반 분석을 사용하여 보다 넓은 특징 활용과 배경으로 인한 오분류에 대한 민감도 감소를 촉진하는 데 동기를 부여한다.
- 전이 학습, 다중 작업 학습, 제안된 배경 접근법을 사용하여 여러 데이터 세트(STL-10, Oxford-102, CUB-200-2011, FGVC Aircraft, KMNIST, EMNIST, CINIC-10, Caltech-101)를 평가한다.
- 배경 학습의 이점을 평가하기 위해 ViT-L/16과 Spinal FC 같은 변형을 포함한 트랜스포머 아키텍처를 실험한다.
실험 결과
연구 질문
- RQ1훈련 중 배경 클래스를 추가하는 것이 일반화를 개선하고 다양한 데이터셋에서 클래스 활성 맵(CAM)을 안정화시키는가?
- RQ2배경 클래스 접근법이 정확도와 계산 효율성 면에서 전이 학습 및 다중 작업 학습과 어떻게 비교되는가?
- RQ3강건한 헤드 계층 학습을 위한 배경 클래스 구성(크기, 내용, 다양성)을 최적화하는 지침은 무엇인가?
주요 결과
| 데이터세트 | 모델 | # Epoch | Transfer Learn. | Multitask Learn. | 제안된 |
|---|---|---|---|---|---|
| STL-10 | WideResNet-101 | 20 | 98.40 ± 0.19 | 98.42 ± 0.14 | 98.58 ± 0.08 |
| Oxford-102 | WideResNet-101 | 20 | 98.78 ± 0.21 | 99.03 ± 0.19 | 98.93 ± 0.16 |
| CUB-200-2011 | Inception-v4 | 20 | 83.26 ± 2.36 | 84.93 ± 1.91 | 83.97 ± 1.74 |
| FGVC Aircraft | Inception-v4 | 20 | 86.30 ± 1.20 | 85.12 ± 1.60 | 85.91 ± 1.20 |
| KMNIST | ResNet-18 | 15 | 98.14 ± 0.21 | 98.41 ± 0.15 | 98.60 ± 0.12 |
| EMNIST-Balanced | ResNet-18 | 15 | 88.91 ± 1.25 | 89.24 ± 1.42 | 90.04 ± 1.08 |
- 배경 클래스 학습은 표준 전이 학습보다 더 높은 정확도를 제공하고 종종 다중 작업 학습을 약간 능가하면서도 학습 시간을 크게 줄인다.
- 배경 클래스를 갖춘 트랜스포머 기반 모델은 보고된 실험에서 여러 데이터셋(STL-10, CINIC-10 등)에서 SOTA와 유사한 성과를 달성한다.
- 배경 데이터를 포함하면 헤드 계층이 더 넓은 공간 영역에서 특징을 일반화하도록 도와 배경 인공물에 대한 의존성을 줄인다.
- 이 접근법은 공개적으로 이용 가능한 데이터 세트를 사용하여 배경 클래스를 구성하며 초기 레이어 동결을 필요로 하지 않아 엔드 투 엔드 학습을 가능하게 한다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.