Skip to main content
QUICK REVIEW

[논문 리뷰] Efficient Teacher: Semi-Supervised Object Detection for YOLOv5

Bowen Xu, Mingtao Chen|ArXiv.org|2023. 02. 15.
Advanced Neural Network Applications인용 수 30
한 줄 요약

Efficient Teacher는 Dense Detector 기반의 Baseline을 소개하며 Pseudo Label Assigner와 Epoch Adaptor로 YOLOv5와 같은 원-stage 앵커 기반 탐지기에 대해 확장 가능한 고성능 반지도 학습 객체 탐지를 가능하게 합니다.

ABSTRACT

Semi-Supervised Object Detection (SSOD) has been successful in improving the performance of both R-CNN series and anchor-free detectors. However, one-stage anchor-based detectors lack the structure to generate high-quality or flexible pseudo labels, leading to serious inconsistency problems in SSOD. In this paper, we propose the Efficient Teacher framework for scalable and effective one-stage anchor-based SSOD training, consisting of Dense Detector, Pseudo Label Assigner, and Epoch Adaptor. Dense Detector is a baseline model that extends RetinaNet with dense sampling techniques inspired by YOLOv5. The Efficient Teacher framework introduces a novel pseudo label assignment mechanism, named Pseudo Label Assigner, which makes more refined use of pseudo labels from Dense Detector. Epoch Adaptor is a method that enables a stable and efficient end-to-end semi-supervised training schedule for Dense Detector. The Pseudo Label Assigner prevents the occurrence of bias caused by a large number of low-quality pseudo labels that may interfere with the Dense Detector during the student-teacher mutual learning mechanism, and the Epoch Adaptor utilizes domain and distribution adaptation to allow Dense Detector to learn globally distributed consistent features, making the training independent of the proportion of labeled data. Our experiments show that the Efficient Teacher framework achieves state-of-the-art results on VOC, COCO-standard, and COCO-additional using fewer FLOPs than previous methods. To the best of our knowledge, this is the first attempt to apply Semi-Supervised Object Detection to YOLOv5.Code is available: https://github.com/AlibabaResearch/efficientteacher

연구 동기 및 목표

  • 1) 원-stage 앵커 기반 탐지기에 대한 SSOD의 동기 부여 및 의사 레이블 불일치 해결.
  • 2) Dense Detector를 제안하여 dense 입력으로 YOLOv5와 RetinaNet의 성능 차이를 메우고자 합니다.
  • 3) Pseudo Label Assigner를 도입하여 의사 레이블을 신뢰 가능한 것과 불확실한 것으로 나누고 소프트 손실을 적용합니다.
  • 4) 도메인 및 분포 적응을 통해 엔드투엔드 SSOD 학습의 효율성을 높이는 Epoch Adaptor를 개발합니다.
  • 5) VOC, COCO-standard 및 COCO-additional에서 FLOPs를 줄인 상태로 최첨단 결과를 보여줍니다.

제안 방법

  • Dense Detector를 RetinaNet을 확장하고 YOLOv5에서 영감을 얻은 dense 샘플링 및 객체성 분기를 도입하여 생성합니다.
  • 의사 레이블 Assigner를 개발하여 높은/낮은 임계값으로 신뢰 가능한 것과 불확실한 것을 분류하고 불확실한 레이블에는 소프트 로스를 적용합니다.
  • SSOD 손실을 L = Ls + λLu로 정의하고 Ls는 표본이 있는 데이터에서, Lu는 클래스, 박스 및 객체성 항목을 사용하여 unlabeled 데이터에 대해 계산합니다.
  • Lu에서 신뢰할 수 없는 의사 레이블을 완화하기 위해 의사 레이블 점수 및 객체성에 기반한 선택적 손실을 적용합니다.
  • 도메인 적응(Gradient Reversal Layer를 통한) 및 분포 적응을 결합한 Epoch Adaptor를 도입하여 에포크별로 의사 레이블 임계값을 동적으로 설정합니다.
  • 에포크마다 클래스 분포를 기반으로 한 분포 적응 임계값 τ1^k, τ2^k를 활용하여 레이블링된 데이터와 비레이블링된 데이터의 균형을 맞춥니다.

실험 결과

연구 질문

  • RQ1SSOD에서 원-stage 앵커 기반 탐지기에 대한 의사 레이블 할당을 어떻게 개선할 수 있을까?
  • RQ2 Dense Detector가 전통적 RetinaNet 기반 대비 의사 레이블 품질과 SSOD 성능을 향상시킬 수 있는가?
  • RQ3에포크 단위의 적응 전략이 비레이블 데이터가 있는 SSOD의 학습 안정성과 효율성을 개선하는가?
  • RQ4Efficient Teacher가 기존의 SSOD 방법들과 비교하여 VOC, COCO-standard, COCO-additional에서 어떤 이득을 주는가?

주요 결과

  • Efficient Teacher는 이전 방법들보다 더 적은 FLOPs로 VOC, COCO-standard, COCO-additional에서 최첨단 결과를 달성합니다.
  • Dense Detector는 RetinaNet 대비 AP50:95에서 5.36 포인트의 향상을 제공하고 추론 FLOPs를 약 30% 감소시킵니다.
  • 의사 레이블 Assigner는 신뢰 가능한 레이블과 불확실한 레이블을 구분하고 후자의 경우 소프트 로스를 적용하여 SSOD를 크게 향상시킵니다.
  • Epoch Adaptor는 도메인 및 분포 적응으로 학습 속도를 높이고 학습의 안정성을 강화하여 적은 반복으로 더 나은 성능을 달성합니다.
  • 백본을 YOLOv5l으로 교체하고 Efficient Teacher 하에서 학습하면 최종 탐지 성능이 향상되며 계산 오버헤드가 감소합니다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.