QUICK REVIEW

[논문 리뷰] YOLOv6 v3.0: A Full-Scale Reloading

Chuyi Li, Lulu Li|arXiv (Cornell University)|2023. 01. 13.

Advanced Neural Network Applications인용 수 192

한 줄 요약

YOLOv6 v3.0은 BiC 기반 neck, anchor-aided training, self-distillation, 확장된 백본/목을 통해 네트워크 및 학습 전략을 개편하여 N6/S6/M6/L6 변형을 포함한 여러 스케일에서 실시간 정확도에서 최첨단 성능을 달성합니다.

ABSTRACT

The YOLO community has been in high spirits since our first two releases! By the advent of Chinese New Year 2023, which sees the Year of the Rabbit, we refurnish YOLOv6 with numerous novel enhancements on the network architecture and the training scheme. This release is identified as YOLOv6 v3.0. For a glimpse of performance, our YOLOv6-N hits 37.5% AP on the COCO dataset at a throughput of 1187 FPS tested with an NVIDIA Tesla T4 GPU. YOLOv6-S strikes 45.0% AP at 484 FPS, outperforming other mainstream detectors at the same scale (YOLOv5-S, YOLOv8-S, YOLOX-S and PPYOLOE-S). Whereas, YOLOv6-M/L also achieve better accuracy performance (50.0%/52.8% respectively) than other detectors at a similar inference speed. Additionally, with an extended backbone and neck design, our YOLOv6-L6 achieves the state-of-the-art accuracy in real-time. Extensive experiments are carefully conducted to validate the effectiveness of each improving component. Our code is made available at https://github.com/meituan/YOLOv6.

연구 동기 및 목표

실시간 물체 탐지 성능을 개선하기 위한 아키텍처 및 학습 개선으로 YOLOv6를 갱신하고 강화한다.
작은 모델에서부터 큰 모델에 이르기까지 추론 속도를 유지하거나 개선하면서 더 높은 정확도를 달성한다.
추론 지연에 영향을 주지 않는 학습 시 보조 기능으로 통합된 프레임워크를 제공한다.
광범위한 제거 실험 및 YOLOv5/YOLOv7/YOLOv8 및 동료들과의 비교를 통해 개선점을 검증한다.

제안 방법

향상된 neck(BiC 모듈)를 설계하여 세 인접 계층의 특징을 융합해 위치 신호를 개선한다.
SppF 블록을 대체하거나 간소화하면서 표현력을 유지하는 SimCSPSPPF를 도입한다.
학습 중 앵커 기반 보조 가지를 활용하는 앵커-보조 학습(AAT)을 채택하여 학습에서 앵커 기반과 앵커 프리의 이점을 결합하고 추론 시 보조 분기는 제거한다.
소형 모델의 속도를 저하시키지 않고 성능을 향상시키기 위해 Decoupled Localization Distillation를 포함한 자체 증류를 적용한다.
정확도를 높이기 위해 백본과 neck를 추가 스테이지(C6 특징)와 더 높은 입력 해상도로 확장한다.
FP16 TensorRT를 Tesla T4에서 사용하여 AP, FPS, 지연, 및 YOLOv5/YOLOX/PPYOLOE/YOLOv7/YOLOv8과의 비교를 보고한다.

실험 결과

연구 질문

RQ1아키텍처 변경(BiC neck, SimCSPSPPF)이 위치화 및 작은 물체 정확도에 어떤 영향을 미치는가?
RQ2학습 중의 앵커 기반 보조 분기가 추론 속도에 영향을 주지 않으면서 탐지 성능을 개선하는가?
RQ3self-distillation 및 전용 무거운 회귀 분기가 소형 모델의 성능을 throughput 손실 없이 향상시키는가?
RQ4최상위 스테이지(C6) 추가 및 더 높은 입력 해상도가 COCO AP를 실시간 속도에서 어떻게 바꾼는가?

주요 결과

YOLOv6-N/S/M/L은 동일한 규모에서 YOLOv5/YOLOv7/PPYOLOE/YOLov8과 비교해 경쟁적이거나 더 우수한 속도로 더 높은 AP를 달성한다.
더 높은 입력 해상도(640→1280)와 C6 기능을 추가한 확장된 YOLOv6-N6/S6/M6/L6은 실시간 탐지기에서 최첨단 정확도를 달성한다.
BiC는 위치화 신호 및 작은 물체 AP를 거의 비용 증가 없이 개선하며, 특히 소형 모델에서 효과가 크다.
앵커-보조 학습(AAT)은 모든 스케일에서 추가 AP를 제공하며 특히 작은 물체의 AP를 향상시킨다.
자체 증류를 포함한 Decoupled Localization Distillation 전략은 소형 모델에서 추론 속도를 늦추지 않으면서 AP를 향상시킨다.
최신 기술과 비교했을 때 YOLOv6-L6은 YOLOv7-E6E보다 AP가 0.4% 포인트 높고 bs=1에서 63% 더 빠르게 실행된다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.