QUICK REVIEW

[논문 리뷰] CSL-YOLO: A New Lightweight Object Detection System for Edge Computing

Yuming Zhang, Chun-Chieh Lee|arXiv (Cornell University)|2021. 07. 10.

Advanced Neural Network Applications참고 문헌 29인용 수 24

한 줄 요약

이 논문은 엣지 컴퓨팅을 위한 경량 객체 검출 시스템인 CSL-YOLO를 제안하며, 표준 컨볼루션을 깊이 분리형 및 포인트 와이즈 연산으로 대체하는 새로운 크로스 스테이지 경량(CSL) 모듈을 사용하여 FLOPs와 파라미터를 줄이면서도 높은 정확도를 유지한다. CSL-모듈은 부가적인 특징을 효율적으로 생성하여 CSL-YOLO가 오직 1470 MFLOPs와 3.2M 파라미터로도 42.8%의 AP50 성능을 달성할 수 있게 하며, Tiny-YOLOv4보다 FLOPs는 58% 줄이고 파라미터는 47% 줄여 더 높은 정확도를 확보한다.

ABSTRACT

The development of lightweight object detectors is essential due to the limited computation resources. To reduce the computation cost, how to generate redundant features plays a significant role. This paper proposes a new lightweight Convolution method Cross-Stage Lightweight (CSL) Module, to generate redundant features from cheap operations. In the intermediate expansion stage, we replaced Pointwise Convolution with Depthwise Convolution to produce candidate features. The proposed CSL-Module can reduce the computation cost significantly. Experiments conducted at MS-COCO show that the proposed CSL-Module can approximate the fitting ability of Convolution-3x3. Finally, we use the module to construct a lightweight detector CSL-YOLO, achieving better detection performance with only 43% FLOPs and 52% parameters than Tiny-YOLOv4.

연구 동기 및 목표

제한된 자원을 가진 엣지 디바이스에서 기존 경량 객체 검출기의 높은 계산 비용 문제를 해결하기 위해.
정확도를 훼손하지 않고 FLOPs와 모델 파라미터를 줄여 실시간 엣지 배포를 위한 추론 효율성을 높이기 위해.
3x3 컨볼루션의 피팅 능력을 크게 낮은 계산량으로 근사할 수 있는 새로운 컨볼루션 모듈을 설계하기 위해.
저 FLOPs와 높은 정확도를 위해 최적화된 전체 검출기 파이프라인—CSL-Bone, CSL-FPN, 및 CSL-YOLO—을 개발하기 위해.
비지수적 바운딩 박스 예측과 적응형 앵커 생성을 포함한 새로운 설계 선택을 통해 AP 성능을 향상시키기 위해.

제안 방법

중간 확장 단계에서 표준 포인트 와이즈 컨볼루션을 깊이 분리형 컨볼루션으로 대체하여 후보 특징을 효율적으로 생성하는 CSL-모듈을 제안한다.
공간적 및 채널별 연산을 분리하는 깊이 분리형 컨볼루션을 사용하여 표준 3x3 컨볼루션 대비 FLOPs를 5–7배 감소시킨다.
전통적인 잔차 블록을 대체하여 더 낮은 계산량을 갖는 스택된 CSL-모듈로 구성된 경량 백본인 CSL-Bone을 설계한다.
고해상도 특징을 최소한의 FLOPs로 유지할 수 있도록 CSL-모듈을 사용하는 특징 피라미드 네트워크 변종인 CSL-FPN을 설계한다.
비지수적 바운딩 박스 예측 헤드를 도입하여 직접적으로 오프셋을 회귀함으로써 $ w = w_{\text{anchor}} + w_{\text{pred}} $ 로 표현함으로써 안정성과 AP를 1–2% 향상시킨다.
특징 맵 스케일과 앵커 크기에 기반한 새로운 앵커 생성 전략을 채택하여 다양한 입력 크기에서 국소화 정확도를 향상시킨다.

실험 결과

연구 질문

RQ13x3 컨볼루션의 표현 능력을 유지하면서 FLOPs를 5–7배 감소시킬 수 있는 경량 컨볼루션 모듈을 설계할 수 있는가?
RQ2CSL-모듈을 전체 검출기 아키텍처에 효과적으로 통합하여 최소한의 FLOPs와 파라미터로 MS-COCO에서 최신 기술 수준의 성능을 달성할 수 있는가?
RQ3바운딩 박스 회귀에서 지수 함수를 직접 오프셋 예측으로 대체하면 정확도와 학습 안정성이 향상되는가?
RQ4MS-COCO에서 ImageNet 전학습 없이 처음부터 학습한 모델이 최소한의 모델 크기와 추론 비용으로 경쟁 가능한 AP 점수를 달성할 수 있는가?
RQ5제안된 CSL-YOLO는 FLOPs, 파라미터 수, 그리고 AP 메트릭 측면에서 기존의 경량 YOLO 변종보다 어느 정도 뛰어나게 성능을 냈는가?

주요 결과

CSL-모듈은 표준 3x3 컨볼루션 대비 FLOPs를 5–7배 감소시키면서도 유사한 피팅 능력을 유지한다.
1470 MFLOPs와 3.2M 파라미터로 416x416 입력 크기에서 CSL-YOLO는 42.8%의 AP50 성능을 달성하며, Tiny-YOLOv4(3450 MFLOPs, 6.1M 파라미터에서 40.2% AP50)를 초월한다.
224x224 입력 크기에서 CSL-YOLO는 425 MFLOPs와 3.2M 파라미터로 16.5%의 AP와 32.2%의 AP50 성능을 기록하며, 정확도와 효율성 측면에서 YOLO-LITE를 모두 뛰어넘는다.
비지수적 예측 방식은 모든 입력 크기에서 AP를 1–2% 향상시키며, 512x512 해상도에서 26.3%의 AP50 성능을 달성한다.
CSL-YOLO는 경량 YOLO 검출기 중에서 최신 기술 수준의 성능을 보이며, FLOPs와 파라미터 효율성 측면에서 뛰어난 성능을 보인다.
모델은 ImageNet 전학습 없이 MS-COCO에서 처음부터 학습되었으며, 최소한의 계산 비용으로도 강력한 일반화 능력을 입증하였다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.