Skip to main content
QUICK REVIEW

[논문 리뷰] CSL-YOLO: A New Lightweight Object Detection System for Edge Computing

Yuming Zhang, Chun-Chieh Lee|arXiv (Cornell University)|2021. 07. 10.
Advanced Neural Network Applications참고 문헌 29인용 수 24
한 줄 요약

이 논문은 엣지 컴퓨팅을 위한 경량 객체 검출 시스템인 CSL-YOLO를 제안하며, 표준 컨볼루션을 깊이 분리형 및 포인트 와이즈 연산으로 대체하는 새로운 크로스 스테이지 경량(CSL) 모듈을 사용하여 FLOPs와 파라미터를 줄이면서도 높은 정확도를 유지한다. CSL-모듈은 부가적인 특징을 효율적으로 생성하여 CSL-YOLO가 오직 1470 MFLOPs와 3.2M 파라미터로도 42.8%의 AP50 성능을 달성할 수 있게 하며, Tiny-YOLOv4보다 FLOPs는 58% 줄이고 파라미터는 47% 줄여 더 높은 정확도를 확보한다.

ABSTRACT

The development of lightweight object detectors is essential due to the limited computation resources. To reduce the computation cost, how to generate redundant features plays a significant role. This paper proposes a new lightweight Convolution method Cross-Stage Lightweight (CSL) Module, to generate redundant features from cheap operations. In the intermediate expansion stage, we replaced Pointwise Convolution with Depthwise Convolution to produce candidate features. The proposed CSL-Module can reduce the computation cost significantly. Experiments conducted at MS-COCO show that the proposed CSL-Module can approximate the fitting ability of Convolution-3x3. Finally, we use the module to construct a lightweight detector CSL-YOLO, achieving better detection performance with only 43% FLOPs and 52% parameters than Tiny-YOLOv4.

연구 동기 및 목표

  • 제한된 자원을 가진 엣지 디바이스에서 기존 경량 객체 검출기의 높은 계산 비용 문제를 해결하기 위해.
  • 정확도를 훼손하지 않고 FLOPs와 모델 파라미터를 줄여 실시간 엣지 배포를 위한 추론 효율성을 높이기 위해.
  • 3x3 컨볼루션의 피팅 능력을 크게 낮은 계산량으로 근사할 수 있는 새로운 컨볼루션 모듈을 설계하기 위해.
  • 저 FLOPs와 높은 정확도를 위해 최적화된 전체 검출기 파이프라인—CSL-Bone, CSL-FPN, 및 CSL-YOLO—을 개발하기 위해.
  • 비지수적 바운딩 박스 예측과 적응형 앵커 생성을 포함한 새로운 설계 선택을 통해 AP 성능을 향상시키기 위해.

제안 방법

  • 중간 확장 단계에서 표준 포인트 와이즈 컨볼루션을 깊이 분리형 컨볼루션으로 대체하여 후보 특징을 효율적으로 생성하는 CSL-모듈을 제안한다.
  • 공간적 및 채널별 연산을 분리하는 깊이 분리형 컨볼루션을 사용하여 표준 3x3 컨볼루션 대비 FLOPs를 5–7배 감소시킨다.
  • 전통적인 잔차 블록을 대체하여 더 낮은 계산량을 갖는 스택된 CSL-모듈로 구성된 경량 백본인 CSL-Bone을 설계한다.
  • 고해상도 특징을 최소한의 FLOPs로 유지할 수 있도록 CSL-모듈을 사용하는 특징 피라미드 네트워크 변종인 CSL-FPN을 설계한다.
  • 비지수적 바운딩 박스 예측 헤드를 도입하여 직접적으로 오프셋을 회귀함으로써 $ w = w_{\text{anchor}} + w_{\text{pred}} $ 로 표현함으로써 안정성과 AP를 1–2% 향상시킨다.
  • 특징 맵 스케일과 앵커 크기에 기반한 새로운 앵커 생성 전략을 채택하여 다양한 입력 크기에서 국소화 정확도를 향상시킨다.

실험 결과

연구 질문

  • RQ13x3 컨볼루션의 표현 능력을 유지하면서 FLOPs를 5–7배 감소시킬 수 있는 경량 컨볼루션 모듈을 설계할 수 있는가?
  • RQ2CSL-모듈을 전체 검출기 아키텍처에 효과적으로 통합하여 최소한의 FLOPs와 파라미터로 MS-COCO에서 최신 기술 수준의 성능을 달성할 수 있는가?
  • RQ3바운딩 박스 회귀에서 지수 함수를 직접 오프셋 예측으로 대체하면 정확도와 학습 안정성이 향상되는가?
  • RQ4MS-COCO에서 ImageNet 전학습 없이 처음부터 학습한 모델이 최소한의 모델 크기와 추론 비용으로 경쟁 가능한 AP 점수를 달성할 수 있는가?
  • RQ5제안된 CSL-YOLO는 FLOPs, 파라미터 수, 그리고 AP 메트릭 측면에서 기존의 경량 YOLO 변종보다 어느 정도 뛰어나게 성능을 냈는가?

주요 결과

  • CSL-모듈은 표준 3x3 컨볼루션 대비 FLOPs를 5–7배 감소시키면서도 유사한 피팅 능력을 유지한다.
  • 1470 MFLOPs와 3.2M 파라미터로 416x416 입력 크기에서 CSL-YOLO는 42.8%의 AP50 성능을 달성하며, Tiny-YOLOv4(3450 MFLOPs, 6.1M 파라미터에서 40.2% AP50)를 초월한다.
  • 224x224 입력 크기에서 CSL-YOLO는 425 MFLOPs와 3.2M 파라미터로 16.5%의 AP와 32.2%의 AP50 성능을 기록하며, 정확도와 효율성 측면에서 YOLO-LITE를 모두 뛰어넘는다.
  • 비지수적 예측 방식은 모든 입력 크기에서 AP를 1–2% 향상시키며, 512x512 해상도에서 26.3%의 AP50 성능을 달성한다.
  • CSL-YOLO는 경량 YOLO 검출기 중에서 최신 기술 수준의 성능을 보이며, FLOPs와 파라미터 효율성 측면에서 뛰어난 성능을 보인다.
  • 모델은 ImageNet 전학습 없이 MS-COCO에서 처음부터 학습되었으며, 최소한의 계산 비용으로도 강력한 일반화 능력을 입증하였다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.