[논문 리뷰] YOLO-LITE: A Real-Time Object Detection Algorithm Optimized for Non-GPU Computers
YOLO-LITE는 YOLOv2에서 영감을 받아 GPU가 아닌 장치에서 실행되도록 설계된 경량 실시간 객체 탐지기로, GPU가 아닌 하드웨어에서 21 FPS를 달성하고 VOC mAP는 33.77%, COCO mAP는 12.26%입니다.
This paper focuses on YOLO-LITE, a real-time object detection model developed to run on portable devices such as a laptop or cellphone lacking a Graphics Processing Unit (GPU). The model was first trained on the PASCAL VOC dataset then on the COCO dataset, achieving a mAP of 33.81% and 12.26% respectively. YOLO-LITE runs at about 21 FPS on a non-GPU computer and 10 FPS after implemented onto a website with only 7 layers and 482 million FLOPS. This speed is 3.8x faster than the fastest state of art model, SSD MobilenetvI. Based on the original object detection algorithm YOLOV2, YOLO- LITE was designed to create a smaller, faster, and more efficient model increasing the accessibility of real-time object detection to a variety of devices.
연구 동기 및 목표
- GPU가 아닌 장치에서 실시간 객체 탐지를 지원할 수 있음을 증명한다.
- 얕은 탐지 네트워크에서 배치 정규화의 필요성을 조사한다.
- VOC/COCO 데이터셋에서 사용 가능한 정확도를 유지하는 YOLOv2를 기반으로 더 작고 빠른 변형을 개발한다.
- 경량 탐지기에 대한 입력 해상도, 네트워크 심층도 및 속도(FPS) 간의 균형을 평가한다.
- 모바일 접속이 가능한 웹 배포 가능한 모델 버전을 제공한다.
제안 방법
- Tiny-YOLOv2에서 시작하여 최종 예측 계층은 Tiny-YOLOv2의 계층을 유지한 채로 계층을 제거/추가하며 반복한다.
- PASCAL VOC 2007+2012(20개 클래스)에서 학습한 뒤 COCO 2014(80개 클래스)에서 미세 조정한다.
- GPU가 아닌 하드웨어에서의 속도(FPS)와 정확도(mAP)를 평가하고 Tiny-YOLOv2 및 SSD Mobilenet V1과 비교한다.
- 성능에 대한 입력 이미지 크기 및 배치 정규화의 영향을 탐구한다.
- 아키텍처 차이와 FLOPS를 문서화하여 효율성 향상을 강조한다(예: 최고의 YOLO-LITE 실험에 대해 482M FLOPS).
- 훈련된 모델의 웹 배포를 통해 모바일 기기에서의 접근성을 입증한다.

실험 결과
연구 질문
- RQ1GPU가 아닌 장치에서 실시간으로 실행될 만큼 작고 빠르게 만들 수 있는 YOLO 기반 탐지기가 가능합니까(≈10–21 FPS)?
- RQ2네트워크 깊이/너비를 줄이고 배치 정규화를 제거하는 것이 mAP와 FPS에 미치는 영향은 무엇입니까?
- RQ3YOLO-LITE가 VOC/COCO에서 속도와 정확도 측면에서 기존의 빠른 탐지기(Tiny-YOLOv2, SSD Mobilenet V1)와 비교하여 어떠합니까?
- RQ4속도를 목표로 한 얕은 네트워크에 배치 정규화가 필요한가요, 그리고 학습 안정성과 추론 시간에 미치는 영향은 무엇입니까?
- RQ5경량 탐지기의 입력 해상도, FLOPS 및 mAP 간의 균형은 무엇인가요?
주요 결과
- 최고의 VOC 결과: 21 FPS에서 33.77%의 mAP(배치 정규화 없음) on VOC.
- 최고의 VOC 학습 모델에 대한 COCO 결과: 21 FPS에서 12.26%의 mAP.
- YOLO-LITE 최적 실험(실험 3-배치 없음) 은 7개의 계층과 482M FLOPS를 사용하여 비-GPU 하드웨어에서 21 FPS를 달성.
- VOC에서 Tiny-YOLOv2에 비해 다중 클래스 범위가 비슷하면서도 더 높은 FPS를 달성했고 FLOPS는 더 낮게 유지(JD: 482M 대 6.97B).
- 비-GPU 하드웨어에서 YOLO-LITE은 로컬에서 약 21 FPS, 웹 배포 시 약 10 FPS로 실행되어 경량 기기에서 강력한 실시간 가능성을 보여준다.
- YOLO-LITE는 당시 가장 빠른 최첨단 모델인 SSD Mobilenetv1보다 약 3.8배 빠르며_GPU 비활용 맥락에서 더 높은 FPS를 제공합니다.

더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.