QUICK REVIEW

[论文解读] YOLO-LITE: A Real-Time Object Detection Algorithm Optimized for Non-GPU Computers

Jonathan Pedoeem, Rachel Huang|arXiv (Cornell University)|Nov 14, 2018

Advanced Neural Network Applications参考文献 18被引用 41

一句话总结

YOLO-LITE 是一个受 YOLOv2 启发、用于非 GPU 设备的轻量级实时对象检测器，在非 GPU 硬件上达到 21 FPS，VOC mAP 为 33.77%，COCO mAP 为 12.26%。

ABSTRACT

This paper focuses on YOLO-LITE, a real-time object detection model developed to run on portable devices such as a laptop or cellphone lacking a Graphics Processing Unit (GPU). The model was first trained on the PASCAL VOC dataset then on the COCO dataset, achieving a mAP of 33.81% and 12.26% respectively. YOLO-LITE runs at about 21 FPS on a non-GPU computer and 10 FPS after implemented onto a website with only 7 layers and 482 million FLOPS. This speed is 3.8x faster than the fastest state of art model, SSD MobilenetvI. Based on the original object detection algorithm YOLOV2, YOLO- LITE was designed to create a smaller, faster, and more efficient model increasing the accessibility of real-time object detection to a variety of devices.

研究动机与目标

证明浅层网络能够在非 GPU 设备上支持实时对象检测。
研究在浅层检测网络中批量归一化的必要性。
开发一个基于 YOLOv2 的更小更快的变体，维持对 VOC/COCO 数据集的可用精度。
评估轻量检测器的输入分辨率、网络深度与速度（FPS）之间的权衡。
提供一个可网页部署、便于移动访问的模型版本。

提出的方法

从 Tiny-YOLOv2 出发，迭代地移除/添加层，同时保留 Tiny-YOLOv2 的最终预测层。
在 PASCAL VOC 2007+2012（20 类）上训练，然后在 COCO 2014（80 类）上进行微调。
在非 GPU 硬件上评估速度（FPS）和精度（mAP），并与 Tiny-YOLOv2 和 SSD Mobilenet V1 进行比较。
探讨输入图像大小和批量归一化对性能的影响。
记录架构差异和 FLOPS，以突出效率提升（如最佳 YOLO-LITE 试验的 482M FLOPS）。
对训练好的模型进行网页部署，以展示在移动设备上的可访问性。

Figure 1: Example images passed through our YOLO-LITE COCO model.

实验结果

研究问题

RQ1基于 YOLO 的检测器是否能够做得足够小、足够快，以在非 GPU 设备上实现实时运行（≈10–21 FPS）？
RQ2减小网络深度/宽度以及移除批量归一化对 mAP 和 FPS 的影响是什么？
RQ3在 VOC/COCO 上，YOLO-LITE 与现有的快速检测方法（Tiny-YOLOv2、SSD Mobilenet V1）在速度和精度方面的比较如何？
RQ4对于面向速度的浅层网络，批量归一化是否必要，以及它对训练稳定性和推理时间的影响？
RQ5轻量级检测器在输入分辨率、FLOPS 和 mAP 之间有哪些权衡？

主要发现

最佳 VOC 结果：在 VOC 上 mAP 33.77%，21 FPS（无批量归一化）。
最佳在 VOC 训练模型的 COCO 结果：mAP 12.26%，21 FPS。
YOLO-LITE 最佳试验（trial 3-no batch）使用 7 层、482M FLOPS，在非 GPU 硬件上实现 21 FPS。
与 VOC 上的 Tiny-YOLOv2 相比，YOLO-LITE 在多类别范围相当的情况下实现了显著更高的 FPS，同时保持较低的 FLOPS（482M 对 6.97B）。
在非 GPU 硬件上，YOLO-LITE 本地运行约 21 FPS，网络部署约 10 FPS，显示出轻量设备的强实时潜力。
YOLO-LITE 比当时最快的最先进模型（SSD Mobilenetv1）快约 3.8 倍，在非 GPU 情境下具有更高的 FPS。

Figure 2: Illustration depicting the definitions of intersection and union.

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。