[论文解读] Tiny SSD: A Tiny Single-shot Detection Deep Convolutional Neural Network for Real-time Embedded Object Detection
Tiny SSD 是一个紧凑的单发检测器,结合了非均匀 Fire 基子网络与优化的 SSD 特征层,以实现实时嵌入式目标检测,模型大小为 2.3MB,VOC 2007 上 mAP 为 61.3%,性能超过 Tiny YOLO,同时使用更少的 MAC 乘法运算。
Object detection is a major challenge in computer vision, involving both object classification and object localization within a scene. While deep neural networks have been shown in recent years to yield very powerful techniques for tackling the challenge of object detection, one of the biggest challenges with enabling such object detection networks for widespread deployment on embedded devices is high computational and memory requirements. Recently, there has been an increasing focus in exploring small deep neural network architectures for object detection that are more suitable for embedded devices, such as Tiny YOLO and SqueezeDet. Inspired by the efficiency of the Fire microarchitecture introduced in SqueezeNet and the object detection performance of the single-shot detection macroarchitecture introduced in SSD, this paper introduces Tiny SSD, a single-shot detection deep convolutional neural network for real-time embedded object detection that is composed of a highly optimized, non-uniform Fire sub-network stack and a non-uniform sub-network stack of highly optimized SSD-based auxiliary convolutional feature layers designed specifically to minimize model size while maintaining object detection performance. The resulting Tiny SSD possess a model size of 2.3MB (~26X smaller than Tiny YOLO) while still achieving an mAP of 61.3% on VOC 2007 (~4.2% higher than Tiny YOLO). These experimental results show that very small deep neural network architectures can be designed for real-time object detection that are well-suited for embedded scenarios.
研究动机与目标
- 在尽量减小模型大小的同时设计一个实时嵌入式对象检测器,同时不牺牲精度。
- 利用 Fire 模块的高效性与 SSD 的多尺度预测来打造 Tiny SSD。
- 在 VOC 2007/2012 上将 Tiny SSD 与嵌入式对象检测基线进行对比评测。
- 展示用于嵌入部署的参数精度优化。
提出的方法
- 采用双子网架构:一个非均匀优化的 Fire 子网络输出到一个非均匀堆叠的基于 SSD 的辅助卷积特征层。
- 优化 Fire 模块微架构,在尽量减少参数的同时保持准确性。
- 设计并调优具有非均匀、低参数配置的 SSD 辅助特征层,以实现多尺度检测。
- 应用半精度(16 位)参数表示以降低内存占用。
- 在 Caffe 中训练,使用 RMSProp,基学习率 0.00001,220k 次迭代。
实验结果
研究问题
- RQ1Tiny SSD 如何在嵌入式设备上平衡模型大小、推理速度和检测精度?
- RQ2结合 Fire 基架构与 SSD 特征层是否能在显著减小模型大小的同时,在 VOC 上获得具竞争力的 mAP?
- RQ3在 Fire 模块和 SSD 层使用非均匀微架构时有哪些权衡?
- RQ4在 VOC 2007/2012 上,Tiny SSD 与 Tiny YOLO 在精度和效率方面的对比?
- RQ5低精度参数对检测性能与模型大小有何影响?
主要发现
- Tiny SSD 的模型大小为 2.3MB,约比 Tiny YOLO 小 26 倍。
- Tiny SSD 在 VOC 2007 上实现 61.3% mAP,约比 Tiny YOLO 高出 4.2%。
- Tiny SSD 推断需要 571.09M MACs。
- Tiny SSD 的非均匀 Fire 和 SSD 层设计在尽量减少参数的同时保留了准确性。
- 在定性示例中,Tiny SSD 有时能检测到 Tiny YOLO 未检测到的对象,并提供更好的类别标注。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。