Skip to main content
QUICK REVIEW

[论文解读] CFENet: An Accurate and Efficient Single-Shot Object Detector for Autonomous Driving

Qijie Zhao, Tao Sheng|arXiv (Cornell University)|Jun 26, 2018
Advanced Neural Network Applications参考文献 23被引用 35
一句话总结

CFENet 提出了一种轻量级、单阶段的自动驾驶目标检测器,通过引入一种新型的综合特征增强(CFE)模块对 SSD 进行改进,显著提升了小目标检测的准确率,同时保持了实时推理速度。在 BDD 数据集上,多尺度的 CFENet800 达到了 29.69 mAP,排名第二,并在小目标 mAP 上比 RefineDet 高出 2.2 分。

ABSTRACT

The ability to detect small objects and the speed of the object detector are very important for the application of autonomous driving, and in this paper, we propose an effective yet efficient one-stage detector, which gained the second place in the Road Object Detection competition of CVPR2018 workshop - Workshop of Autonomous Driving(WAD). The proposed detector inherits the architecture of SSD and introduces a novel Comprehensive Feature Enhancement(CFE) module into it. Experimental results on this competition dataset as well as the MSCOCO dataset demonstrate that the proposed detector (named CFENet) performs much better than the original SSD and the state-of-the-art method RefineDet especially for small objects, while keeping high efficiency close to the original SSD. Specifically, the single scale version of the proposed detector can run at the speed of 21 fps, while the multi-scale version with larger input size achieves the mAP 29.69, ranking second on the leaderboard

研究动机与目标

  • 解决 SSD 等单阶段检测器在自动驾驶场景中小目标上表现不佳的问题。
  • 在不牺牲推理速度的前提下,提升如交通灯和标志等小目标的检测准确率。
  • 在增强小尺度目标特征表示的同时,保持实时推理能力(20+ FPS)。
  • 设计一种轻量化、高效的网络结构,适用于真实自动驾驶系统中的部署。
  • 在 BDD 道路目标检测基准上实现最先进性能,尤其在小目标检测方面表现突出。

提出的方法

  • 将新型综合特征增强(CFE)模块集成到 SSD 主干网络中,以增强多尺度下的特征表示能力。
  • 在特征图的顶部(高层)和底部(低层)位置均部署 CFE 模块,以同时增强语义信息和空间信息。
  • 使用特征融合块(FFBs)融合来自不同阶段的多尺度特征,提升检测的鲁棒性。
  • 采用单尺度推理策略(输入尺寸为 512×512)以实现实时速度(21 FPS),并采用多尺度推理(800×800)以提升精度。
  • 利用 VGG-16 主干网络,并结合优化后的 PyTorch v0.4+ 版本,实现高效训练与推理,支持高速部署。
  • 在后处理阶段采用 hard-NMS,以在保持速度的同时确保检测框的质量。

实验结果

研究问题

  • RQ1与 SSD 和 RefineDet 相比,轻量级单阶段检测器是否能在自动驾驶场景中实现更优的小目标检测性能?
  • RQ2综合特征增强(CFE)模块在提升小目标特征表示方面有多有效?
  • RQ3多尺度推理与特征融合在不降低推理速度的前提下,能在多大程度上提升检测精度?
  • RQ4所提出的 CFENet 是否能在保持实时推理速度(20+ FPS)的同时,在小目标检测上超越最先进检测器?
  • RQ5CFENet 在真实自动驾驶基准(如 BDD)上的表现如何,特别是在交通标志和交通灯等稀有或小类别目标上?

主要发现

  • 在 MSCOCO minival 数据集上,CFENet 达到 34.8 mAP,整体 mAP 比 RefineDet 高出 1.8 分。
  • 在小目标上,CFENet 在 MSCOCO 上达到 18.3 mAP,比 RefineDet 高出 2.2 分。
  • 在 BDD 测试集上,CFENet800 采用多尺度推理达到 29.69 mAP,位列排行榜第二。
  • 单尺度的 CFENet512 推理速度达 21 FPS,证明其具备适用于自动驾驶的实时推理能力。
  • 对于交通灯和交通标志等小目标,CFENet512 在相同基准上实现 15.4% 的 S-mAP,优于 RefineDet 的 13.1%。
  • 消融实验证实,CFE 模块和 FFBs 显著提升了性能,通过逐步集成各组件,mAP 从 28.8 提升至 34.8。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。