Skip to main content
QUICK REVIEW

[论文解读] YOLOv11 for Vehicle Detection: Advancements, Performance, and Applications in Intelligent Transportation Systems

Mujadded Al Rabbani Alif|arXiv (Cornell University)|Oct 30, 2024
Advanced Neural Network Applications被引用 20
一句话总结

本文分析 YOLO11 在车辆检测中的表现,显示在 mAP 和速度方面优于 YOLOv8/YOLOv10,特别是在小尺寸和遮挡车辆上。

ABSTRACT

Accurate vehicle detection is essential for the development of intelligent transportation systems, autonomous driving, and traffic monitoring. This paper presents a detailed analysis of YOLO11, the latest advancement in the YOLO series of deep learning models, focusing exclusively on vehicle detection tasks. Building upon the success of its predecessors, YOLO11 introduces architectural improvements designed to enhance detection speed, accuracy, and robustness in complex environments. Using a comprehensive dataset comprising multiple vehicle types-cars, trucks, buses, motorcycles, and bicycles we evaluate YOLO11's performance using metrics such as precision, recall, F1 score, and mean average precision (mAP). Our findings demonstrate that YOLO11 surpasses previous versions (YOLOv8 and YOLOv10) in detecting smaller and more occluded vehicles while maintaining a competitive inference time, making it well-suited for real-time applications. Comparative analysis shows significant improvements in the detection of complex vehicle geometries, further contributing to the development of efficient and scalable vehicle detection systems. This research highlights YOLO11's potential to enhance autonomous vehicle performance and traffic monitoring systems, offering insights for future developments in the field.

研究动机与目标

  • 评估 YOLO11 在不同车辆类型(汽车、卡车、公交车、摩托车、自行车)和条件下的车辆检测性能。
  • 在准确性、速度和鲁棒性方面将 YOLO11 与 YOLOv8 和 YOLOv10 进行基准比较。
  • 识别在实时检测中提高小目标和遮挡处理的架构创新。

提出的方法

  • 使用分为训练/验证/测试集(70/15/15)的 1,321 张车辆图像数据集,分辨率为 416x416。
  • 应用包括色调、饱和度、亮度、旋转、平移、缩放、错切、透视和马赛克在内的广泛数据增强。
  • 引入带有 C3k2 主干、SPPF 和 C2PSA 块的 YOLO11 架构;使用三尺度检测头(P3、P4、P5)。
  • 使用 SGD(动量 0.937、权重衰减 0.0005)训练 300 个周期,使用余弦退火学习率,起始为 0.01,并进行多尺度训练(320-640)。
  • 使用精确度、召回率、F1、mAP(IoU 0.5–0.95)和推理时间进行评估;与 YOLOv8 和 YOLOv10 进行比较。

实验结果

研究问题

  • RQ1相对于 YOLOv8/YOLOv10,YOLO11 是否在小目标和遮挡车辆的检测方面有所改进?
  • RQ2在不同车辆类型下,YOLO11 的准确性、速度和鲁棒性特征是什么?
  • RQ3架构创新(C3k2、C2PSA)如何影响实时车辆检测的性能?
  • RQ4在多变环境条件下,YOLO11 相对于前代有何表现?

主要发现

  • YOLO11 在所有类别上实现更高的 mAP@0.5(0.743),各类别得分为:Car 0.837,Motorcycle 0.679,Truck 0.355,Bus 0.863,Bicycle 0.982。
  • YOLO11 在 IoU 阈值高达 0.95 的 mAP 上超过了 YOLOv8 与 YOLOv10(mAP@0.5:0.95 = 48.5%)。
  • YOLO11 的推理速度达到 290 FPS,快于 YOLOv10(280 FPS)也快于 YOLOv8(260 FPS)。
  • YOLO11 在检测更小/遮挡对象(如自行车、摩托车)方面表现改进,并在多变条件下具有更强的鲁棒性。
  • 混淆矩阵和精确召回分析显示在汽车和公交车上表现更强,某些误分类主要发生在卡车与公交车之间。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。