Skip to main content
QUICK REVIEW

[论文解读] GSO-YOLO: Global Stability Optimization YOLO for Construction Site Detection

Yuming Zhang, Dongzhi Guan|arXiv (Cornell University)|Jul 1, 2024
Infrastructure Maintenance and Monitoring被引用 5
一句话总结

GSO-YOLO 通过 Global Optimization Module (GOM)、Steady Capture Module (SCM) 和 AIoU 损失来提升施工现场目标检测,在 SODA、MOCS 和 CIS 数据集上达到 SOTA。

ABSTRACT

Safety issues at construction sites have long plagued the industry, posing risks to worker safety and causing economic damage due to potential hazards. With the advancement of artificial intelligence, particularly in the field of computer vision, the automation of safety monitoring on construction sites has emerged as a solution to this longstanding issue. Despite achieving impressive performance, advanced object detection methods like YOLOv8 still face challenges in handling the complex conditions found at construction sites. To solve these problems, this study presents the Global Stability Optimization YOLO (GSO-YOLO) model to address challenges in complex construction sites. The model integrates the Global Optimization Module (GOM) and Steady Capture Module (SCM) to enhance global contextual information capture and detection stability. The innovative AIoU loss function, which combines CIoU and EIoU, improves detection accuracy and efficiency. Experiments on datasets like SODA, MOCS, and CIS show that GSO-YOLO outperforms existing methods, achieving SOTA performance.

研究动机与目标

  • 因施工现场图像存在较高安全风险以及遮挡/噪声问题而受到驱动。
  • 旨在在具有挑战性的户外场景中提高检测准确性、稳定性和泛化能力。
  • 通过将全局上下文与时间稳定性融入基于 YOLO 的检测,开发一个鲁棒的检测框架。

提出的方法

  • 引入 Global Optimization Module (GOM),使用 Global Attention Mechanism (GAM) 将全局与局部特征融合。
  • 基于 Exponential Moving Average (EMA) 的 Steady Capture Module (SCM),以平滑检测并利用历史信息。
  • 提出 AIoU 作为将 CIoU 与 EIoU 结合的增强损失,以在准确性与收敛速度之间取得平衡。
  • 在 SPPF 之前插入 GOM,在 SPPF 之后插入 SCM,以扩大感受野并改善定位。
  • 在整网络中使用 AIoU 损失以传播改进的边界框回归。
  • 使用三个施工现场数据集(SODA、MOCS、CIS)进行评估与消融研究。

实验结果

研究问题

  • RQ1GOM 与 SCM 能否在施工现场目标检测中提升全局上下文理解与稳定性?
  • RQ2AIoU 损失是否在嘈杂、遮挡环境中提供更快的收敛与更好边界框精度?
  • RQ3在 SODA、MOCS、CIS 上,GSO-YOLO 相对于 YOLOv8 和其他基线的表现如何?
  • RQ4每个模块(GOM、SCM、AIoU)对跨数据集的整体性能贡献是多少?

主要发现

数据集方法mAP50mAP50-95
SODAYOLOv870.13%40.49%
SODAGSO-YOLO81.54%50.20%
MOCSYOLOv864.02%46.24%
MOCSGSO-YOLO75.13%57.47%
CISYOLOv882.57%63.56%
CISGSO-YOLO88.03%74.20%
  • GSO-YOLO 在 SODA、MOCS、CIS 的 mAP50 与 mAP50-95 上相对于 YOLOv8 显著提升。对于 SODA,mAP50 从 70.13% 提升至 81.54%,mAP50-95 从 40.49% 提升至 50.20%。
  • 对于 MOCS,mAP50 从 64.02% 提升至 75.13%,mAP50-95 从 46.24% 提升至 57.47%。
  • 对于 CIS,mAP50 从 82.57% 提升至 88.03%,mAP50-95 从 63.56% 提升至 74.20%。
  • 消融结果显示 GOM 与 SCM individually 提升了结果,其中 GOM 带来较大增益(例如 SODA: 78.31/46.77),SCM 提供较小增益(例如 SODA: 72.06/42.30);组合 GOM+SCM 达到 78.78/47.12,且 AIoU 提升至 81.54/50.20。
  • GSO-YOLO 展现出在测试数据集上的训练精度、类别级别表现和泛化能力的改进。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。