[論文レビュー] GSO-YOLO: Global Stability Optimization YOLO for Construction Site Detection
GSO-YOLOはGlobal Optimization Module (GOM)、Steady Capture Module (SCM)、および AIoU 損失を用いて YOLOv8 を強化し、建設現場の物体検出を改善、SODA・MOCS・CIS データセットでSOTAを達成。
Safety issues at construction sites have long plagued the industry, posing risks to worker safety and causing economic damage due to potential hazards. With the advancement of artificial intelligence, particularly in the field of computer vision, the automation of safety monitoring on construction sites has emerged as a solution to this longstanding issue. Despite achieving impressive performance, advanced object detection methods like YOLOv8 still face challenges in handling the complex conditions found at construction sites. To solve these problems, this study presents the Global Stability Optimization YOLO (GSO-YOLO) model to address challenges in complex construction sites. The model integrates the Global Optimization Module (GOM) and Steady Capture Module (SCM) to enhance global contextual information capture and detection stability. The innovative AIoU loss function, which combines CIoU and EIoU, improves detection accuracy and efficiency. Experiments on datasets like SODA, MOCS, and CIS show that GSO-YOLO outperforms existing methods, achieving SOTA performance.
研究の動機と目的
- 建設現場の画像における高い安全リスクと遮蔽・ノイズに動機づけられて。
- 挑戦的な屋外シーンにおける検出精度、安定性、一般化能力の向上を目指す。
- YOLOベースの検出にグローバルコンテキストと時系列的安定性を統合して頑健な検出フレームワークを開発する。
提案手法
- Global Attention Mechanism (GAM) を用いてグローバルおよびローカル特徴を融合する Global Optimization Module (GOM) を導入。
- Exponential Moving Average (EMA) に基づく Steady Capture Module (SCM) を追加し、検出を滑らかにし履歴を活用。
- CIoUとEIoUを組み合わせた拡張損失としてAIoUを提案し、精度と収束速度のバランスを取る。
- 受容野を拡大し局所化を改善するため、YOLOv8 のバックボーンを SPPF の前に GOM を、SPPF の後に SCM を挿入するよう改良。
- ネットワーク全体で AIoU 損失を用いて改良された境界ボックス回帰を伝播。
- 評価とアブレーション研究のために3つの建設現場データセット(SODA, MOCS, CIS)を使用。
実験結果
リサーチクエスチョン
- RQ1GOMとSCMは建設現場の物体検出におけるグローバル文脈理解と安定性を向上させるか?
- RQ2AIoU 損失はノイズや遮蔽環境でより速い収束と境界ボックスの精度向上を提供するか?
- RQ3GSO-YOLOは SODA、MOCS、CIS で YOLOv8 および他のベースラインと比較してどのように性能を示すか?
- RQ4各モジュール(GOM、SCM、AIoU)の全データセットにおける全体性能への寄与は何か?
主な発見
| Dataset | Method | mAP50 | mAP50-95 |
|---|---|---|---|
| SODA | YOLOv8 | 70.13% | 40.49% |
| SODA | GSO-YOLO | 81.54% | 50.20% |
| MOCS | YOLOv8 | 64.02% | 46.24% |
| MOCS | GSO-YOLO | 75.13% | 57.47% |
| CIS | YOLOv8 | 82.57% | 63.56% |
| CIS | GSO-YOLO | 88.03% | 74.20% |
- GSO-YOLOはSODA、MOCS、CIS全体でYOLOv8よりmAP50およびmAP50-95を大幅に改善。SODAではmAP50が70.13%から81.54%に、mAP50-95が40.49%から50.20%に上昇。
- MOCSではmAP50が64.02%から75.13%へ、mAP50-95が46.24%から57.47%へ上昇。
- CISではmAP50が82.57%から88.03%へ、mAP50-95が63.56%から74.20%へ上昇。
- アブレーションではGOMとSCMが個別に結果を改善し、GOMは大きな利益をもたらす(例: SODA: 78.31/46.77)、SCMはより小さな利益をもたらす(例: SODA: 72.06/42.30)。組み合わせたGOM+SCMは78.78/47.12に達し、AIoUは81.54/50.20に向上。
- GSO-YOLOは訓練精度、クラス別性能、そしてテストデータセットでの一般化において優れた性能を示す。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。