QUICK REVIEW

[논문 리뷰] GSO-YOLO: Global Stability Optimization YOLO for Construction Site Detection

Yuming Zhang, Dongzhi Guan|arXiv (Cornell University)|2024. 07. 01.

Infrastructure Maintenance and Monitoring인용 수 5

한 줄 요약

GSO-YOLO는 Global Optimization Module (GOM), Steady Capture Module (SCM), 및 AIoU 손실로 YOLOv8를 향상시켜 건설 현장 객체 탐지 성능을 개선하고 SODA, MOCS, CIS 데이터셋에서 SOTA에 도달합니다.

ABSTRACT

Safety issues at construction sites have long plagued the industry, posing risks to worker safety and causing economic damage due to potential hazards. With the advancement of artificial intelligence, particularly in the field of computer vision, the automation of safety monitoring on construction sites has emerged as a solution to this longstanding issue. Despite achieving impressive performance, advanced object detection methods like YOLOv8 still face challenges in handling the complex conditions found at construction sites. To solve these problems, this study presents the Global Stability Optimization YOLO (GSO-YOLO) model to address challenges in complex construction sites. The model integrates the Global Optimization Module (GOM) and Steady Capture Module (SCM) to enhance global contextual information capture and detection stability. The innovative AIoU loss function, which combines CIoU and EIoU, improves detection accuracy and efficiency. Experiments on datasets like SODA, MOCS, and CIS show that GSO-YOLO outperforms existing methods, achieving SOTA performance.

연구 동기 및 목표

건설 현장 이미지의 높은 안전 위험성과 가림/잡음으로 인해 동기가 부여되었습니다.
도전적인 실외 환경에서 탐지 정확도, 안정성, 일반화 향상을 목표로 합니다.
전역 컨텍스트와 시간적 안정성을 YOLO 기반 탐지에 통합하여 견고한 탐지 프레임워크를 개발합니다.

제안 방법

Global Attention Mechanism (GAM)을 사용하여 Global Optimization Module (GOM)을 도입하여 전역 및 로컬 특성을 융합합니다.
Exponential Moving Average (EMA)에 기반한 Steady Capture Module (SCM)을 도입하여 탐지를 매끄럽게 하고 이력을 활용합니다.
CIoU와 EIoU를 결합한 augmented loss로서 AIoU를 제안하여 정확도와 수렴 속도 간의 균형을 맞춥니다.
SPPF 앞에 GOM을 삽입하고 SPPF 뒤에 SCM을 삽입하여 수용 영역을 확장하고 위치 추정(localization)을 개선하도록 YOLOv8 백본을 수정합니다.
네트워크 전반에 걸쳐 AIoU 손실을 사용하여 개선된 바운딩 박스 회귀를 전파합니다.
평가 및 애블레이션 연구를 위해 SODA, MOCS, CIS의 세 건설 현장 데이터셋을 사용합니다.

실험 결과

연구 질문

RQ1GOM과 SCM이 건설 현장 객체 탐지에서 글로벌 컨텍스트 이해도와 안정성을 향상시킬 수 있는가?
RQ2AIoU 손실이 노이즈가 많고 가림된 환경에서 더 빠른 수렴과 더 나은 바운딩 박스 정확도를 제공하는가?
RQ3GSO-YOLO가 SODA, MOCS, CIS에서 YOLOv8 및 다른 베이스라인 대비 어떤 성능을 내는가?
RQ4각 모듈(GOM, SCM, AIoU)이 데이터셋 전반의 성능에 기여하는 바는 무엇인가?

주요 결과

데이터셋	방법	mAP50	mAP50-95
SODA	YOLOv8	70.13%	40.49%
SODA	GSO-YOLO	81.54%	50.20%
MOCS	YOLOv8	64.02%	46.24%
MOCS	GSO-YOLO	75.13%	57.47%
CIS	YOLOv8	82.57%	63.56%
CIS	GSO-YOLO	88.03%	74.20%

GSO-YOLO는 SODA, MOCS, CIS 전반에서 YOLOv8 대비 mAP50 및 mAP50-95를 크게 향상시킨다. SODA의 경우 mAP50은 70.13%에서 81.54%로, mAP50-95는 40.49%에서 50.20%로 상승한다.
MOCS의 경우 mAP50은 64.02%에서 75.13%로, mAP50-95는 46.24%에서 57.47%로 상승한다.
CIS의 경우 mAP50은 82.57%에서 88.03%로, mAP50-95는 63.56%에서 74.20%로 상승한다.
애블레이션 결과 GOM과 SCM 각각이 결과를 향상시키며, GOM은 큰 이득을 주고(SODA: 78.31/46.77 등), SCM은 비교적 작은 이득을 주는 경향이 있다(SODA: 72.06/42.30 등); GOM+SCM의 조합은 78.78/47.12에 도달하고, AIoU는 81.54/50.20으로 상승한다.
GSO-YOLO는 훈련 정확도, 클래스별 성능 및 제시된 데이터셋에서의 일반화가 더 우수함을 보여준다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.