[논문 리뷰] YOLOv8-AM: YOLOv8 Based on Effective Attention Mechanisms for Pediatric Wrist Fracture Detection
GRAZPEDWRI-DX에서 소아 손목 골절 탐지를 위해 YOLOv8에 네 가지 주의 모듈을 통합한 YOLOv8-AM을 도입하여 최신 mAP50을 달성한다.
Wrist trauma and even fractures occur frequently in daily life, particularly among children who account for a significant proportion of fracture cases. Before performing surgery, surgeons often request patients to undergo X-ray imaging first and prepare for it based on the analysis of the radiologist. With the development of neural networks, You Only Look Once (YOLO) series models have been widely used in fracture detection as computer-assisted diagnosis (CAD). In 2023, Ultralytics presented the latest version of the YOLO models, which has been employed for detecting fractures across various parts of the body. Attention mechanism is one of the hottest methods to improve the model performance. This research work proposes YOLOv8-AM, which incorporates the attention mechanism into the original YOLOv8 architecture. Specifically, we respectively employ four attention modules, Convolutional Block Attention Module (CBAM), Global Attention Mechanism (GAM), Efficient Channel Attention (ECA), and Shuffle Attention (SA), to design the improved models and train them on GRAZPEDWRI-DX dataset. Experimental results demonstrate that the mean Average Precision at IoU 50 (mAP 50) of the YOLOv8-AM model based on ResBlock + CBAM (ResCBAM) increased from 63.6% to 65.8%, which achieves the state-of-the-art (SOTA) performance. Conversely, YOLOv8-AM model incorporating GAM obtains the mAP 50 value of 64.2%, which is not a satisfactory enhancement. Therefore, we combine ResBlock and GAM, introducing ResGAM to design another new YOLOv8-AM model, whose mAP 50 value is increased to 65.0%. The implementation code for this study is available on GitHub at https://github.com/RuiyangJu/Fracture_Detection_Improved_YOLOv8.
연구 동기 및 목표
- 주의 강화된 YOLOv8를 사용하여 소아 손목 X-ray에서 골절 탐지 성능을 개선하도록 동기를 부여한다.
- 다양한 주의 메커니즘이 탐지 성능에 미치는 영향을 조사한다.
- 이 작업에 대해 높은 성능을 보이는 주의 모듈 조합을 식별한다.
- GRAZPEDWRI-DX 데이터세트에서 재현 가능한 구현 모델과 오픈 소스 코드를 제공한다.
제안 방법
- 네 가지 주의 모듈(CBAM, GAM, ECA, SA)을 YOLOv8 아키텍처에 통합하여 향상된 모델을 만든다.
- ResBlock 변형을 실험하여 ResCBAM 및 ResGAM 모델을 형성한다.
- GRAZPEDWRI-DX 소아 손목 데이터세트에서 학습 및 평가하여 mAP@50를 측정한다.
- 주의 모듈과 조합을 비교하여 최상의 성능 구성을 식별한다.
- 재현성을 위해 GitHub에서 구현 코드를 제공합니다.
실험 결과
연구 질문
- RQ1YOLOv8에 주의 메커니즘을 포함시키면 소아 손목 X-ray의 골절 탐지 성능이 개선되는가?
- RQ2GRAZPEDWRI-DX에서 어떤 주의 모듈이나 조합이 가장 높은 mAP@50를 산출하는가?
- RQ3이 작업에서 ResBlock 기반 설계가 YOLOv8의 주의 모듈과 어떻게 상호작용하는가?
- RQ4제안된 최적 모델이 데이터세트에서 최첨단(SOTA) 결과를 달성하는가?
주요 결과
- ResBlock + CBAM(ResCBAM)을 갖춘 YOLOv8-AM은 mAP50 65.8%(63.6%에서 상승)를 달성했다.
- GAM만으로 구성된 YOLOv8-AM은 mAP50 64.2%를 달성했다.
- 결합된 ResGAM 설계가 mAP50을 65.0%로 올렸다.
- 가장 높은 성능을 보이는 구성(ResCBAM)은 이 작업에 대해 데이터세트에서 최첨단 성능을 달성한다.
- 모델과 실험 코드가 재현성을 위해 GitHub에 공개되었다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.