[논문 리뷰] YOLOv11 Optimization for Efficient Resource Utilization
논문은 효율성을 위해 객체 크기 범위에 맞춰 최적화된 여섯 가지 size-specific YOLOv11 변형과 데이터셋별 최적 모델을 선택하는 객체 크기 분류기를 개발하고, YOLOv11 및 YOLOv8과 비교하여 크기와 추론 시간이 감소하면서 정확도는 비슷하거나 개선된 것을 보여준다.
The objective of this research is to optimize the eleventh iteration of You Only Look Once (YOLOv11) by developing size-specific modified versions of the architecture. These modifications involve pruning unnecessary layers and reconfiguring the main architecture of YOLOv11. Each proposed version is tailored to detect objects of specific size ranges, from small to large. To ensure proper model selection based on dataset characteristics, we introduced an object classifier program. This program identifies the most suitable modified version for a given dataset. The proposed models were evaluated on various datasets and compared with the original YOLOv11 and YOLOv8 models. The experimental results highlight significant improvements in computational resource efficiency, with the proposed models maintaining the accuracy of the original YOLOv11. In some cases, the modified versions outperformed the original model regarding detection performance. Furthermore, the proposed models demonstrated reduced model sizes and faster inference times. Models weights and the object size classifier can be found in this repository
연구 동기 및 목표
- YOLOv11을 객체 크기 범위에 맞춰 효율적인 물체 탐지를 촉진한다.
- 작고, 중간, 큰, 혼합 크기 객체에 특화된 여섯 가지 수정된 YOLOv11 변형을 개발한다.
- 데이터셋 특성에 따라 적절한 모델을 자동으로 선택하는 객체 크기 분류기를 제공한다.
- 다양한 데이터셋에서 수정된 모델을 YOLOv11 및 YOLOv8과 평가한다.
- 모델 크기와 추론 시간의 감소를 시연하고 정확도는 유지되거나 향상된다.
제안 방법
- 여섯 가지 YOLOv11 변형을 제안한다: YOLOv11-small, -medium, -large, -sm, -ml, -sl 각 변형은 특정 객체 크기 범위를 타깃으로 한다.
- 각 변형에 대해 백본/목/헤드 블록의 가지치기 및 재구성을 체계적으로 수행하여 크기와 무관한 구성 요소를 제거한다.
- 데이터셋 라벨을 분석하는 객체 크기 분류기를 사용하여 가장 적합한 모델을 선택한다.
- 표준 탐지 지표(recall, precision, mAP@50)와 리소스 지표(model size, GFLOPs, inference time, power)로 여섯 개 데이터셋에서 모델을 평가한다.
- 수정된 모델을 원래의 YOLOv11 및 YOLOv8과 비교하여 정확도와 효율성 사이의 트레이드오프를 평가한다.

실험 결과
연구 질문
- RQ1크기별로 YOLOv11의 가지치기를 수행해 자원 사용을 줄이면서 정확도를 유지할 수 있는가?
- RQ2자동화된 객체 크기 분류기가 주어진 데이터셋에 가장 적합한 모델을 신뢰성 있게 선택하는가?
- RQ3수정된 YOLOv11 변형의 런타임 및 크기 지표가 다양한 데이터셋에서 YOLOv11 및 YOLOv8과 어떻게 비교되는가?
- RQ4특정 응용 분야(예: 농업, 의료 영상, 공중 감시)에 대해 특정 객체 크기에 초점을 맞춘 변형이 더 우수한가?
주요 결과
| Dataset | Model | Recall (%) | Precision (%) | mAP@50 (%) |
|---|---|---|---|---|
| WeedCrop | YOLOv11 | 67.07 | 70.62 | 69.09 |
| WeedCrop | YOLOv11-small | 70.98 | 69.27 | 69.27 |
| WeedCrop | YOLOv8 | 63.98 | 63.98 | 68.50 |
| BCCD | YOLOv11 | 91.95 | 84.90 | 92.98 |
| BCCD | YOLOv11-medium | 90.56 | 85.34 | 92.67 |
| BCCD | YOLOv8 | 91.62 | 86.93 | 93.19 |
| Underwater Pipes | YOLOv11 | 99.15 | 99.01 | 99.43 |
| Underwater Pipes | YOLOv11-large | 98.90 | 99.21 | 99.48 |
| Underwater Pipes | YOLOv8 | 99.46 | 98.60 | 99.47 |
| Aerial Airport | YOLOv11 | 87.42 | 91.73 | 92.93 |
| Aerial Airport | YOLOv11-sm | 86.91 | 93.15 | 93.20 |
| Aerial Airport | YOLOv8 | 87.05 | 90.87 | 92.23 |
| Brain Tumor | YOLOv11 | 74.73 | 89.21 | 81.67 |
| Brain Tumor | YOLOv11-ml | 72.05 | 90.90 | 80.15 |
| Brain Tumor | YOLOv8 | 72.46 | 90.80 | 80.49 |
| Face Detection | YOLOv11 | 93.10 | 97.98 | 96.14 |
| Face Detection | YOLOv11-sl | 93.10 | 93.05 | 97.70 |
| Face Detection | YOLOv8 | 87.93 | 93.63 | 93.05 |
- 수정된 YOLOv11 변형은 대다수 데이터셋에서 recall, precision, 및 mAP@50에서 YOLOv8보다 일반적으로 우수하다.
- 모든 제안된 변형은 원래의 YOLOv11보다 모델 크기가 작고 GFLOPs 및 추론 시간에서 더 효율적이거나 유사하다.
- 일부 수정된 변형들(YOLOv11-small, YOLOv11-large, YOLOv11-sm, YOLOv11-sl)은 특정 데이터셋에서 원래 YOLOv11보다 더 높은 mAP@50을 달성한다.
- 원래의 YOLOv11은 때때로 일부 수정된 변형(YOLOv11-medium 및 YOLOv11-sm)보다 우수하지만 최고 성능 차이는 2% 이하여서 한계가 작다.
- 모든 모델의 이미지당 추론 시간은 5 ms 이하이며, 수정된 변형은 평균적으로 더 빠른 추론 시간을 보인다.
- 전력 소모는 여러 수정된 변형(YOLOv11-small, -medium, -large, -ml)이 YOLOv11 및 YOLOv8에 비해 더 낮다.

더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.