QUICK REVIEW

[論文レビュー] YOLOv6 v3.0: A Full-Scale Reloading

Chuyi Li, Lulu Li|arXiv (Cornell University)|Jan 13, 2023

Advanced Neural Network Applications被引用数 192

ひとこと要約

YOLOv6 v3.0 は BiC ベースのネック、アンカー支援トレーニング、自己蒸留、そして拡張されたバックボーン/ネックを用いてネットワークとトレーニング戦略を刷新し、N6/S6/M6/L6 変種を含む複数スケールで実時間精度の最先端を達成します。

ABSTRACT

The YOLO community has been in high spirits since our first two releases! By the advent of Chinese New Year 2023, which sees the Year of the Rabbit, we refurnish YOLOv6 with numerous novel enhancements on the network architecture and the training scheme. This release is identified as YOLOv6 v3.0. For a glimpse of performance, our YOLOv6-N hits 37.5% AP on the COCO dataset at a throughput of 1187 FPS tested with an NVIDIA Tesla T4 GPU. YOLOv6-S strikes 45.0% AP at 484 FPS, outperforming other mainstream detectors at the same scale (YOLOv5-S, YOLOv8-S, YOLOX-S and PPYOLOE-S). Whereas, YOLOv6-M/L also achieve better accuracy performance (50.0%/52.8% respectively) than other detectors at a similar inference speed. Additionally, with an extended backbone and neck design, our YOLOv6-L6 achieves the state-of-the-art accuracy in real-time. Extensive experiments are carefully conducted to validate the effectiveness of each improving component. Our code is made available at https://github.com/meituan/YOLOv6.

研究の動機と目的

より良いリアルタイム物体検出性能のために、アーキテクチャとトレーニングの改善で YOLOv6 を更新・強化する。
小規模から大規模モデルまで、推論速度を維持または向上させつつ、より高い精度を達成する。
推論レイテンシに影響を与えないトレーニング時の補助を備えた統一フレームワークを提供する。
YOLOv5/YOLOv7/YOLOv8 および同業他社と比較する広範なアブレーションを通じて改善を検証する。

提案手法

localization 信号を改善するために三つの隣接レイヤーの特徴を融合する強化ネック（BiC モジュール）を設計する。
表現力を維持しつつ SPPF ブロックを置換・簡略化する SimCSPSPPF を導入する。
学習時にアンカー基盤とアンカーなしの利点を組み合わせるアンカー支援トレーニング（AAT）を採用し、推論時には補助分岐を削除する。
小型モデルの速度を損なわずに性能を高める自己蒸留を適用する（小型モデル用の特別な Decoupled Localization Distillation を含む）。
高解像度画像の精度を向上させるために、バックボーンとネックを追加の段（C6 特徴）とより高い入力解像度で拡張する。
FP16 TensorRT で Tesla T4 を用いてモデルを評価し、AP、FPS、レイテンシを報告し、YOLOv5/YOLOX/PPYOLOE/YOLOv7/YOLOv8 と比較する。

実験結果

リサーチクエスチョン

RQ1 アーキテクチャの変更（BiC ネック、SimCSPSPPF）が localization と小さな物体の精度にどう影響するか？
RQ2 学習中のアンカー基盤の補助分岐は推論速度に影響を与えずに検出性能を向上させるか？
RQ3 自己蒸留と専用の大規模回帰分岐はスループット低下なしに小型モデルの性能を高めるか？
RQ4 トップステージ（C6）の追加と高入力解像度がリアルタイム速度で COCO AP にどのような影響を与えるか？

主な発見

YOLOv6-N/S/M/L は同程度のスケールで YOLOv5/YOLOv7/PPYOLOE/YOLov8 と比較して競争力のある速度でより高い AP を達成している。
640→1280 の高入力解像度と C6 特徴の追加により、実時間検出器の最先端精度を実現した。
BiC は局在信号と小物体の AP を最小限の効率コストで改善し、特に小型モデルで効果を発揮する。
アンカー支援トレーニング（AAT）はスケールを跨いだ追加の AP を提供し、特に小さな物体の AP を改善する。
自己蒸留（Decoupled Localization Distillation を含む）は推論を遅くすることなく AP を向上させる。
最先端と比較して、YOLOv6-L6 は YOLOv7-E6E を 0.4% AP 上回り、bs=1 で 63% 速く動作する。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。