QUICK REVIEW

[論文レビュー] Resisting the Distracting-factors in Pedestrian Detection.

Zhe Wang, Jun Wang|arXiv (Cornell University)|May 15, 2020

Video Surveillance and Tracking Methods被引用数 2

ひとこと要約

本稿では、提案領域をそのターゲットに引き寄せ、非ターゲットのインスタンスから遠ざけることで、被覆の影響を軽減するためのクーロン損失を提案する。また、ハードネガティブマイニングを改善するための意味的駆動型アンカーサンプリング戦略を併せて導入する。これらの手法は、エンドツーエンドで学習可能で一般化性の高い設計により、Caltech-USAおよびCityPersonsベンチマークで性能を向上させる。

ABSTRACT

Pedestrian detection has been heavily studied in the last decade due to its wide application. Despite incremental progress, crowd occlusion and hard negatives are still challenging current state-of-the-art pedestrian detectors. In this paper, we offer two approaches based on the general region-based detection framework to tackle these challenges. Specifically, to address the occlusion, we design a novel coulomb loss as a regulator on bounding box regression, in which proposals are attracted by their target instance and repelled by the adjacent non-target instances. For hard negatives, we propose an efficient semantic-driven strategy for selecting anchor locations, which can sample informative negative examples at training phase for classification refinement. It is worth noting that these methods can also be applied to general object detection domain, and trainable in an end-to-end manner. We achieves consistently high performance on the Caltech-USA and CityPersons benchmarks.

研究の動機と目的

深刻な被覆とハードネガティブ例の存在下における歩行者検出の持続的課題に対処すること。
提案領域とターゲット間の空間的関係をモデル化することで、混雑したシーンにおけるボクセルボックス回帰のロバスト性を向上させること。
トレーニング中に意味的キューを用いて情報量の多いネガティブアンカーを選択することで、分類性能を向上させること。
一般物体検出と互換性があり、エンドツーエンドで学習可能な手法を設計すること。

提案手法

物理学的力の式を模倣した力の定式化を用いて、提案領域とターゲット間の引き寄せと、提案領域と非ターゲットインスタンス間の反発をモデル化するクーロン損失を導入する。
ボクセルボックス回帰における微分可能正則化項としてクーロン損失を定式化し、局所化精度を向上させる。
特徴レベルの意味的情報を基に、高い影響を持つネガティブアンカーの位置を特定する意味的駆動型戦略を提案する。
エンドツーエンド学習を可能にするために、損失関数とサンプリング戦略を領域ベースの検出フレームワークに統合する。
バックボーンネットワークからの特徴マップを用いて、曖昧または分類が難しい領域を優先してネガティブアンカーを選択する。
広範な適用性を確保するため、標準の検出ヘッドおよびトレーニングパイプラインと互換性を保つ。

実験結果

リサーチクエスチョン

RQ1被覆や混雑したシーンが存在する状況下で、ボクセルボックス回帰はどのように改善できるか？
RQ2微分可能で物理学的インスピレーションを受ける損失関数は、空間的関係をモデル化することで局所化精度を向上させられるか？
RQ3ハードネガティブな状況での分類を精緻化するために、ネガティブ例はどのようにより効果的に選択できるか？
RQ4提案手法は歩行者検出を越えて、一般物体検出に対しても一般化できる程度にどれほど適応可能か？
RQ5損失関数とサンプリング戦略の統合は、複数のベンチマークで一貫した性能向上をもたらすか？

主な発見

クーロン損失は、被覆状況下での回帰誤差を低減することで、局所化精度を顕著に向上させる。
意味的駆動型ネガティブサンプリング戦略は、ハード例に注目することで分類器の識別力を高める。
統合手法はCaltech-USAベンチマークで最先端の性能を達成した。
より困難なCityPersonsデータセットでも強力な結果を示し、被覆に対するロバストネスを実証した。
提案手法はエンドツーエンドで学習可能であり、標準の検出フレームワークと互換性がある。
アブレーションスタディにより、両方の要素が独立してかつ相乗的に性能向上に寄与していることが確認された。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。