Skip to main content
QUICK REVIEW

[論文レビュー] Removal then Selection: A Coarse-to-Fine Fusion Perspective for RGB-Infrared Object Detection

Tianyi Zhao, Maoxun Yuan|arXiv (Cornell University)|Jan 19, 2024
Advanced Image Fusion Techniques被引用数 5
ひとこと要約

RSDetは、Redundant Spectrum RemovalモジュールとDynamic Feature Selectionモジュールを備えた粗-細融合フレームワークを導入し、RGBとIR特徴を融合してRGB-IR物体検出を改善します。複数のRGB-IRデータセットで最先端の結果を達成します。

ABSTRACT

In recent years, object detection utilizing both visible (RGB) and thermal infrared (IR) imagery has garnered extensive attention and has been widely implemented across a diverse array of fields. By leveraging the complementary properties between RGB and IR images, the object detection task can achieve reliable and robust object localization across a variety of lighting conditions, from daytime to nighttime environments. Most existing multi-modal object detection methods directly input the RGB and IR images into deep neural networks, resulting in inferior detection performance. We believe that this issue arises not only from the challenges associated with effectively integrating multimodal information but also from the presence of redundant features in both the RGB and IR modalities. The redundant information of each modality will exacerbates the fusion imprecision problems during propagation. To address this issue, we draw inspiration from the human brain's mechanism for processing multimodal information and propose a novel coarse-to-fine perspective to purify and fuse features from both modalities. Specifically, following this perspective, we design a Redundant Spectrum Removal module to remove interfering information within each modality coarsely and a Dynamic Feature Selection module to finely select the desired features for feature fusion. To verify the effectiveness of the coarse-to-fine fusion strategy, we construct a new object detector called the Removal then Selection Detector (RSDet). Extensive experiments on three RGB-IR object detection datasets verify the superior performance of our method.

研究の動機と目的

  • 融合中のモダリティ固有ノイズを低減することで、頑健なRGB-IR物体検出を動機付ける。
  • 人間のマルチセンサ処理にインスパイアされた粗-細融合パラダイムを提案する。
  • Redundant Spectrum RemovalおよびDynamic Feature Selectionモジュールを備えたRSDetを開発する。
  • 広範な実験を通じて複数のRGB-IRデータセットで優れた性能を示す。

提案手法

  • RGBとIR特徴を浄化し融合するためのCoarse-to-Fine Fusionを導入する。
  • Redundant Spectrum Removal (RSR): 各モダリティごとに関連性の低いスペクトルを除去する動的周波数領域フィルタリング。
  • Dynamic Feature Selection (DFS): スケール指向エキスパートのミクスチャーで多段階モダリティ特徴をゲートし融合。
  • 共有・特有特徴表現学習を通じて、共有特徴とモダリティ特有特徴を分離。
  • 共有/特有特徴の相互情報ベースの監督を用いたFaster R-CNNベースのRSDetへの統合。

実験結果

リサーチクエスチョン

  • RQ1粗-細融合は、融合前のモダリティノイズを低減することでRGB-IR物体検出を改善できるか?
  • RQ2RSRおよびDFSモジュールは、個別にも共同にもRGB-IR検出器の性能向上に寄与するか?
  • RQ3KAIST、FLIR、LLVIPデータセットにおける最先端のマルチスペクトル検出器と比較してRSDetはどの程度の性能を示すか?

主な発見

  • RSDetはKAISTにおいてAll-day/night設定で最先端の性能を達成し、Near、Medium、Farスケール全般で高い性能を示す。
  • アブレーションによりRSRは測定可能な向上を、DFSは特にFLIRとLLVIPデータセットで顕著な改善をもたらす。
  • RSDetはFLIRとLLVIPデータセットにおけるmAP@50およびmAP指標で複数のベースラインを上回る。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。