[논문 리뷰] SARDet-100K: Towards Open-Source Benchmark and ToolKit for Large-Scale SAR Object Detection
SARDet-100K를 소개하는 COCO-스케일의 다중 클래스 SAR 물체 검출 데이터셋과 도메인/모델 격차를 줄이기 위한 MSFA 프리트레이닝, 오픈 소스 코드 포함.
Synthetic Aperture Radar (SAR) object detection has gained significant attention recently due to its irreplaceable all-weather imaging capabilities. However, this research field suffers from both limited public datasets (mostly comprising <2K images with only mono-category objects) and inaccessible source code. To tackle these challenges, we establish a new benchmark dataset and an open-source method for large-scale SAR object detection. Our dataset, SARDet-100K, is a result of intense surveying, collecting, and standardizing 10 existing SAR detection datasets, providing a large-scale and diverse dataset for research purposes. To the best of our knowledge, SARDet-100K is the first COCO-level large-scale multi-class SAR object detection dataset ever created. With this high-quality dataset, we conducted comprehensive experiments and uncovered a crucial challenge in SAR object detection: the substantial disparities between the pretraining on RGB datasets and finetuning on SAR datasets in terms of both data domain and model structure. To bridge these gaps, we propose a novel Multi-Stage with Filter Augmentation (MSFA) pretraining framework that tackles the problems from the perspective of data input, domain transition, and model migration. The proposed MSFA method significantly enhances the performance of SAR object detection models while demonstrating exceptional generalizability and flexibility across diverse models. This work aims to pave the way for further advancements in SAR object detection. The dataset and code is available at https://github.com/zcablii/SARDet_100K.
연구 동기 및 목표
- 10개의 기존 SAR 데이터셋을 합치고 표준화하여 SARDet-100K로 COCO-스케일의 대규모 SAR 물체 검출 데이터셋을 제공한다.
- RGB 데이터로 프리트레이닝하고 SAR 데이터로 미세조정할 때의 도메인 및 모델 전달 격차를 식별한다.
- 데이터/도메인 및 모델 격차를 감소시키기 위한 MSFA(다단계 필터 보강) 프리트레이닝을 제안한다.
- 탐지기와 백본 전반에 걸친 MSFA의 일반화 가능성을 입증하고 오픈 소스 벤치마크 및 도구를 확립한다.
제안 방법
- 10개의 공개 SAR 데이터셋을 수집, 표준화 및 변환하여 6개 카테고리(항공기, 선박, 자동차, 다리, 탱크, 항구)와 함께 COCO 형식으로 SARDet-100K를 생성한다.
- RGB 기반 프리트레이닝(ImageNet 등)과 SAR 미세조정 간의 도메인 전달 격차를 분석한다.
- 필터 증강 입력을 도입하여 수작업 특징 채널(HOG, Canny, Haar, WST, GRE)을 SAR 이미지에 결합해 도메인 격차를 줄인다.
- SAR 미세조정 전에 탐지기 백본을 사전 학습시키는 중간 광学 원격감지 데이터 세트를 활용하는 다단계 프리트레이닝를 도입한다.
- 다중 단계 프리트레이닝 중 전체 탐지기를 브리지 모델로 사용해 백본과 전체 검출 프레임워크 간의 모델 격차를 완화한다.
- MSFA를 다양한 탐지기와 백본에서 검증하고 최신 SAR 탐지기들과 비교한다.
실험 결과
연구 질문
- RQ1SARDet-100K가 SAR 물체 검출의 COCO-스케일 다중 클래스 벤치마크를 제공하는가?
- RQ2MSFA 프리트레이닝 프레임워크가 RGB에서 SAR 도메인으로의 전이 시 도메인 및 모델 격차를 줄이는가?
- RQ3필터 증강 입력이 도메인 격차를 좁히고 SAR 검출 성능을 향상시키는가?
- RQ4다양한 탐지기 및 백본 아키텍처에서 MSFA의 일반화 가능성은 어떠한가?
주요 결과
- SARDet-100K는 6개 카테고리에서 116k 이미지 및 245k 인스턴스를 포함하며, SAR 물체 검출에 대한 COCO-스케일을 달성한다.
- 필터 증강 입력과 함께한 MSFA는 SAR 검출 성능을 크게 향상시키고 도메인 전달 격차를 줄인다.
- 대규모 광학 원격감지 데이터(두 번째 단계)로의 이단계 프리트레이닝은 미세조정 결과를 더욱 향상시키며, 더 큰 프리트레이닝 데이터셋이 더 큰 이득을 준다.
- MSFA는 오픈 소스 방법들 가운데 SSDD 및 HRSID 벤치마크에서 최첨단 결과를 달성하고, 기존 SAR 탐지기들보다 우수하다.
- MSFA는 탐지기와 백본 전반에서 강건한 일반화 성능을 보이며, 모델 크기가 커질수록 이득이 지속된다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.