[논문 리뷰] WaveComm: Lightweight Communication for Collaborative Perception via Wavelet Feature Distillation
WaveComm은 BEV 특징의 저주파 웨이브렛 구성요소만 전송하고 경량 제너레이터로 고주파 디테일을 재구성하여 대역폭 감소 하에서도 강한 인식 성능을 달성함.
In multi-agent collaborative sensing systems, substantial communication overhead from information exchange significantly limits scalability and real-time performance, especially in bandwidth-constrained environments. This often results in degraded performance and reduced reliability. To address this challenge, we propose WaveComm, a wavelet-based communication framework that drastically reduces transmission loads while preserving sensing performance in low-bandwidth scenarios. The core innovation of WaveComm lies in decomposing feature maps using Discrete Wavelet Transform (DWT), transmitting only compact low-frequency components to minimize communication overhead. High-frequency details are omitted, and their effects are reconstructed at the receiver side using a lightweight generator. A Multi-Scale Distillation (MSD) Loss is employed to optimize the reconstruction quality across pixel, structural, semantic, and distributional levels. Experiments on the OPV2V and DAIR-V2X datasets for LiDAR-based and camera-based perception tasks demonstrate that WaveComm maintains state-of-the-art performance even when the communication volume is reduced to 86.3% and 87.0% of the original, respectively. Compared to existing approaches, WaveComm achieves competitive improvements in both communication efficiency and perception accuracy. Ablation studies further validate the effectiveness of its key components.
연구 동기 및 목표
- 대역폭 제약 시나리오에서 협업 인식의 통신 오버헤드를 줄이는 것을 동기로 한다.
- 저주파 특징 구성요소를 전송하고 수신단에서 고주파 디테일을 재구성하는 웨이브렛 기반 프레임워크를 제안한다.
- 픽셀, 구조적, 의미론적, 분포적 수준에서 재구성을 최적화하기 위한 다중 스케일 증류 손실을 개발한다.
- 저주파 웨이브렛 구성요소를 전송하면 재구성된 특징이 크게 감소된 통신 용량에서 인식 정확도를 유지하는 것을 보여준다.
제안 방법
- BEV 특징에 이산 웨이블렛 변환(DWT)을 적용하여 저주파 및 고주파 성분을 구분한다.
- 협력 링크를 통해 저주파 성분만 전송하여 대역폭을 줄인다.
- 수신단에서 경량의 Wavelet Generator를 사용하여 저주파 입력으로 전체 특징을 재구성하고 재구성 대상 및 적대 학습으로 감독한다.
- Wavelet Discriminator와 재구성, SSIM, 지각, 그리고 적대 항으로 구성된 MSD Loss를 사용하여 생성기를 학습한다.
- 다중 에이전트에서 재구성된 특징을 Ego 좌표계의 셀별 소프트맥스 가중치를 사용하여 Pyramid Fusion 네트워크로 융합한다.
- 데이터셋 OPV2V와 DAIR-V2X를 사용하여 LiDAR 기반 및 카메라 기반 인식 작업에서 지정된 통신 예산 하에 엔드투엔드로 학습한다.
실험 결과
연구 질문
- RQ1웨이블릿 기반 저주파 분해가 에이전트 간 통신을 줄이면서 탐지 정확도를 유지할 수 있는가?
- RQ2Wavelet Feature Distillation 모듈은 대역폭 제약 하에서 고주파 디테일 재구성과 다운스트림 인식 작업에 어떤 보조를 제공하는가?
- RQ3다중 스케일 증류 손실이 재구성 품질 및 탐지 성능에 미치는 영향은 무엇인가?
- RQ4WaveComm은 정확도와 대역폭 측면에서 최첨단 통신 효율적 협력 인식 방법과 어떻게 비교되는가?
- RQ5다중 레벨 웨이블렛 분해가 varying bandwidth budget에서 이점이 있는가?
주요 결과
- WaveComm은 평가된 데이터셋에서 대략 86–87%의 통신 용량 감소에도 최첨단 인식 성능을 유지한다.
- Wavelet Generator는 재구성만으로 IDWT를 단독으로 사용하는 것보다 탐지를 위한 사용 가능한 특징 재구성에서 우수하다.
- 제안된 재구성과 함께 저주파 구성요소만 전송하는 경우 카메라 및 LiDAR 모달리티에 걸쳐 여러 기준선 대비 경쟁력 있는 이점을 제공한다.
- 다중 스케일 증류 손실(pixels, structural, semantic, adversarial)은 특징 재구성의 충실도와 다운스트림 탐지 정확도를 공동으로 향상시킨다.
- 1레벨 웨이블렛 변환이 테스트된 레벨 중 최상의 성능을 제공하는 반면, 더 높은 레벨에서는 피처 손실이 과도해 수익이 감소한다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.