Skip to main content
QUICK REVIEW

[论文解读] WaveComm: Lightweight Communication for Collaborative Perception via Wavelet Feature Distillation

Erdemt Bao, Jin Mo Yang|arXiv (Cornell University)|Mar 9, 2026
Robotics and Sensor-Based Localization被引用 0
一句话总结

WaveComm 通过仅传输 BEV 特征的低频小波分量并用轻量级生成器重建高频细节,显著降低带宽同时保持感知性能。

ABSTRACT

In multi-agent collaborative sensing systems, substantial communication overhead from information exchange significantly limits scalability and real-time performance, especially in bandwidth-constrained environments. This often results in degraded performance and reduced reliability. To address this challenge, we propose WaveComm, a wavelet-based communication framework that drastically reduces transmission loads while preserving sensing performance in low-bandwidth scenarios. The core innovation of WaveComm lies in decomposing feature maps using Discrete Wavelet Transform (DWT), transmitting only compact low-frequency components to minimize communication overhead. High-frequency details are omitted, and their effects are reconstructed at the receiver side using a lightweight generator. A Multi-Scale Distillation (MSD) Loss is employed to optimize the reconstruction quality across pixel, structural, semantic, and distributional levels. Experiments on the OPV2V and DAIR-V2X datasets for LiDAR-based and camera-based perception tasks demonstrate that WaveComm maintains state-of-the-art performance even when the communication volume is reduced to 86.3% and 87.0% of the original, respectively. Compared to existing approaches, WaveComm achieves competitive improvements in both communication efficiency and perception accuracy. Ablation studies further validate the effectiveness of its key components.

研究动机与目标

  • 在带宽受限场景下推动协作感知中的通信开销减少的动机.
  • 提出一个基于小波的框架,在接收端传输低频特征分量的同时重建高频细节.
  • 开发一种多尺度蒸馏损失以在像素、结构、语义和分布层面优化重建效果.
  • 证明传输低频小波分量在显著降低通信量的同时维持感知准确性。

提出的方法

  • 对 BEV 特征应用离散小波变换(DWT),将低频和高频分量分离。
  • 通过协作链路仅传输低频分量以降低带宽。
  • 在接收端使用轻量级小波生成器从低频输入重建完整特征,并通过重建目标和对抗学习进行监督。
  • 使用小波判别器和多尺度蒸馏(MSD)损失(包含重建、SSIM、感知和对抗项)来训练生成器。
  • 利用金字塔融合网络在自我坐标下对来自多代理的重建特征进行逐单元 softmax 加权融合。
  • 在 LiDAR 基于感知和基于摄像机的感知任务上进行端到端训练,数据集为 OPV2V 和 DAIR-V2X,在指定通信预算下进行。

实验结果

研究问题

  • RQ1基于小波的低频分解是否在减少代理间通信的同时保持检测精度?
  • RQ2Wavelet Feature Distillation 模块在带宽约束下对高频细节的重建和下游感知任务的辅助效果如何?
  • RQ3多尺度蒸馏损失对重建质量和检测性能的影响如何?
  • RQ4相比最先进的高效通信协作感知方法,WaveComm 在准确性和带宽方面的表现如何?
  • RQ5在不同带宽预算下,分层小波分解是否有益?

主要发现

  • WaveComm 在评估数据集上将通信量减少至约 86–87% 的同时,维持了最先进的感知性能。
  • Wavelet Generator 在重建可用于检测的特征方面优于仅使用 IDWT。
  • 仅使用低频分量进行传输并通过提出的重建方法,在摄像机和 LiDAR 模态上对多项基线实现了具有竞争力的提升。
  • 多尺度蒸馏损失(像素、结构、语义、对抗)协同提升了特征重建保真度和下游检测准确性。
  • 消融实验显示在测试的层级中,1 级小波变换提供最佳性能,而更高层级由于特征损失过大而收益递减。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。