Skip to main content
QUICK REVIEW

[論文レビュー] WaveComm: Lightweight Communication for Collaborative Perception via Wavelet Feature Distillation

Erdemt Bao, Jin Mo Yang|arXiv (Cornell University)|Mar 9, 2026
Robotics and Sensor-Based Localization被引用数 0
ひとこと要約

WaveCommはBEV特徴の低周波ウェーブレット成分のみを送信し、軽量ジェネレータで高周波ディテールを再構成することで、帯域幅を削減しつつ強力な認識性能を達成する。

ABSTRACT

In multi-agent collaborative sensing systems, substantial communication overhead from information exchange significantly limits scalability and real-time performance, especially in bandwidth-constrained environments. This often results in degraded performance and reduced reliability. To address this challenge, we propose WaveComm, a wavelet-based communication framework that drastically reduces transmission loads while preserving sensing performance in low-bandwidth scenarios. The core innovation of WaveComm lies in decomposing feature maps using Discrete Wavelet Transform (DWT), transmitting only compact low-frequency components to minimize communication overhead. High-frequency details are omitted, and their effects are reconstructed at the receiver side using a lightweight generator. A Multi-Scale Distillation (MSD) Loss is employed to optimize the reconstruction quality across pixel, structural, semantic, and distributional levels. Experiments on the OPV2V and DAIR-V2X datasets for LiDAR-based and camera-based perception tasks demonstrate that WaveComm maintains state-of-the-art performance even when the communication volume is reduced to 86.3% and 87.0% of the original, respectively. Compared to existing approaches, WaveComm achieves competitive improvements in both communication efficiency and perception accuracy. Ablation studies further validate the effectiveness of its key components.

研究の動機と目的

  • 帯域幅制約シナリオにおける協調 perceptionの通信オーバーヘッドの削減を動機づける。
  • 低周波成分を送信し受信側で高周波ディテールを再構成するウェーブレットベースのフレームワークを提案する。
  • ピクセル、構造、意味、分布レベルで再構成を最適化するマルチスケール蒸留損失を開発する。
  • 低周波ウェーブレット成分の送信が通信量を大幅に削減しつつ認識精度を維持できることを示す。

提案手法

  • BEV特徴に離散ウェーブレット変換(DWT)を適用して低周波成分と高周波成分を分離する。
  • 帯域幅を削減するために協調リンク上で低周波成分のみを伝送する。
  • 受信側で軽量なWavelet Generatorを用いて低周波入力から全特徴を再構成し、再構成ターゲットと敵対学習によって監督する。
  • Wavelet DiscriminatorとMulti-Scale Distillation(MSD)Loss(再構成、SSIM、知覚的、敵対的項を含む)を用いてジェネレータを訓練する。
  • ego座標系でセルごとにソフトマックス加重を用いた Pyramid Fusionネットワークで複数エージェントから再構成された特徴を融合する。
  • OPV2VおよびDAIR-V2Xのデータセットを用い、指定された通信予算下でLiDARベースおよびカメラベースの perceptionタスクをエンドツーエンドで訓練する。

実験結果

リサーチクエスチョン

  • RQ1ウェーブレットベースの低周波分解はエージェント間通信を削減しつつ検出精度を維持できるか?
  • RQ2Wavelet Feature Distillationモジュールは高周波ディテールの再構成と下流の perceptionタスクにおいて帯域制約下でどの程度有効か?
  • RQ3マルチスケール蒸留損失が再構成品質と検出性能に与える影響は?
  • RQ4WaveCommは精度と帯域幅の観点で最先端の通信効率の協調 perception手法と比較してどうか?
  • RQ5多段ウェーブレット分解は変動する帯域予算の下で有効か?

主な発見

  • WaveCommは評価データセットで通信量を最大約86–87%削減しつつ最新の perception性能を維持している。
  • Wavelet Generatorは単独のIDWTよりも検出のための再構成可能な特徴表現を上回る。
  • 提案された再構成を用いて低周波成分のみを送信する手法は、カメラ・LiDARモダリティを横断して複数のベースラインより競争力のある利得を得る。
  • マルチスケール蒸留損失(ピクセル、構造、意味、敵対的)は特徴再構成の忠実度と下流の検出精度を協調的に改善する。
  • アブレーションの結果、1レベルのウェーブレット変換が試験したレベルの中で最良の性能を提供し、高レベル化に伴う特徴損失が過度となり収益の減少を招くことが示された。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。