[论文解读] Send Less, Perceive More: Masked Quantized Point Cloud Communication for Loss-Tolerant Collaborative Perception
QPoint2Comm 将 LiDAR 点云离散化为具有共享码本的离散索引,通过掩码训练实现对丢包的鲁棒性,并使用级联注意力融合实现低带宽下的高精度协同感知。
Collaborative perception allows connected vehicles to overcome occlusions and limited viewpoints by sharing sensory information. However, existing approaches struggle to achieve high accuracy under strict bandwidth constraints and remain highly vulnerable to random transmission packet loss. We introduce QPoint2Comm, a quantized point-cloud communication framework that dramatically reduces bandwidth while preserving high-fidelity 3D information. Instead of transmitting intermediate features, QPoint2Comm directly communicates quantized point-cloud indices using a shared codebook, enabling efficient reconstruction with lower bandwidth than feature-based methods. To ensure robustness to possible communication packet loss, we employ a masked training strategy that simulates random packet loss, allowing the model to maintain strong performance even under severe transmission failures. In addition, a cascade attention fusion module is proposed to enhance multi-vehicle information integration. Extensive experiments on both simulated and real-world datasets demonstrate that QPoint2Comm sets a new state of the art in accuracy, communication efficiency, and resilience to packet loss.
研究动机与目标
- 解决自动驾驶协同感知中的带宽约束和数据包丢失问题。
- 提出一种离散点云表示,通过共享码本传输紧凑的索引。
- 引入一种对丢包鲁棒的训练策略,在随机丢包下保持性能。
- 开发一个融合框架,通过对 ego 特征与协同线索进行级联注意力融合以实现稳健的多车感知。
提出的方法
- 使用共享码本(DCR)将 LiDAR 点云编码为离散码本索引以实现低带宽传输。
- 在车端从接收到的索引重构协同点云,采用双码本设计(占据与强度)。
- 应用掩码训练以模拟随机丢包,在推理阶段用可学习向量填充缺失特征。
- 通过金字塔尺度的级联注意力融合(PCAF)将自车特征与协同特征融合,以提升遮挡鲁棒性。
- 用基于置信度的特征筛选(CFF)过滤低置信的协同特征,并用边框筛选与偏移(BFO)对框进行 refined。
- 分两阶段训练:第一阶段学习离散点云表示,第二阶段进行带融合的三维目标检测。
实验结果
研究问题
- RQ1如何在显著降低带宽的同时,保持高质量的三维感知?
- RQ2是否存在一种对丢包鲁棒的训练方案,使协同感知在随机传输中也能保持稳定?
- RQ3在融合前对自车特征进行级联的协同线索处理,是否能提升对遮挡和定位误差的鲁棒性?
主要发现
| Model | OPV2V AP@0.7 | OPV2V AP@0.5 | DAIR-V2X AP@0.7 | DAIR-V2X AP@0.5 |
|---|---|---|---|---|
| 无融合 | 48.66 | 68.71 | 43.57 | 50.03 |
| 晚期融合 | 59.48 | 79.62 | 34.47 | 51.14 |
| 中间融合 | 70.82 | 88.41 | 39.38 | 56.22 |
| When2comm | 57.55 | 74.11 | 33.68 | 48.20 |
| DisoNet | 68.64 | 84.72 | 40.69 | 52.67 |
| Where2comm | 69.73 | 85.16 | 43.71 | 59.52 |
| V2X-ViT | 70.06 | 84.65 | 40.43 | 53.08 |
| ERMVP | 69.71 | 86.63 | 46.96 | 64.21 |
| SICP | 67.13 | 82.86 | 41.03 | 52.72 |
| mmCooper | 78.11 | 88.93 | 48.27 | 65.12 |
| Ours | 82.21 | 92.18 | 53.45 | 67.97 |
- QPoint2Comm 在 OPV2V 上 AP@0.7 提升了 4.10%,在 DAIR-V2X 上提升了 5.18%,相较于强基线。
- 由于离散码本索引传输,通信量保持在低且稳定水平(~14.95 的对数2尺度),并且延迟降低。
- 实验中掩码训练使鲁棒性覆盖到高达 40% 的丢包,超越大多数在高丢包场景的基线。
- 将原始点云量化比将中间特征量化能获得更高的检测精度。
- 提出的级联注意力融合通过逐步将协同线索引入自车特征,提升鲁棒性与精度。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。