[论文解读] PCRNet: Point Cloud Registration Network using PointNet Encoding
PCRNet 使用一个 Siamese PointNet 编码来直接估计点云配准的刚性变换,具有用于更高精度的迭代变体;在噪声鲁棒性和速度方面超越了若干基线。
PointNet has recently emerged as a popular representation for unstructured point cloud data, allowing application of deep learning to tasks such as object detection, segmentation and shape completion. However, recent works in literature have shown the sensitivity of the PointNet representation to pose misalignment. This paper presents a novel framework that uses the PointNet representation to align point clouds and perform registration for applications such as tracking, 3D reconstruction and pose estimation. We develop a framework that compares PointNet features of template and source point clouds to find the transformation that aligns them accurately. Depending on the prior information about the shape of the object formed by the point clouds, our framework can produce approaches that are shape specific or general to unseen shapes. The shape specific approach uses a Siamese architecture with fully connected (FC) layers and is robust to noise and initial misalignment in data. We perform extensive simulation and real-world experiments to validate the efficacy of our approach and compare the performance with state-of-art approaches.
研究动机与目标
- 在错位和噪声下,利用 PointNet 表示来促进非结构化点云的配准。
- 开发一个既可针对特定形状又可泛化到未见形状的配准框架。
- 提出单-shot 和迭代两种 PCRNet 架构,用于估计 SE(3) 变换。
- 评估相对于 ICP、Go-ICP、PointNetLK 等基线的鲁棒性、速度和精度。
- 展示在真实世界数据上的适用性以及与下游任务的潜在集成。
提出的方法
- 使用一个 Siamese PointNet(五层 MLP:64-64-64-128-1024)对源点云和模板点云进行编码。
- 通过对称的最大池化计算全局特征,将其连接并通过五个全连接层回归一个 7D 变换(平移 t 在 R3,单位四元数 q 在 R4)。
- 以变换后的源点云与模板之间的 Earth Mover Distance (EMD) 作为损失函数进行训练。
- 提供一个迭代的 PCRNet 变体,通过应用连续估计 T(i) 来细化对齐,将 T(n)...T(1) 组合成最终姿态。
- 与基线(ICP、Go-ICP、PointNetLK)进行对比,并在不同的物体特定性和噪声条件下分析性能。
- 在 ModelNet40 上采用不同的数据方案(多类别/多模型、单一类别等)进行训练。
实验结果
研究问题
- RQ1基于 PointNet 的编码是否能够在没有显式对应关系的情况下实现两组无序点云的准确配准?
- RQ2形状特异性(类别/模型知识)如何影响配准精度和对噪声的鲁棒性?
- RQ3在速度和精度方面,单 shot 与迭代 PCRNet 的权衡是什么?
- RQ4在合成数据和真实世界数据上,PCRNet 与已建立的基线(ICP、Go-ICP、PointNetLK)相比如何?
- RQ5该方法对高斯噪声是否鲁棒并且能泛化到未见类别?
主要发现
| 算法 | 旋转误差均值(度) | 旋转误差标准差(度) | 平移误差均值 | 平移误差标准差 | 时间(ms) | AUC 均值 | AUC 标准差 |
|---|---|---|---|---|---|---|---|
| PCRNet | 8.82 | 4.82 | 0.0077 | 0.0008 | 1.89 | 0.9544 | |
| Iterative PCRNet | 1.03 | 2.56 | 0.0085 | 0.0024 | 146 | 0.9943 | |
| PointNetLK [2] | 51.80 | 29.63 | 0.8783 | 0.0054 | 234 | 0.7059 | |
| ICP [6] | 11.87 | 31.87 | 0.0282 | 0.0392 | 407 | 0.9321 | |
| Go-ICP [37] | 0.45 | 0.19 | 0.0016 | 0.0007 | 2.7e5 | 1.0000 |
- 迭代式 PCRNet 实现了较高的配准精度,接近 Go-ICP,但速度快出数量级。
- 单次 PCRNet 更快,但精度略低于迭代版本;两者在嘈杂条件下都显著优于 PointNetLK。
- 在包含若干表示能力的训练数据时,用面向对象特定数据训练的迭代 PCRNet 在未见类别上展现出强劲表现。
- PCRNet 对噪声和错位具有鲁棒性,在许多场景中优于 ICP,并提供实时可用的配准能力。
- Go-ICP 获得了最高的 AUC(1.0),但计算成本极高,而迭代 PCRNet 以更低的运行时提供具有竞争力的精度。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。