Skip to main content
QUICK REVIEW

[论文解读] 3D Point Cloud Classification and Segmentation using 3D Modified Fisher Vector Representation for Convolutional Neural Networks

Yizhak Ben-Shabat, Michael Lindenbaum|arXiv (Cornell University)|Nov 22, 2017
3D Shape Modeling and Analysis参考文献 24被引用 49
一句话总结

本文提出3D改进Fisher向量(3DmFV),一种结合3D网格结构与连续Fisher向量分量的混合点云表征方法,通过一种新型CNN架构(3DmFV-Net)实现高效、精确的3D点云分类与部件分割。该方法在基准数据集上实现了最先进性能,具有较高的准确率与对噪声及数据损坏的鲁棒性,表明非学习特征可在无需端到端学习的情况下取得优异结果。

ABSTRACT

The point cloud is gaining prominence as a method for representing 3D shapes, but its irregular format poses a challenge for deep learning methods. The common solution of transforming the data into a 3D voxel grid introduces its own challenges, mainly large memory size. In this paper we propose a novel 3D point cloud representation called 3D Modified Fisher Vectors (3DmFV). Our representation is hybrid as it combines the discrete structure of a grid with continuous generalization of Fisher vectors, in a compact and computationally efficient way. Using the grid enables us to design a new CNN architecture for point cloud classification and part segmentation. In a series of experiments we demonstrate competitive performance or even better than state-of-the-art on challenging benchmark datasets.

研究动机与目标

  • 为解决卷积神经网络(CNN)在非结构化、无序3D点云上的应用挑战,这些点云天然不适合网格化架构。
  • 开发一种紧凑、计算高效且顺序不变的表征方法,以保留点云的细粒度细节,同时支持CNN处理。
  • 设计一种专为3DmFV表征量身定制的新3D CNN架构(3DmFV-Net),用于点云分类与部件分割。
  • 评估方法在常见真实世界数据损坏(如点删除、异常值、噪声和旋转)下的鲁棒性。
  • 证明非学习、手工设计的特征可实现最先进性能,挑战端到端学习始终必要的假设。

提出的方法

  • 3DmFV表征使用在3D网格上均匀分布的高斯混合模型(GMM)来编码点云数据,将其表示为相对于聚类中心的偏差。
  • 通过用点集的任意函数替代均值统计量,对Fisher向量进行泛化,从而生成更丰富、更具语义意义的特征分量。
  • 网格结构提供空间组织,同时保留连续、可微分的表征,使CNN能有效应用。
  • 设计了一种专用于3DmFV输入的新3DmFV-Net架构,利用3D卷积实现点云分类与部件分割。
  • 该方法在3DmFV特征上进行端到端训练,尽管特征本身是无监督且非学习的。
  • 通过在点删除、异常值、扰动噪声和随机旋转等不同损坏条件下进行训练与测试,评估鲁棒性。

实验结果

研究问题

  • RQ1结合离散网格结构与连续Fisher向量分量的混合表征是否能有效支持CNN进行3D点云分类?
  • RQ2使用非学习、无监督的特征表征(3DmFV)是否仍能在3D点云分析中实现最先进性能?
  • RQ33DmFV-Net在真实世界数据损坏(如点缺失、噪声和旋转)下的表现如何?
  • RQ43DmFV表征能否有效扩展至部件分割任务,并在类别不平衡数据集上取得具有竞争力的结果?
  • RQ5是否必须对所有组件进行端到端学习才能获得高性能,还是手工特征已足够?

主要发现

  • 3DmFV-Net在ModelNet10和ModelNet40基准测试中分别实现了84.3%和82.0%的平均类别准确率,达到最先进水平。
  • 在ShapeNet部件分割数据集上,该方法实现了94.0%的平均交并比(IoU),在总平均IoU上优于所有其他方法。
  • 在部件分割任务中,3DmFV-Net在16个类别中的9个类别上表现最佳,超过其他方法在最多4个类别中胜出的水平。
  • 模型对扰动噪声和均匀点删除表现出高度鲁棒性,在这些条件下准确率下降极小。
  • 性能在网格分辨率和输入点数增加时趋于饱和,表明超过特定阈值后收益递减。
  • 只要标准差不过小,方法对标准差选择不敏感,可避免出现空FV表征。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。