Skip to main content
QUICK REVIEW

[论文解读] Thingi10K: A Dataset of 10,000 3D-Printing Models

Qingnan Zhou, Alec Jacobson|arXiv (Cornell University)|May 16, 2016
3D Shape Modeling and Analysis被引用 202
一句话总结

Thingi10K 提供一个大规模的现实世界数据集,包含来自 Thingiverse 的 10,000 个 3D 打印模型,并附带几何与上下文分析,以及用于子集选择的在线查询接口。

ABSTRACT

Empirically validating new 3D-printing related algorithms and implementations requires testing data representative of inputs encountered \emph{in the wild}. An ideal benchmarking dataset should not only draw from the same distribution of shapes people print in terms of class (e.g., toys, mechanisms, jewelry), representation type (e.g., triangle soup meshes) and complexity (e.g., number of facets), but should also capture problems and artifacts endemic to 3D printing models (e.g., self-intersections, non-manifoldness). We observe that the contextual and geometric characteristics of 3D printing models differ significantly from those used for computer graphics applications, not to mention standard models (e.g., Stanford bunny, Armadillo, Fertility). We present a new dataset of 10,000 models collected from an online 3D printing model-sharing database. Via analysis of both geometric (e.g., triangle aspect ratios, manifoldness) and contextual (e.g., licenses, tags, classes) characteristics, we demonstrate that this dataset represents a more concise summary of real-world models used for 3D printing compared to existing datasets. To facilitate future research endeavors, we also present an online query interface to select subsets of the dataset according to project-specific characteristics. The complete dataset and per-model statistical data are freely available to the public.

研究动机与目标

  • 提供一个具有代表性且真实世界的 3D 打印模型数据集,以对几何处理与制造流水线进行稳健测试。
  • 分析模型的几何属性(流形性、自相交、属度等)以及上下文元数据(许可、标签、类别)。
  • 将 Thingi10K 与现有数据集进行比较,以突出现实世界打印特征。
  • 提供公开查询接口和可下载数据,以促进研究和可重复性。

提出的方法

  • 从Thingiverse爬取并整理 10,000 个模型,聚焦于精选对象以反映高质量设计。
  • 分析几何属性,包括顶点数、组件数、属度、网格质量指标和自相交。
  • 与 MPZ14 和 ShapeNetCore 进行比较,以表征真实感和打印适用性的差异。
  • 标注上下文信息,如类别、子类别,以及 4,892 个不同标签,再加上许可信息。
  • 提供在线查询接口,按组合几何与上下文条件筛选模型。
  • 公开数据集及每个模型的统计信息。

实验结果

研究问题

  • RQ1与现有数据集相比,基于 Thingiverse 的模型在现实世界 3D 打印输入中的代表性如何?
  • RQ2野外(实际应用中)的 3D 打印模型的常见几何质量特征有哪些(例如流形性、自相交、属度、组件结构等)?
  • RQ3上下文注释(标签、许可、类别)如何与与制造相关的几何属性相关?
  • RQ4研究者是否可以通过在线接口高效地检索符合特定制造或处理标准的数据子集?

主要发现

  • Thingi10K 数据集包含来自 Thingiverse 的 10,000 个模型,涵盖 2,011 个独立的事物,由 1,083 位用户设计。
  • 大多数模型为 STL(9,956),OBJ(42)、PLY(1)和 OFF(1)为少数。
  • 29% 的模型具有多于一个组件,表明在打印设计中常见的多组件结构。
  • Thingi10K 的属度分布比 MPZ14 和 ShapeNetCore 更广,具有更高的潜在属度值。
  • 与 MPZ14 和 ShapeNetCore 相比,Thingi10K 展现了更现实的网格质量混合,包括自相交和非理想三角形的存在,反映现实世界的打印约束。
  • 该数据集包含丰富的上下文注释(4892 个不同标签)和开放许可,并提供用于子集选择的在线查询接口。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。