[논문 리뷰] Thingi10K: A Dataset of 10,000 3D-Printing Models
Thingi10K는 Thingiverse의 10,000개 3D 프린팅 모델로 구성된 대규모 실제(real-world) 데이터셋을 제시하며, 기하학적 및 맥락 분석과 하위 집합 선정을 위한 온라인 질의 인터페이스를 동반합니다.
Empirically validating new 3D-printing related algorithms and implementations requires testing data representative of inputs encountered \emph{in the wild}. An ideal benchmarking dataset should not only draw from the same distribution of shapes people print in terms of class (e.g., toys, mechanisms, jewelry), representation type (e.g., triangle soup meshes) and complexity (e.g., number of facets), but should also capture problems and artifacts endemic to 3D printing models (e.g., self-intersections, non-manifoldness). We observe that the contextual and geometric characteristics of 3D printing models differ significantly from those used for computer graphics applications, not to mention standard models (e.g., Stanford bunny, Armadillo, Fertility). We present a new dataset of 10,000 models collected from an online 3D printing model-sharing database. Via analysis of both geometric (e.g., triangle aspect ratios, manifoldness) and contextual (e.g., licenses, tags, classes) characteristics, we demonstrate that this dataset represents a more concise summary of real-world models used for 3D printing compared to existing datasets. To facilitate future research endeavors, we also present an online query interface to select subsets of the dataset according to project-specific characteristics. The complete dataset and per-model statistical data are freely available to the public.
연구 동기 및 목표
- 지오메트리 처리 및 제조 파이프라인의 강건한 테스트를 위한 대표적이고 실제(real-world) 3D 프린팅 모델 데이터셋 제공.
- 모델의 기하학적 속성(다양체성, 자기 교차, genus, 등)과 맥락 메타데이터(라이선스, 태그, 카테고리) 분석.
- Thingi10K를 기존 데이터셋과 비교하여 실제 프린팅 특성을 강조합니다.
- 연구 및 재현성을 촉진하기 위한 공개 질의 인터페이스와 다운로드 가능한 데이터를 제공합니다.
제안 방법
- Thingiverse에서 10,000개 모델을 크롤링하고 큐레이션하며, 고품질 디자인을 반영하기 위해 featured things에 집중합니다.
- 정점 수, 구성 요소 수, genus, 메시 품질 지표, 자기 교차를 포함한 기하학적 속성을 분석합니다.
- MPZ14 및 ShapeNetCore와 비교하여 현실성 및 프린팅 적합성의 차이를 특성화합니다.
- 카테고리, 하위 카테고리, 4,892개의 서로 다른 태그를 포함한 맥락 정보와 라이선스를 주석화합니다.
- 결합된 기하학적 및 맥락적 기준에 따라 모델을 필터링하는 온라인 질의 인터페이스를 제공합니다.
- 데이터셋 및 모델별 통계를 공개적으로 이용 가능하게 만듭니다.
실험 결과
연구 질문
- RQ1Thingiverse 기반 모델이 기존 데이터셋에 비해 실제 3D 프린팅 입력으로 얼마나 대표적입니까?
- RQ2현장에서의 3D 프린팅 모델의 일반적인 기하학적 품질 특성은 무엇입니까(예: 다양체성, 자기 교차, genus, 구성 요소 구조)?
- RQ3맥락 주석(태그, 라이선스, 카테고리)이 제조에 관련된 기하학적 속성과 어떻게 상관관계가 있습니까?
- RQ4연구자들이 온라인 인터페이스를 통해 특정 제조 또는 처리 기준을 충족하는 데이터셋의 하위 집합을 효율적으로 검색할 수 있습니까?
주요 결과
- The Thingi10K 데이터셋은 Thingiverse의 10,000개 모델을 포함하며 2,011개의 고유한 thing를 1,083명의 사용자에 의해 설계되었습니다.
- 대부분의 모델은 STL (9,956)이며, OBJ (42), PLY (1), OFF (1)은 소수에 속합니다.
- 모델의 29%가 1개 이상의 구성 요소를 가지고 있어 출력 설계에서 다중 구성 요소 구조가 흔함을 나타냅니다.
- The genus distribution in Thingi10K is broader than MPZ14 and ShapeNetCore, with higher possible genus values.
- Compared to MPZ14 and ShapeNetCore, Thingi10K shows a more realistic mix of mesh quality, including presence of self-intersections and non-ideal triangles, reflecting real-world printing constraints.
- 데이터셋은 풍부한 맥락 주석(4892개의 구별된 태그)과 오픈 라이선스를 포함하며, 부분집합 선정을 위한 온라인 질의 인터페이스를 제공합니다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.