[論文レビュー] Thingi10K: A Dataset of 10,000 3D-Printing Models
Thingi10K は Thingiverse の 10,000 の 3Dプリントモデルから成る大規模で現実世界のデータセットを提示し、それに伴う幾何的および文脈的分析と、サブセット選択のためのオンラインクエリインターフェースを提供します。
Empirically validating new 3D-printing related algorithms and implementations requires testing data representative of inputs encountered \emph{in the wild}. An ideal benchmarking dataset should not only draw from the same distribution of shapes people print in terms of class (e.g., toys, mechanisms, jewelry), representation type (e.g., triangle soup meshes) and complexity (e.g., number of facets), but should also capture problems and artifacts endemic to 3D printing models (e.g., self-intersections, non-manifoldness). We observe that the contextual and geometric characteristics of 3D printing models differ significantly from those used for computer graphics applications, not to mention standard models (e.g., Stanford bunny, Armadillo, Fertility). We present a new dataset of 10,000 models collected from an online 3D printing model-sharing database. Via analysis of both geometric (e.g., triangle aspect ratios, manifoldness) and contextual (e.g., licenses, tags, classes) characteristics, we demonstrate that this dataset represents a more concise summary of real-world models used for 3D printing compared to existing datasets. To facilitate future research endeavors, we also present an online query interface to select subsets of the dataset according to project-specific characteristics. The complete dataset and per-model statistical data are freely available to the public.
研究の動機と目的
- 幾何処理と製造パイプラインの堅牢なテストのための、代表的で現実世界の 3Dプリントモデルデータセットを提供する。
- モデルの幾何特性(マニフォールド性、自己交差、属数、等)と文脈的メタデータ(ライセンス、タグ、カテゴリ)を分析する。
- Thingi10K を既存データセットと比較し、現実世界の印刷特性を浮き彫りにする。
- 研究と再現性を促進するため、公開クエリインターフェースとダウンロード可能なデータを提供する。
提案手法
- Thingiverse から 10,000 のモデルをクロールしてキュレーションし、ハイ品質なデザインを反映するように featured なものに焦点を当てる。
- 頂点数、部品数、genus、メッシュ品質指標、自己交差など、幾何特性を分析する。
- MPZ14 および ShapeNetCore と比較して、リアリズムと印刷適合性の差異を特徴づける。
- カテゴリ、サブカテゴリ、4,892 個の異なるタグ、さらにはライセンスなどの文脈情報を注釈付けする。
- 幾何と文脈の組み合わせた基準でモデルをフィルタリングするオンラインクエリインターフェースを提供する。
- データセットと個別モデルの統計を公開する。
実験結果
リサーチクエスチョン
- RQ1Thingiverse ベースのモデルは、既存データセットと比較して現実世界の 3Dプリント入力をどれだけ代表しているか?
- RQ2野外の 3D プリンティングモデルにおける一般的な幾何品質特性は何か(例:マニフォールド性、自己交差、genus、部品構造)?
- RQ3文脈的注釈(タグ、ライセンス、カテゴリ)は、製造に関連する幾何特性とどのように相関するか?
- RQ4研究者はオンラインインターフェースを介して、特定の製造または処理基準を満たすデータセットのサブセットを効率的に取得できるか?
主な発見
- The Thingi10K dataset contains 10,000 models from Thingiverse spanning 2,011 unique things designed by 1,083 users.
- Most models are STL (9,956), with a minority in OBJ (42), PLY (1), and OFF (1).
- 29% of models have more than one component, indicating multi-component structures common in printed designs.
- The genus distribution in Thingi10K is broader than MPZ14 and ShapeNetCore, with higher possible genus values.
- Compared to MPZ14 and ShapeNetCore, Thingi10K shows a more realistic mix of mesh quality, including presence of self-intersections and non-ideal triangles, reflecting real-world printing constraints.
- The dataset includes rich contextual annotations (4892 distinct tags) and open licenses, with an online query interface for subset selection.
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。