[論文レビュー] Pointer-CAD: Unifying B-Rep and Command Sequences via Pointer-based Edges & Faces Selection
Pointer-CADは、B-repのエッジとフェイスを直接参照するポインター型コマンド列を導入し、複雑な編集(例:角取り、丸め)を可能にし、量子化誤差を低減するとともに、prior B-repジオメトリに条件付けられたLLMベースの多段階CAD生成フレームワークを提供します。
Constructing computer-aided design (CAD) models is labor-intensive but essential for engineering and manufacturing. Recent advances in Large Language Models (LLMs) have inspired the LLM-based CAD generation by representing CAD as command sequences. But these methods struggle in practical scenarios because command sequence representation does not support entity selection (e.g. faces or edges), limiting its ability to support complex editing operations such as chamfer or fillet. Further, the discretization of a continuous variable during sketch and extrude operations may result in topological errors. To address these limitations, we present Pointer-CAD, a novel LLM-based CAD generation framework that leverages a pointer-based command sequence representation to explicitly incorporate the geometric information of B-rep models into sequential modeling. In particular, Pointer-CAD decomposes CAD model generation into steps, conditioning the generation of each subsequent step on both the textual description and the B-rep generated from previous steps. Whenever an operation requires the selection of a specific geometric entity, the LLM predicts a Pointer that selects the most feature-consistent candidate from the available set. Such a selection operation also reduces the quantization error in the command sequence-based representation. To support the training of Pointer-CAD, we develop a data annotation pipeline that produces expert-level natural language descriptions and apply it to build a dataset of approximately 575K CAD models. Extensive experimental results demonstrate that Pointer-CAD effectively supports the generation of complex geometric structures and reduces segmentation error to an extremely low level, achieving a significant improvement over prior command sequence methods, thereby significantly mitigating the topological inaccuracies introduced by quantization error.
研究の動機と目的
- コマのコマンド列CAD生成が、エンティティ選択と前例作業におけるトポロジ的エラーで苦戦する点を動機づける。
- 生成中に明示的にB-rep要素を参照するポインター-based表現を提案する。
- 蓄積されたB-repジオメトリを条件付けとした多段階のテキスト→CADフレームワークとしてPointer-CADを開発する。
- 約575Kモデルの専門家アノテーションデータセットを構築し、手法を訓練・評価する。
- 従来のコマンド列手法と比較して幾何学的忠実度とトポロジーの改善を実証する。
提案手法
- ポインター型表現における三つのトークンタイプを導入する:ラベルトークン、値トークン、B-rep要素へのポインター。
- テキストと前のB-repに条件付けて、スケッチ→押出し、面取り、フィレットなどの連続的なステップにCADモデル構築を分解する。
- B-repからのフェース隣接グラフを構築し、グラフニューラルネットワークを用いて局所特徴を伝播させ、LLM入力を生成する。
- LoRA微調整を施したQwen2.5ベースのLLMを用い、各ステップのトークンとポインターを予測し、それを実行可能なCADコマンドへ変換する。
- 予測と候補埋め込み間のコサイン類似度を用いてターゲットフェース/エッジを選択するポインター機構を実装する。
- ラベル/値トークン予測(ラベルスムージングを用いたクロスエントロピー)とポインター予測(対比的類似Loss風の組合せ)を共同目的で訓練する。

実験結果
リサーチクエスチョン
- RQ1ポインター型コマンド表現は複雑なCAD編集のための明示的エンティティ選択を可能にするか。
- RQ2多段階生成フレームワークで進化するB-repを条件付けることは、トポロジ的忠実度と幾何学的精度を改善するか。
- RQ3グラフベースのB-repエンコードとLLMの組み合わせは、コマンド列の品質と下流のCAD有効性に影響を与えるか。
- RQ4従来のコマンド列と比較して、面取り/円滑処理のサポートと全体的なトポロジー品質にどのような改善が見られるか。
- RQ5実行可能なCADスクリプトを生成する際、既存のテキスト→CADベースラインや汎用LLMと比較してどの程度の性能を示すか。
主な発見
- Pointer-CADは、従来のコマンド列手法よりもコマンド精度と幾何学的忠実度を向上させる。
- ポインター機構によりフェース/エッジの明示的選択が可能となり、角取りやフィレット操作をサポートする。
- 蓄積されたB-repを条件付けとした多段階生成プロセスは量子化とトポロジーの誤差を低減する。
- GNNで補強されたB-rep表現は円弧関連のジオメトリ再構成を大幅に向上させる。
- フレームワークはベースラインと比較して優れたトポロジー品質と watertightness 指標を達成する。
- 実験ではPointer-CADが一部のベースラインに比べて小型のLLMバックボーンで良好な性能を示す。

より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。