[논문 리뷰] SolidGen: An Autoregressive Model for Direct B-rep Synthesis
SolidGen은 Transformer 기반의 autoregressive 모델과 새로 개발된 indexed B-rep 표현을 사용하여 경계 표현(B-rep) CAD 데이터를 직접 생성하며, CAD 모델링 연산 시퀀스를 사용하지 않고도 무조건 및 조건부 생성을 가능하게 한다.
The Boundary representation (B-rep) format is the de-facto shape representation in computer-aided design (CAD) to model solid and sheet objects. Recent approaches to generating CAD models have focused on learning sketch-and-extrude modeling sequences that are executed by a solid modeling kernel in postprocess to recover a B-rep. In this paper we present a new approach that enables learning from and synthesizing B-reps without the need for supervision through CAD modeling sequence data. Our method SolidGen, is an autoregressive neural network that models the B-rep directly by predicting the vertices, edges, and faces using Transformer-based and pointer neural networks. Key to achieving this is our Indexed Boundary Representation that references B-rep vertices, edges and faces in a well-defined hierarchy to capture the geometric and topological relations suitable for use with machine learning. SolidGen can be easily conditioned on contexts e.g., class labels, images, and voxels thanks to its probabilistic modeling of the B-rep distribution. We demonstrate qualitatively, quantitatively, and through perceptual evaluation by human subjects that SolidGen can produce high quality, realistic CAD models.
연구 동기 및 목표
- CAD 연산 시퀀스로부터 감독 없이 B-rep 데이터를 직접 합성하는 방법을 제안한다.
- 머신러닝에 적합한 indexed Boundary Representation를 도입한다.
- B-rep의 무조건적 및 조건부 생성을 시연하고 인간 지각 연구를 통해 현실성을 평가한다.
제안 방법
- B-rep 구성요소(V, E, F)의 결합 분포 p(B)를 p(F|E,V)p(E|V)p(V)로 모델링하고 autoregressive Transformer 기반 네트워크를 사용해 팩토라이즈한다.
- B-rep를 Indexed Boundary Representation으로 표현하여 V, E, F를 수치 배열로 저장하여 머신러닝 호환성을 확보한다.
- 토큰을 시퀀스 형태로 예측하기 위해 Transformer 디코더와 포인터 메커니즘이 구현된 독립된 정점(Vertex), 간선(Edge), 면(Face) 모델을 사용한다.
- 컨텍스트 z(예: 클래스 레이블, 이미지, 보셀)로 조건화하여 분포 p(B|z)를 조건화한다.
- Indexed 표현으로부터 규칙 기반 후처리로 전체 B-rep를 복구하며, 이는 Solid Modeling 커널(OpenCascade)에 연결된다.
- 교사 강제(teacher-forcing)와 교차 엔트로피 손실로 학습하고 추론 시 nucleus 샘플링을 사용한다.
실험 결과
연구 질문
- RQ1autoregressive 모델을 통한 Direct B-rep 합성이 CAD 모델링 연산 시퀀스에 의존하지 않고 고품질의 현실적인 CAD 모델을 생성할 수 있는가?
- RQ2학습 가능하고 생성적 프레임워크에서 B-rep를 표현하는 Indexed Boundary Representation의 효과는 어떠한가?
- RQ3보조 컨텍스트(클래스 레이블, 이미지, 보셀)로 SolidGen을 어느 정도 조건화하여 제어 가능한 B-rep 생성을 가능하게 할 수 있는가?
- RQ4유효성, 새로움, 지각적 현실성 측면에서 SolidGen은 시퀀스 기반 baselines와 어떻게 비교되는가?
주요 결과
- SolidGen은 강한 토큰 수준 성능으로 고품질 B-rep 생성을 달성하며, Vertex, Edge, Face 모델이 테스트 데이터에서 낮은 NLL과 높은 Top-1 정확도를 보인다.
- 무조건적 SolidGen 샘플은 NLL 및 정확도에서 균일 베이스라인보다 큰 폭으로 우수하다(예: DeepCAD 테스트 세트에서 Total NLL 4.54 bits 및 평균 정확도 97.05%).
- 클래스 라벨, 이미지 또는 보셀로의 조건부 생성은 베이스라인 대비 큰 개선을 보여주며, 제어 가능한 B-rep 합성을 가능하게 한다.
- 무조건적 생성에서 SolidGen 샘플은 인간 지각 연구에서 경쟁력 있는 현실성을 보이며, 한 설정에서는 트레이닝 데이터보다 더 사실적으로 평가된 비율이 약 절반(52.67%)이었다.
- 표 기반의 정량적 결과는 데이터셋 전반에 걸쳐 강력한 성능을 보여준다(예: DeepCAD: SolidGen NLL 4.54 bits, 정확도 97.05%).
- Nucleus 샘플링은 타당도와 새로움/독창성 간의 트레이드오프를 제공하며, p 값이 높을수록 새로움은 증가하지만 타당도는 감소한다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.