Skip to main content
QUICK REVIEW

[논문 리뷰] Orb-v3: atomistic simulation at scale

Bradley J. Rhodes, Sander Vandenhaute|ArXiv.org|2025. 04. 08.
Machine Learning in Materials Science인용 수 16
한 줄 요약

Orb-v3는 범용적이고 확장 가능한 일체의 원자간 포텐셜 세트를 도입하여 속도와 메모리를 크게 개선하면서도 높은 정확도를 유지합니다; 비보존적 직접 모델은 음향 및 특성 벤치마크에서 최첨단 성능에 맞먹거나 초과할 수 있습니다.

ABSTRACT

We introduce Orb-v3, the next generation of the Orb family of universal interatomic potentials. Models in this family expand the performance-speed-memory Pareto frontier, offering near SoTA performance across a range of evaluations with a >10x reduction in latency and > 8x reduction in memory. Our experiments systematically traverse this frontier, charting the trade-off induced by roto-equivariance, conservatism and graph sparsity. Contrary to recent literature, we find that non-equivariant, non-conservative architectures can accurately model physical properties, including those which require higher-order derivatives of the potential energy surface. This model release is guided by the principle that the most valuable foundation models for atomic simulation will excel on all fronts: accuracy, latency and system size scalability. The reward for doing so is a new era of computational chemistry driven by high-throughput and mesoscale all-atom simulations.

연구 동기 및 목표

  • Accuracy와 대용량 고처리량 시뮬레이션을 결합한 보편적 MLIPs 필요성에 대한 동기 부여.
  • 성능-속도-메모리 Pareto 프런티어 근처의 확장 가능한 솔루션으로 Orb-v3 패밀리를 제시.
  • 설계 선택(보존성, 이웃 한계, 데이터셋)이 정확도와 확장성에 미치는 영향 조사.
  • 실용적 MD 워크플로우를 위한 회전 불변성 향상 및 불확실성 추정 제공 기법 시연.

제안 방법

  • Orb-v3를 Orb-v2와 동일한 기본 아키텍처를 갖되 속도 및 메모리 효율성을 위해 컴파일 및 확장한 가족으로 제안.
  • 직접(비보존) 및 보존적 힘/포텐셜 형식을 모두 사용하여 Pareto 프런티어를 탐색.
  • conservative 모델의 roto-equivariance를 유도하는 gradient-based 정규화인 equigrad를 도입.
  • 대규모 데이터셋(OMat24 AIMD 부분집합; 호환성을 위한 mpa)으로 학습하고 보존적 모델에서 직접 모델로의 증류를 적용하여 고차 도함수 정확도 향상.
  • 효율적 그래프 구성, 제한된 이웃 수, GPU 가속 인접 이웃 루틴을 구현해 높은 처리량 달성.
  • 활발한 학습 및 필터링을 위한 힘 오차를 예측하는 고유 원자당 신뢰도(head)를 제공.
Figure 1 : The Pareto frontier for a range of universal Machine Learning Interatomic Potentials. The $K_{SRME}$ metric assesses a model’s ability to predict thermal conductivity via the Wigner formulation of heat transport [ 31 ] and requires accurate geometry optimizations as well as second and thi
Figure 1 : The Pareto frontier for a range of universal Machine Learning Interatomic Potentials. The $K_{SRME}$ metric assesses a model’s ability to predict thermal conductivity via the Wigner formulation of heat transport [ 31 ] and requires accurate geometry optimizations as well as second and thi

실험 결과

연구 질문

  • RQ1비보존적 비동등 아키텍처가 빠른 속도와 메모리 효율성을 제공하면서 열역학 및 음향 예측에서도 경쟁력을 달성할 수 있는가?
  • RQ2보존성, 이웃 한계 및 학습 데이터셋이 다양한 특성에서 보편적 MLIPs의 정확도와 확장성에 어떤 영향을 미치는가?
  • RQ3 Orb-v3 모델에서 기하학적 최적화, 고차 도함수 정확성, MD 안정성 사이의 트레이드오프는 무엇인가?
  • RQ4equigrad 정규화가 성능 손실 없이 회전 불변성 및 대칭 기반 워크플로우를 개선할 수 있는가?

주요 결과

모델F1 ↑κ_SRME ↓초당 스텝 수(1k 원자) ↑
eSEN-30M-OAM [ 40 ]0.9250.170
SevenNet-MF-ompa [ 29 ]0.9010.3173.5
GRACE-2L-OAM [ 23 ]0.8800.294
MACE-MPA-0 [ 21 ]0.8520.41221.2
DPA3-v2-OpenLAM [ 45 ]0.8900.687
MatterSim v1 5M [ 34 ]0.8620.57418.8
eqV2 M [ 14 ]0.9171.771OOM
ORB v2 [ 28 ]0.8801.73288.3
Orb-v3-direct-20-mpa0.8770.668216.5
Orb-v3-direct-inf-mpa0.8830.348125.0
Orb-v3-conservative-20-mpa0.9020.45741.2
Orb-v3-conservative-inf-mpa0.9060.21028.1
Orb-v3-direct-20-omat0.472216.5
Orb-v3-direct-inf-omat0.575125.0
Orb-v3-conservative-20-omat0.41341.2
Orb-v3-conservative-inf-omat0.21628.1
  • Orb-v3-direct-20-omat 및 Orb-v3-direct-inf-omat는 초당 수백 번의 순전달 및 대규모 시스템에서 0.5초 이하의 처리 시간을 가능하게 하는 강력한 속도/메모리 이점을 달성합니다.
  • 비보존적 직접 모델은 음향 및 열전도도 작업을 포함한 여러 벤치마크에서 최첨단 성능에 맞먹거나 이를 상회할 수 있습니다.
  • Equigrad 정규화는 회전 불변성과 대칭 가이드 워크플로우의 견고성을 크게 향상시킵니다.
  • Conservative-inf-omat 모델은 여러 물리 특성 벤치마크에서 가장 높은 정확도를 달성하는 동시에 많은 경쟁자들보다 빠른 실행 시간을 유지합니다.
  • Orb-v3 모델은 우수한 확장성을 보이며 direct-20-omat의 경우 100k-원자 테스트에 32.8 GB GPU 메모리가 필요하고 0.5초 미만에 완료되어 처리량의 큰 도약을 보여줍니다.
  • Intrinsic per-atom confidence estimates correlate with force errors and can aid active learning and data curation.
Figure 2 : Speed + max GPU memory allocated on an NVIDIA H200 for the computation of energies, forces and stress. The batch size is fixed to 1, but we vary the number of atoms across the subplots. Relative times are computed with respect to the fastest model: orb-v3 Direct (20 neighbors) . Times inc
Figure 2 : Speed + max GPU memory allocated on an NVIDIA H200 for the computation of energies, forces and stress. The batch size is fixed to 1, but we vary the number of atoms across the subplots. Relative times are computed with respect to the fastest model: orb-v3 Direct (20 neighbors) . Times inc

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.