Skip to main content
QUICK REVIEW

[論文レビュー] Orb-v3: atomistic simulation at scale

Bradley J. Rhodes, Sander Vandenhaute|ArXiv.org|Apr 8, 2025
Machine Learning in Materials Science被引用数 16
ひとこと要約

Orb-v3 は普遍的でスケーラブルな一連の原子間ポテンシャルを導入し、速度とメモリを大幅に向上させつつ高い精度を維持する。非保守的直接モデルは、フォノンと特性ベンチマークで最先端の性能と同等かそれを超えることができる。

ABSTRACT

We introduce Orb-v3, the next generation of the Orb family of universal interatomic potentials. Models in this family expand the performance-speed-memory Pareto frontier, offering near SoTA performance across a range of evaluations with a >10x reduction in latency and > 8x reduction in memory. Our experiments systematically traverse this frontier, charting the trade-off induced by roto-equivariance, conservatism and graph sparsity. Contrary to recent literature, we find that non-equivariant, non-conservative architectures can accurately model physical properties, including those which require higher-order derivatives of the potential energy surface. This model release is guided by the principle that the most valuable foundation models for atomic simulation will excel on all fronts: accuracy, latency and system size scalability. The reward for doing so is a new era of computational chemistry driven by high-throughput and mesoscale all-atom simulations.

研究の動機と目的

  • 普遍的なMLIPが、精度と大規模・高スループットなシミュレーションを組み合わせる必要性を動機づける。
  • Orb-v3 ファミリーを性能・速度・メモリのパレートフロントに沿う、スケーラブルでほぼ最先端の解として提示する。
  • 設計選択(保守性、近傍制限、データセット)が精度とスケーラビリティにどう影響するかを調査する。
  • 回転不変性を改善し、実用的な分子動力学ワークフローの不確実性推定を提供する技術を紹介する。

提案手法

  • Orb-v3 を、Orb-v2 と同じ基盤アーキテクチャを持つモデル群として提案するが、速度とメモリ効率のためにコンパイル・スケールする。
  • 直接(非保守的)および保守的な力/ポテンシャルの定式化の両方を用いてパレートフロントを探索する。
  • 保守的モデルに回転同値性を誘導する勾配ベースの正則化である equigrad を組み込む。
  • 大規模データセット(OMat24 AIMD サブセット; 互換性のために mp a)で訓練し、保守モデルから直接モデルへの蒸留を適用して高次微分の精度を向上させる。
  • 効率的なグラフ構築、限られた近傍数、GPU 加速最近傍ルーチンを実装して高スループットを達成。
  • アクティブ学習とフィルタリングのために力の誤差を予測する固有の原子ごとの信頼度ヘッドを提供する。
Figure 1 : The Pareto frontier for a range of universal Machine Learning Interatomic Potentials. The $K_{SRME}$ metric assesses a model’s ability to predict thermal conductivity via the Wigner formulation of heat transport [ 31 ] and requires accurate geometry optimizations as well as second and thi
Figure 1 : The Pareto frontier for a range of universal Machine Learning Interatomic Potentials. The $K_{SRME}$ metric assesses a model’s ability to predict thermal conductivity via the Wigner formulation of heat transport [ 31 ] and requires accurate geometry optimizations as well as second and thi

実験結果

リサーチクエスチョン

  • RQ1非等変・非保守アーキテクチャは、速度とメモリ効率を大幅に向上させつつ、熱力学・フォノン関連の予測で競争力を持てるのか?
  • RQ2保守性、近傍制限、および訓練データセットは、普遍的なMLIPの精度とスケーラビリティにどう影響するのか?
  • RQ3Orb-v3 モデルにおける幾何最適化、高次微分精度、MD安定性のトレードオフは?
  • RQ4equigrad 正則化は、パフォーマンスを犠牲にすることなく回転不変性と下流の対称性ベースのワークフローを改善できるのか?

主な発見

モデルF1 ↑κ_SRME ↓ステップ/秒(1k 原子) ↑
eSEN-30M-OAM [ 40 ]0.9250.170
SevenNet-MF-ompa [ 29 ]0.9010.3173.5
GRACE-2L-OAM [ 23 ]0.8800.294
MACE-MPA-0 [ 21 ]0.8520.41221.2
DPA3-v2-OpenLAM [ 45 ]0.8900.687
MatterSim v1 5M [ 34 ]0.8620.57418.8
eqV2 M [ 14 ]0.9171.771OOM
ORB v2 [ 28 ]0.8801.73288.3
Orb-v3-direct-20-mpa0.8770.668216.5
Orb-v3-direct-inf-mpa0.8830.348125.0
Orb-v3-conservative-20-mpa0.9020.45741.2
Orb-v3-conservative-inf-mpa0.9060.21028.1
Orb-v3-direct-20-omat0.472216.5
Orb-v3-direct-inf-omat0.575125.0
Orb-v3-conservative-20-omat0.41341.2
Orb-v3-conservative-inf-omat0.21628.1
  • Orb-v3-direct-20-omat および Orb-v3-direct-inf-omat は、数百のフォワード実行/秒と大規模システムでサブ秒を実現する高い速度・メモリ利得を示す。
  • 非保守的な直接モデルは、フォノンや熱伝導タスクを含む複数のベンチマークで最先端と同等かそれ以上の性能を発揮できる。
  • Equigrad 正則化は、回転不変性と対称性ガイド付きワークフローの堅牢性を大幅に向上させる。
  • 保守的-inf-omat モデルは、複数の物理特性ベンチマークで最高の精度を達成しつつ、多くの競合他社よりも高速な実行時間を維持する。
  • Orb-v3 モデルは優れたスケーラビリティを示し、direct-20-omat は 100k 原子テストで 32.8 GB の GPU メモリを必要とし、0.5 秒未満で完了するなど、スループットの飛躍的な向上を示している。
  • 固有の原子ごとの信頼度推定は力の誤差と相関し、アクティブラーニングやデータ選定に役立つ。
Figure 2 : Speed + max GPU memory allocated on an NVIDIA H200 for the computation of energies, forces and stress. The batch size is fixed to 1, but we vary the number of atoms across the subplots. Relative times are computed with respect to the fastest model: orb-v3 Direct (20 neighbors) . Times inc
Figure 2 : Speed + max GPU memory allocated on an NVIDIA H200 for the computation of energies, forces and stress. The batch size is fixed to 1, but we vary the number of atoms across the subplots. Relative times are computed with respect to the fastest model: orb-v3 Direct (20 neighbors) . Times inc

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。